Dom pytania Yandex: typowe błędy. Yandex: typowe błędy Kaspersky Free Server zwrócił błąd 404

Yandex: typowe błędy. Yandex: typowe błędy Kaspersky Free Server zwrócił błąd 404

Strona 404 ma na celu poinformowanie użytkownika, że podany przez niego url (adres strony) nie istnieje.
Takie nieprawidłowe adresy URL można również nazwać „uszkodzonymi linkami”.
Wiele witryn tworzy swoje strony 404 dla wygody swoich użytkowników. Często są to piękne i ciekawe strony, które sprawiają, że użytkownik się uśmiecha, zamiast być rozczarowanym, że adres strony jest niepoprawny.
Podczas tworzenia strony 404 istnieje ważny składnik techniczny, który ma duży wpływ na ranking witryn w wyszukiwarkach, jeśli wszystko nie jest poprawnie skonfigurowane.

Jeśli zastanawia Cię stworzenie strony 404, musisz wziąć pod uwagę trzy punkty:
1) Przekieruj ze wszystkich błędnie wprowadzonych adresów URL na stronę 404 w .htaccess.
2) Poprawna odpowiedź serwera po przekierowaniu (kod http strony powinien wynosić 404, a nie 200).
3) Zamknięcie strony 404 z indeksowania w robots.txt

Od razu zauważam, że wszystkie powyższe są napisane dla stron pisanych samodzielnie, głównie w php. W przypadku wordpress są wtyczki do dostosowywania tego samego. Ale w tym artykule przyjrzymy się, jak wszystko wygląda w rzeczywistości. %)

Przekierowywanie (przekierowywanie) nieprawidłowych adresów URL na stronę 404

Pierwszą rzeczą, którą robisz, jest utworzenie samej strony 404, aby było gdzie wysłać osoby%%.
Adres URL przekierowania jest skonfigurowany w pliku .htaccess
Wystarczy wpisać linię:
Dokument błędu 404 http://mysite.com/404.php
Gdzie „mojawitryna.com” to Twoja domena, a http://mojawitryna.com/404.php to ścieżka do właściwej strony. Jeśli twoja strona jest w html, to linia będzie wyglądać tak:
Dokument błędu 404 http://mysite.com/404.html
Weryfikacja jest bardzo prosta. Po przesłaniu pliku .htaccess z powyższą linią na hosting, sprawdź, wpisując celowo nieistniejący adres URL (uszkodzony link), na przykład: http://mysite.com/$%$%
Jeśli nastąpiło przekierowanie do utworzonej strony, wszystko działa.
Tak więc kompletny plik .htaccess, w którym skonfigurowano TYLKO przekierowanie do 404, będzie wyglądał tak:
____________________________
Przepisz silnik włączony
Dokument błędu 404 http://mysite.com/404.html
____________________________

Poprawna odpowiedź serwera (kod http strony)

Bardzo ważne jest, aby podczas przekierowania wystąpiła poprawna odpowiedź serwera, a mianowicie 404 Not Found.
Należy to wyjaśnić osobno.

Każdy adres URL na żądanie otrzymuje status (kod http strony).
Dla wszystkich istniejących stron jest to: HTTP/1.1 200 OK
Dla stron przekierowanych: HTTP/1.1 Znaleziono 302
Jeśli strona nie istnieje, powinna to być HTTP/1.1 404 Not Found

Oznacza to, że każdy wprowadzony adres URL ma przypisany status, określony kod odpowiedzi serwera.
Możesz sprawdzić odpowiedź serwera na zasobie, takim jak bertal.ru lub SEARCH CONCOLE GOOGLE - Skanuj / Przeglądaj jako bot GOOGLE.
Jeśli nie masz przekierowania .htaccess na stronę 404, wtedy każdy nieistniejący adres URL wprowadzony przez użytkownika, jak również niedziałające linki, otrzymywały odpowiedź „HTTP/1.1 404 Not Found”

Po skonfigurowaniu przekierowania do strony 404 autora przez .htaccess, jak opisano powyżej, a następnie wprowadzeniu niedziałającego linku (nieprawidłowy adres URL, który oczywiście nie istnieje), takiego jak http://mysite.com/$%$% , odpowiedź serwera będzie:
- pierwszy znaleziony HTTP/1.1 302 (przekierowanie),
- następnie HTTP/1.1 200 OK (strona istnieje).

Sprawdź przez bertal.ru.
Czym to grozi? Oznacza to, że Google może wprowadzić wszystkie uszkodzone linki do swojej bazy danych (indeks) jako istniejące strony z treścią strony 404. W rzeczywistości zduplikowane strony. A to jest niezwykle szkodliwe dla optymalizacji pod kątem wyszukiwarek.

W takim przypadku musisz zrobić dwie rzeczy:
1) Skonfiguruj poprawną odpowiedź serwera na stronie 404.
2) Zamknij indeksowanie strony 404. Odbywa się to za pomocą pliku robots.txt

Skonfiguruj odpowiedź serwera HTTP/1.1 404 Not Found dla nieistniejących stron

Odpowiedź serwera jest konfigurowalna dzięki funkcje php na samej górze strony:

Napisz to na początku pliku 404.
W rezultacie powinniśmy otrzymać odpowiedź na zepsuty link:

Zamknij stronę 404 z indeksowania

Możesz zamknąć stronę z indeksowania w pliku rodots.txt. Uważaj na to narzędzie, ponieważ za pośrednictwem tego pliku Twoja witryna w rzeczywistości komunikuje się z robotami wyszukiwania!
Pełny tekst pliku rodots.txt, w którym indeksowanie stron 404 jest TYLKO zamknięte, wygląda następująco:
____________________________
Agent użytkownika: *
Uniemożliwić:
Nie zezwalaj: /404.php
____________________________

Uwagi do kodu: "/404.php" oznacza ścieżkę do strony. Jeśli w Twojej witrynie strona 404.php (lub odpowiednio 404.html) znajduje się w jakimś folderze, ścieżka będzie wyglądać tak:
/posiadacz/404.php
gdzie „posiadacz” to nazwa folderu.

W rzeczywistości chodzi o stronę 404. Sprawdź działanie strony, przekierowania niedziałających linków i odpowiedzi serwera.
Powtarzam: wszystko powyższe dotyczy witryn pisanych samodzielnie. Jeśli używasz wordpressa, możesz poszukać przyzwoitej wtyczki błędu 404.

Błąd 404 jest najbardziej rozpoznawalnym i powszechnym błędem dokumentu hipertekstowego. Informuje, że strona nie istnieje pod podanym adresem. W rzeczywistości mówimy o braku pliku html dla określonego dokumentu, więc witryna zwraca błąd.

Aby zająć się problemem bardziej szczegółowo, a także z szeregiem plików serwisowych, które posiada każdy zasób, należy przestudiować moment związany z hipertekstową prezentacją stron za pomocą język HTML(hipertekst Język znaczników- „Hypertext Markup Language”) oraz protokół HTTP, za pośrednictwem którego uzyskuje się dostęp. Pomimo tego, że trzeba rozumieć język programowania, forma jego prezentacji jest tak prosta, że każdy może ją zrozumieć.

Więcej filmów na naszym kanale - poznaj marketing internetowy z SEMANTICA

Strony hipertekstowe i ich funkcje

Internet narodził się w momencie, gdy angielski inżynier Timothy John Berners-Lee wymyślił hipertekstową formę reprezentacji. strony tekstowe w sieci i opisał zasadę dostępu do nich za pośrednictwem protokołu aplikacji HTTP. Zgodnie z ogólną ideą użytkownik ze swojego urządzenia, a mianowicie z przeglądarki, wykonuje żądanie sieciowe o konkretny zasób. W tym momencie na serwerze, do którego uzyskuje się dostęp, zostaje otwarta sesja. W odpowiedzi zwracana jest strona HTML.

Oczywiście w naszych czasach stosuje się bardziej złożone algorytmy dostępu i „podmiany” dużych stron, ale ogólna zasada pozostaje takie samo. Aby uzyskać dostęp do zasobu, potrzebujesz Nazwa domeny i adres IP. Tylko jeśli te kryteria są spełnione, a zasób jest sprawny, zostanie zwrócony błąd „404 nie znaleziono” dla brakującego dokumentu.

Jak wygląda domyślna strona 404

Witryna może, ale nie musi, mieć ozdobioną stronę błędu dostępu „Nie znaleziono http 404”. Użytkownik z niewielkim doświadczeniem jest zwykle dość zdenerwowany, gdy go otrzymuje i uważa, że to jego wina. W rzeczywistości wszystko jest znacznie prostsze, odpowiedź wynika z powyższego.

Kod błędu 404 w postaci oddzielnej strony zaprojektowanej w projekcie witryny jest zwracany tylko wtedy, gdy witryna zawiera plik 404.html. Zwykle znajduje się w katalogu głównym. W przeciwnym razie przeglądarka zgłosi ten błąd wraz z komunikatem o braku dostępu. I zwykle wygląda jak biała kartka z komunikatem o błędzie.

Przy tworzeniu stron internetowych z reguły wykorzystywane są systemy zarządzania treścią. Zawierają stronę 404 wskazującą na pliki funkcjonalne droga do niej. Zazwyczaj taka strona zawiera komunikat o nieistniejącym adresie oraz link, do którego należy przejść strona główna strona. Szablon strony 404 można zmienić według własnych upodobań, ponieważ jest to strona w witrynie, z której można korzystać w dowolny sposób.

Aby przerobić szablon, będziesz potrzebować znajomości języka HTML, aby oznaczyć plik. Należy pamiętać, że w indywidualne przypadki plik strony może mieć inną nazwę - err404. html, 404.php. Odmienność od standardu najczęściej wiąże się z szerszą funkcjonalnością, a także cechami systemu. Na przykład w WordPressie dokument można znaleźć w katalogu 404.php. W pasku adresu pojawi się komunikat „nie znaleziono strony błędu 404”: domena.ru/404/.

Dostosowywanie standardowej strony 404 do swoich celów

Aby poprawić użyteczność (akceptowalność dla użytkowników) witryny, konieczne jest oczywiście stworzenie strony, która przyciągnie odwiedzającego do Twojej witryny i pomoże mu kontynuować przeglądanie. O czym należy pamiętać podczas pisania kodu:

Znaczna część odwiedzających, którzy napotykają nieistniejące strony, przechodzi do witryny z wyszukiwarek lub za pośrednictwem linków na forach, stronach internetowych i w sieciach społecznościowych, czyli skąd można znaleźć stare linki do dawno nieistniejących stron.
Użytkownicy nie szukają Twojej witryny, ale informacji interesujących według słowa kluczowego, to znaczy w przypadku braku pożądanego, odwiedzający opuszcza witrynę i rzadko ją przegląda.

Oznacza to, że musisz zrozumieć, że zatrzymanie takich gości nie będzie takie łatwe, ale jest to możliwe!

Weź standardowy szablon dostępny w Internecie lub stwórz własny, uwzględniając powyższe cechy:

Krótko wyjaśnij osobie, co się stało i dlaczego nie widzi tego, czego szukała. Daj mu opcje dalsze działanie aby pomóc Ci znaleźć to, czego szukasz.
Wyświetlaj ciąg wyszukiwania na stronie 404, aby odwiedzający mógł natychmiast znaleźć to, czego chce.
Pamiętaj, aby wyświetlić tutaj menu swojej witryny, za pomocą którego osoba może zrozumieć, dokąd się udać.
Upewnij się, że strona przyciąga użytkownika, a on chce znaleźć informacje o Twoim zasobie. Stosuj kolorowe i ciekawe rozwiązania tekstowo-wizualne.

Aby strona błędu 404 serwera była atrakcyjna dla użytkownika, wystarczy wywołać u niego uśmiech lub zainteresowanie. Dlatego postaraj się popracować nad oryginalnością pomysłu na taką sekcję swojego zasobu.

Edycja strony 404

Możesz edytować plik bezpośrednio z systemu zarządzania treścią, w tym celu musisz dodać żądane znaczniki i obrazy.
Tworząc ją, kieruj się tym, aby informacje otwierały się szybko i bez opóźnień. Strona powinna być „lekka” (zajmować niewiele miejsca), użyteczna i oferować alternatywy dla znalezienia nieistniejącego dokumentu.

przejście do głównego;
lista stron z ocenami witryny;
przejście do mapy zasobów;
przycisk informujący administrację o „uszkodzonym” linku w określonym źródle.

W przeciwnym razie najlepszy asystent nie zabraknie fantazji, korporacyjnych standardów i oryginalnego pomysłu projektanta.

Wniosek

Nie znaleziono strony 404 to plik usługi, który można modyfikować i uzupełniać, aby przyciągnąć więcej odwiedzających do witryny. Ten plik jest wymagany, ponieważ w przeciwnym razie przeglądarka wyświetli komunikat o błędzie, po którym szansa na zwabienie osoby do Ciebie będzie zerowa. Spróbuj wypełnić go kolorowymi obrazami, a nawet lekkim humorem.

Wszystko wskazane błędy nie są krytyczne dla Yandex, i tak zindeksuje strony. Mogą jednak utrudnić potencjalnym odwiedzającym Twoją stronę znalezienie jej wśród milionów innych.

Błąd 404 nie jest prawidłowo obsługiwany nie znaleziono"
Sprawdź, co robią Twoje skrypty w przypadku błędów. Jeśli skrypt zgłosi błąd i zwróci normalny kod zakończenia 200, wiadomość zostanie zindeksowana. Jeśli Twój skrypt zwraca kod HTTP 404, ten komunikat o błędzie nie zostanie zindeksowany.
Dotyczy to również zwykłych dokumentów. Niektóre serwery są skonfigurowane do wysyłania normalnego kodu wyjścia 200 w przypadku błędu, co uniemożliwia robotowi usunięcie linku do strony w bazie danych. Każdy nowoczesny serwer WWW pozwala modyfikować standardowe komunikaty o błędach i wysyłać je z poprawnym kodem błędu.

Spam, czyli nie oszukiwać użytkownika
Spam to nagłówki i słowa kluczowe, wzbogacone dużą liczbą słów z najpopularniejszych zapytań, dużymi tablicami tekstu „zapisanego” na stronie kolorem tła lub bardzo małym drukiem, a także wieloma innymi sztuczkami, które mają na celu przyciągnięcie użytkowników do ich stron przez oszustwo.
Nie powinny być używane z dwóch powodów. Po pierwsze, nie dodaje chwały twórcy strony i naturalnie denerwuje użytkowników. Po drugie, Yandex śledzi takie nienormalne zmiany i zmniejsza miejsce dokumentu na stronie wyników. Ponadto spam zwiększa rozmiar dokumentu, a co za tym idzie zmniejsza kontrast zawartych w nim słów, co również wpływa na miejsce dokumentu na liście znalezionych. W przypadku złośliwego wykorzystania spamu administracja Yandex może wykluczyć takie strony i witryny z bazy danych.
Strony z czasem przekierowania na inne strony (przekierowaniem) równym zero również są wyłączone z indeksowania.

Błędne daty
Wyszukiwanie i sortowanie według daty działa na Yandex, ale w 20% przypadków serwery nie podają prawidłowej daty modyfikacji pliku. Skonfiguruj serwer poprawnie. Nie pozbawiaj użytkownika dodatkowych informacji i korzystaj z możliwości poprawnego wyświetlania swoich stron podczas wyszukiwania według dat.

Indeksowanie identycznych dokumentów w różnych kodowaniach
Wiele zasobów jest marnowanych podczas indeksowania tych samych dokumentów wydawanych przez serwery internetowe w różnych kodowaniach. Jednocześnie rosyjskie wyszukiwarki nadal przechowują w swoich bazach dokumenty w jednym z kodowań. Zaleca się wyłączenie wszystkich kodowań do indeksowania, z wyjątkiem jednego. Jeśli kodowania są wydawane przez porty serwerów, konieczne jest wydawanie różnych robots.txt na różnych portach (serwerach). Oznacza to, że we wszystkich portach/serwerach, poza głównym, należy to zapisać

Jeśli kodowania wydawane są np. przez katalogi, to trzeba zrobić jeden plik robots.txt, w którym będzie on zapisany

Nie zezwalaj: /alt
nie zezwalaj: /mac
nie zezwalaj: /koi

Indeksowanie tej samej witryny na różnych serwerach
Ten problem występuje, gdy serwer ma serwery lustrzane i/lub kodowania są poprzedzone w nazwie hosta, np. dla hosta www.chto-to.ru:
win.chto-to.ru, koi-www.chto-to.ru, wwwmac.chto-to.ru itp.
Robot nie jest w stanie samodzielnie określić „głównego” adresu. Jedyne, co może (i robi) zrobić, to określić, że dwa dokumenty pasują do kodowania i indeksować tylko jeden z nich.
Może się więc okazać, że różne części Twojej witryny są indeksowane na różnych hostach. Jeśli chcesz, aby cała witryna była indeksowana pod jednym adresem (hostem), wyłącz indeksowanie reszty, ustawiając odpowiedni plik robots.txt. Po pewnym czasie (w trakcie indeksowania robota) wszystkie zindeksowane dokumenty będą odnosić się do tego hosta.

Tylko o kompleksie. Programy. Żelazo. Internet. Okna