A 404-es oldal célja, hogy tájékoztassa a felhasználót arról, hogy az általa megadott url (oldal címe) nem létezik.
Az ilyen helytelen URL-eket "szakadt hivatkozásoknak" is nevezhetjük.
Sok webhely a felhasználók kényelmét szolgálja 404 oldalával. Ezek gyakran gyönyörű és érdekes oldalak, amelyek mosolyra késztetik a felhasználót, ahelyett, hogy csalódnának az oldal címének helytelensége miatt.
A 404-es oldal létrehozásakor van egy fontos technikai összetevő, amely nagyban befolyásolja a webhelyek rangsorolását a keresőkben, ha minden nincs megfelelően beállítva.

Ha értetlenül áll a 404-es oldal létrehozása előtt, akkor három pontot kell figyelembe vennie:
1) Átirányítás az összes helytelenül megadott URL-ről a .htaccess 404-es oldalára.
2) Helyes szerver válasz az átirányítás után (az oldal http kódja 404 legyen, ne 200).
3) Zárja be a 404-es oldalt az indexelés elől a robots.txt fájlban

Azonnal megjegyzem, hogy a fentiek mindegyike saját maga által írt oldalakra íródott, főleg php-ban. A Wordpress esetében vannak beépülő modulok, amelyek testreszabhatják ugyanezt. De ebben a cikkben megnézzük, hogyan néz ki minden a valóságban. %)

Helytelen URL-ek átirányítása (átirányítása) 404-es oldalra

Az első dolog, hogy létrehozza magát a 404-es oldalt, hogy legyen hova küldeni az embereket%%.
Az átirányítási URL a .htaccess fájlban van beállítva
Csak írja be a sort:
ErrorDocument 404 http://mysite.com/404.php
Ahol a "mysite.com" az Ön domainje, a http://mysite.com/404.php pedig a tényleges oldal elérési útja. Ha webhelye html formátumú, akkor a sor így fog kinézni:
ErrorDocument 404 http://mysite.com/404.html
Az ellenőrzés nagyon egyszerű. Miután feltöltötte a fenti sort tartalmazó .htaccess fájlt a tárhelyre, ellenőrizze egy szándékosan nem létező url (hibás hivatkozás) megadásával, például: http://mysite.com/$%$%
Ha megtörtént az átirányítás a létrehozott oldalra, akkor minden működik.
Tehát a teljes .htaccess fájl, ahol CSAK 404-es átirányítás van beállítva, így fog kinézni:
____________________________
Motor újraírása bekapcsolva
ErrorDocument 404 http://mysite.com/404.html
____________________________

Helyes szerver válasz (oldal http kód)

Nagyon fontos, hogy az átirányítás során helyes kiszolgálói válasz legyen, nevezetesen: 404 Nem található.
Ezt külön meg kell magyarázni.

Kérésre minden url állapotot kap (az oldal http kódja).
Az összes létező oldal esetében ez: HTTP/1.1 200 OK
Átirányított oldalak esetén: HTTP/1.1 302 Talált
Ha az oldal nem létezik, akkor HTTP/1.1 404 Nem található

Vagyis bármilyen URL-t adunk meg, hozzá van rendelve egy állapot, egy bizonyos szerver válaszkód.
Ellenőrizheti a szerver válaszát egy olyan erőforráson, mint a bertal.ru vagy a SEARCH CONCOLE GOOGLE – Keresés/megtekintés GOOGLE robotként.
Ha nem volt .htaccess átirányítása egy 404-es oldalra, akkor a felhasználó által beírt nem létező URL-ek, valamint a hibás hivatkozások „HTTP/1.1 404 nem található” választ kaptak.

Miután a fent leírtak szerint beállított egy átirányítást a szerző 404-es oldalára a .htaccess segítségével, majd beírt egy hibás hivatkozást (érvénytelen URL, amely nyilvánvalóan nem létezik), például http://mysite.com/$%$% , a a szerver válasza a következő lesz:
- az első HTTP/1.1 302 található (átirányítás),
- ezt követi a HTTP/1.1 200 OK (az oldal létezik).

Ellenőrizze a bertal.ru oldalon.
Mivel fenyeget? Ez azt jelenti, hogy a Google az összes hibás hivatkozást a 404-es oldal tartalmával már létező oldalként beviheti adatbázisába (indexbe), sőt, ismétlődő oldalakként. Ez pedig hihetetlenül káros a keresőoptimalizálás szempontjából.

Ebben az esetben két dolgot kell tennie:
1) Állítsa be a megfelelő szerverválaszt a 404-es oldalon.
2) Zárja be a 404-es oldalt az indexelésből. Ez a robots.txt fájlon keresztül történik

HTTP/1.1 404 Nem található szerverválasz konfigurálása nem létező oldalakhoz

A szerver válasza konfigurálható, köszönhetően php függvények az oldal legtetején:

Írd a 404-es fájl elejére.
Ennek eredményeként választ kell kapnunk egy hibás hivatkozásra:

404 oldal bezárása az indexelésből

Az oldalt bezárhatja az indexelésből a rodots.txt fájlban. Legyen óvatos ezzel az eszközzel, mert ezen a fájlon keresztül webhelye valójában keresőrobotokkal kommunikál!
A rodots.txt fájl teljes szövege, ahol a 404-es oldal indexelése CSAK le van zárva, így néz ki:
____________________________
User-agent: *
Letiltás:
Disallow: /404.php
____________________________

Megjegyzések a kódhoz: "/404.php" az oldal elérési útját jelenti. Ha webhelyén a 404.php (vagy 404.html) oldal valamelyik mappában található, akkor az elérési út így fog kinézni:
/holder/404.php
ahol a "tartó" a mappa neve.

Valójában ez a 404-es oldalról szól. Ellenőrizze az oldal működését, a hibás hivatkozások átirányításait és a szerver válaszait.
Ismétlem: A fentiek mindegyike saját írású oldalakra vonatkozik. Ha WordPress-t használ, kereshet egy tisztességes 404-es hibabővítményt.

A 404-es hiba a leginkább felismerhető és leggyakoribb hiperszöveges dokumentumhiba. Azt jelenti, hogy az oldal nem létezik a megadott címen. Valójában a megadott dokumentumhoz tartozó html fájl hiányáról beszélünk, így a webhely hibát ad vissza.

A probléma részletesebb kezeléséhez, valamint az egyes erőforrásokhoz tartozó számos szolgáltatásfájlhoz meg kell tanulmányoznia az oldalak hiperszöveges megjelenítéséhez kapcsolódó pillanatot. HTML nyelv(Hipertext Jelölőnyelv- "Hypertext Markup Language"), és a HTTP-protokoll, amelyen keresztül a hozzáférés történik. Annak ellenére, hogy érteni kell a programozási nyelvet, a bemutatási formája olyan egyszerű, hogy bárki megértheti.

Még több videó a csatornánkon – tanulja meg az internetes marketinget a SEMANTICA segítségével

Hipertext oldalak és jellemzőik

Az Internet abban a pillanatban született, amikor az angol mérnök, Timothy John Berners-Lee kitalálta a hipertext ábrázolásmódot. szöveges oldalak a hálózaton, és leírta a hozzájuk való hozzáférés elvét a HTTP alkalmazási protokollon keresztül. Az általános elképzelés szerint a felhasználó az eszközéről, nevezetesen a böngészőből, hálózati kérést ad egy adott erőforráshoz. Ezen a ponton megnyílik egy munkamenet az éppen elért kiszolgálón. A rendszer válaszként egy HTML oldalt ad vissza.

Természetesen korunkban bonyolultabb algoritmusokat használnak a nagy oldalak elérésére és „cseréjére”, de általános elv ugyanaz marad. Az erőforrás eléréséhez szüksége van Domain névés IP címet. Csak ha ezek a feltételek teljesülnek, és az erőforrás működőképes, akkor a „404-es nem található” hibaüzenet jelenik meg a hiányzó dokumentumra vonatkozóan.

Hogyan néz ki az alapértelmezett 404-es oldal

Lehet, hogy egy webhelyen van egy díszített „http 404 nem található” hozzáférési hibaoldal, vagy nem. A kevés tapasztalattal rendelkező felhasználó általában nagyon ideges, amikor megkapja, és azt hiszi, hogy ez az ő hibája. Valójában minden sokkal egyszerűbb, a válasz a fentiekből következik.

A 404-es hibakód az oldaltervben kialakított külön oldal formájában csak akkor kerül visszaadásra, ha az oldal rendelkezik 404.html fájllal. Általában a gyökérkönyvtárban található. Ellenkező esetben a böngésző ezt a hibát a hozzáférés hiányáról szóló üzenettel együtt jelzi. És általában úgy néz ki, mint egy fehér lap hibaüzenettel.

A weboldalak fejlesztése során általában tartalomkezelő rendszereket használnak. Egy 404-es oldalt tartalmaznak, amely azt jelzi, hogy funkcionális fájlok utat neki. Az ilyen oldalak általában egy nem létező címről szóló üzenetet és egy hivatkozást tartalmaznak kezdőlap webhely. A 404-es oldal sablonja tetszés szerint módosítható, mivel ez egy olyan oldal a webhelyén, amelyet tetszés szerint használhat.

A sablon újbóli elkészítéséhez HTML ismerete szükséges a fájl megjelöléséhez. Felhívjuk figyelmét, hogy a egyedi esetek az oldalfájlnak más neve is lehet - err404. html, 404.php. A szabványtól való eltérés leggyakrabban a szélesebb körű funkcionalitáshoz, valamint a rendszer jellemzőihez kapcsolódik. Például a WordPressben a dokumentum a 404.php könyvtárban található. A címsorban a "404-es hiba oldal nem található" valami ilyesmi jelenik meg: domain.ru/404/.

Szabványos 404-es oldal hozzáigazítása az Ön céljaihoz

Az oldal használhatóságának (felhasználói számára elfogadhatóságának) javításához természetesen olyan oldalt kell készíteni, amely vonzza a látogatót az oldalára, és segíti a böngészés folytatását. Amit szem előtt kell tartani a kód írásakor:

  • A nem létező oldalakkal találkozó látogatók jelentős része keresőkből vagy fórumokon, weboldalakon, ill. a közösségi hálózatokon, vagyis ahonnan a rég nem létező oldalakra mutató régi linkek találhatók.
  • A felhasználók nem az Ön oldalát keresik, hanem kulcsszó szerint érdeklő információkat keresnek, vagyis a kívánt hiányában a látogató elhagyja az oldalt és ritkán nézi meg.

Vagyis meg kell értenie, hogy nem lesz olyan egyszerű ilyen látogatókat tartani, de lehetséges!

Vegyünk egy szabványos sablont, amely elérhető az interneten, vagy készítse el saját magát, figyelembe véve a fenti jellemzőket:

  1. Röviden magyarázza el a személynek, hogy mi történt, és miért nem látja, amit keresett. Adj neki lehetőségeket további intézkedés hogy segítsen megtalálni, amit keres.
  2. Jelenítsen meg egy keresési karakterláncot a 404-es oldalon, hogy a látogató azonnal megtalálja, amit keres.
  3. Ügyeljen arra, hogy itt jelenítse meg webhelyének menüjét, amelynek segítségével az ember megértheti, hová kell mennie.
  4. Győződjön meg arról, hogy az oldal vonzza a felhasználót, és szeretne információkat találni az Ön erőforrásáról. Használjon színes és érdekes szöveges-vizuális megoldásokat.

Ahhoz, hogy a 404-es szerverhiba oldal vonzó legyen a felhasználó számára, elég mosolyt vagy érdeklődést kelteni benne. Ezért próbáljon meg dolgozni az ötlet eredetiségén az erőforrás egy ilyen részében.

A 404-es oldal szerkesztése

A fájlt közvetlenül a tartalomkezelő rendszerből szerkesztheti, ehhez hozzá kell adnia a kívánt jelölést és képeket.
Létrehozásakor ügyeljen arra a tényre, hogy az információnak gyorsan és késedelem nélkül meg kell nyílnia. Az oldal legyen "könnyű" (kevés helyet foglaljon el), hasznos, és kínáljon alternatívákat egy nem létező dokumentum megtalálására.

  • átmenet a főbe;
  • a webhely értékelő oldalainak listája;
  • áttérés az erőforrástérképre;
  • gomb, amely tájékoztatja az adminisztrációt egy adott forrás "elszakadt" hivatkozásáról.

Másképp a legjobb asszisztens lesz fantázia, vállalati szabványok és a tervező eredeti ötlete.

Következtetés

A 404 nem található oldal egy szolgáltatásfájl, amely módosítható és kiegészíthető, hogy több látogatót vonzzon az oldalra. Ez a fájl szükséges, mert ellenkező esetben a böngésző hibaüzenetet jelenít meg, amely után nulla az esélye, hogy magához csaljon egy embert. Próbáld meg színes képekkel, sőt könnyed humorral megtölteni.

Összes jelzett hibákat nem kritikusak a Yandex számára, úgyis indexeli az oldalakat. De megnehezíthetik az oldal potenciális látogatói számára, hogy megtalálják azt több millió másik között.

A 404-es hibát nem kezelik megfelelően nem található"
Ellenőrizze, mit csinálnak a szkriptek hiba esetén. Ha a szkript hibát jelez, és normál 200-as kilépési kódot ad vissza, akkor az üzenet indexelve lesz. Ha a szkript 404-es HTTP-kódot ad vissza, akkor ez a hibaüzenet nem lesz indexelve.
Ez vonatkozik a normál dokumentumokra is. Egyes szerverek úgy vannak beállítva, hogy hiba esetén normál 200-as kilépési kódot küldjenek, ami megakadályozza, hogy a robot törölje az oldalra mutató hivatkozást az adatbázisban. Bármely modern webszerver lehetővé teszi a szabványos hibaüzenetek módosítását és visszaküldését a megfelelő hibakóddal.

Spam, vagy ne tévessze meg a felhasználót
A spam fejlécek és kulcsszavakat, a legnépszerűbb lekérdezésekből származó nagyszámú szóval ízesítve, az oldalra háttérszínnel vagy nagyon kis betűtípussal "írt" nagy szövegtömbökkel, valamint sok más trükkel, amellyel megtévesztéssel csalogatják oldalukra a felhasználókat.
Két okból nem szabad használni őket. Először is, nem ad dicsőséget az oldal készítőjének, és természetesen bosszantja a felhasználókat. Másodszor, a Yandex követi az ilyen abnormális változásokat, és csökkenti a dokumentum helyét az eredményoldalon. Ezenkívül a spam növeli a dokumentum méretét, és ennek következtében csökkenti a benne lévő szavak kontrasztját, ami szintén befolyásolja a dokumentum helyét a találtak listáján. Spam rosszindulatú használata esetén a Yandex adminisztrációja kizárhatja az ilyen oldalakat és webhelyeket az adatbázisból.
Azok az oldalak, amelyek más oldalakra való átirányítási ideje (átirányítás) nulla, szintén ki vannak zárva az indexelésből.

Rossz dátumok
A dátum szerinti keresés és rendezés működik a Yandexen, de az esetek 20% -ában a szerverek nem adják meg a megfelelő fájlmódosítási dátumot. Állítsa be megfelelően a szervert. Ne fossza meg a felhasználót további információktól, és használja ki az alkalmat, hogy helyesen jelenítse meg oldalait, amikor dátum szerint keres.

Azonos dokumentumok indexelése különböző kódolásokban
Sok erőforrás megy kárba, amikor ugyanazokat a webszerverek által kiadott dokumentumokat különböző kódolásban indexeli. Ugyanakkor az orosz keresőmotorok továbbra is az adatbázisaik egyik kódolásában tárolják a dokumentumokat. Javasoljuk, hogy minden kódolást letiltson az indexeléshez, egy kivételével. Ha a kódolásokat szerverportok adják ki, akkor a különböző portokon (szervereken) különböző robots.txt fájlokat kell kiadni. Ez azt jelenti, hogy a fő kivételével minden portban / szerverben meg kell írni

Ha a kódolásokat például könyvtárak adják ki, akkor létre kell hoznia egy robots.txt fájlt, amelybe be lesz írva

Disallow: /alt
disallow: /mac
disallow: /koi

Ugyanazon webhely indexelése különböző szervereken
Ez a probléma akkor fordul elő, ha a szerver tükrökkel rendelkezik, és/vagy a kódolás előtagja van a gazdagépnévben, például a gazdagéphez www.chto-to.ru:
win.chto-to.ru, koi-www.chto-to.ru, wwwmac.chto-to.ru stb.
A robot nem képes önállóan meghatározni a „fő” címet. Az egyetlen dolog, amit megtehet (és tesz), az az, hogy megállapítja, hogy két dokumentum megegyezik-e a kódolással, és csak az egyiket indexeli.
Így kiderülhet, hogy webhelyének különböző részei különböző gazdagépeken vannak indexelve. Ha azt szeretné, hogy a teljes webhely egy címen (gazdagépen) legyen indexelve, tiltsa le a többi oldal indexelését a megfelelő robots.txt fájl beállításával. Egy idő után (a robot feltérképezése közben) minden indexelt dokumentum erre a gazdagépre fog hivatkozni.