A leggyakoribb indexelési problémák és megoldásuk

Az indexelési problémák érvényteleníthetik a keresőoptimalizálási erőfeszítéseit – lehet, hogy egy oldal tökéletesen optimalizált és nagyszerű felhasználói élményt nyújt, de semmit sem ér, ha a Google nem látja. Az indexeletlen oldalak nem kerülnek be a SERP-be, és nem hoznak forgalmat és konverziókat.

Ellenkező esetben, ha a Google időnként olyan oldalt lát és indexel, amelyet nem indexeltek, akkor fennáll a személyes adatok kiszivárgásának, a rossz minőségű tartalom miatti Google-büntetésnek és egyéb, aligha kielégítő következményeknek a kockázata.

Ebben az útmutatóban megosztom, hogy milyen típusú indexelési problémák léteznek, és hogyan lehet ezeket kijavítani, hogy ne okozzanak hirtelen rangsorolást. Először azonban nézzük meg, hogyan ellenőrizheti, hogy van-e indexelési probléma a webhelyén.

Hogyan lehet észrevenni az indexelési problémákat?

A Google Search Console alapszintű, de még mindig elegendő megértést adhat webhelyének indexelési problémáiról. Ezek megtekintéséhez tekintse meg az Index > Oldalak jelentést.

A Google Search Console index-oldalak jelentése

Azok az oldalak, amelyeket bármilyen okból nem indexeltek, egy, a Nem indexelt szakasz alá kerülnek. Azok az oldalak, amelyek indexelve vannak, de még mindig problémákkal küzdenek, és figyelmet igényelnek, az oldal alján, az Oldal megjelenésének javítása részben találhatók:

Az oldal megjelenésének javítása szakasz

A probléma további kivizsgálásához kattintson a hibasorra, majd az ellenőrizni kívánt URL melletti lencse ikonra:

kattintson az objektív ikonra a probléma felfedezéséhez

A Search Console megmutatja a részleteket, és segít azonosítani, mi a probléma az oldallal.

indexelési probléma részletei

Ha mélyebbre kell ásnia magát, és javaslatokat kell kapnia arra vonatkozóan, hogy mit kell javítania ahhoz, hogy az oldal hangja legyen, tekintse meg a WebSite Auditor Indexelés és feltérképezés szakaszát:

A Webhely auditorának indexelése és feltérképezhetősége szakasz
A WebSite Auditor letöltése

Az eszköz összegyűjti az összes hibás URL-t, így nem kell manuálisan ellenőriznie minden oldalt külön-külön.

Nos, most elkészültünk a „hol találok” résszel. Most itt az ideje, hogy megvizsgálja, milyen típusú indexelési problémákat találhat, és hogyan javíthatja ki azokat, hogy webhelye továbbra is feltérképezhető és indexelhető legyen.

Megjegyzés: A továbbiakban ebben az útmutatóban természetesnek tartom, hogy az indexelési problémák által érintett összes URL-t indexelni kell. Ha egy URL-t nem kell indexelni, blokkolja azt a noindex címkével, vagy korlátozza a hozzáférést a robots.txt utasítások segítségével. Ezenkívül ne felejtse el eltávolítani ezeket az oldalakat a sitemap-ből. Ne tegyen semmit, ha valójában nincs indexelve.

1. Nem található (404)

A nem található (404) vagy a hibás URL valószínűleg az egyik leggyakoribb indexelési probléma. Egy oldalnak számos okból lehet 404-es állapotkódja. Tegyük fel, hogy törölte az URL-t, de nem távolította el az oldalt a webhelytérképről, hibásan írta be az URL-t stb.

Ahogy a Google mondja, a 404-esek önmagukban nem rontják a webhely teljesítményét mindaddig, amíg el nem küldik ezeket az URL-eket (vagyis azokat, amelyek indexelését kifejezetten kérte a Google-tól).

Ha 404-es URL-eket lát az indexelési jelentésekben, a következő lehetőségek közül választhat, hogyan lehet kijavítani őket, ha nem volt szándékuk:

  • Frissítse webhelytérképét, és ellenőrizze, hogy az érintett URL helyesen van-e megírva.
  • Ha az oldal új címre költözött, akkor állítson be egy 301-es átirányítást.
  • Ha az oldalt csere vagy alternatíva nélkül törölték, akkor tartsa meg 404-esként, de távolítsa el a webhelytérképről. Így a Google nem próbálja megtalálni, és nem pazarolja a feltérképezési költségkeretet.
  • Ha meg kell tartania a 404-et, akkor hozzon létre egy egyéni, felhasználóbarát 404-es oldalt – hozzáadhat néhány hasznos linket, amelyek segítségével a felhasználók az oldal bezárása helyett a webhelyen maradhatnak. Ne feledje, hogy a 404-es oldal továbbra is 404-es, ezért a Google-nak nem szabad indexelnie, bármilyen szép is.

Vegye figyelembe, hogy a GSC nem különbözteti meg a 404-et (nem található) a 410-estől (eltűnt), és a 404-es jelentés alá sorolja őket. Ezek korábban különböző típusú válaszkódok voltak: a 404 azt jelentette, hogy „nem található, de később megtalálható”, míg a 410-es a „nem található, és nem lesz olyan, amilyennek végleg elment” volt.

Ami ma illeti, a Google azt mondja, hogy a 404-et és a 410-et is ugyanúgy kezelik, így valószínűleg nem kell aggódnia, ha a 404-es jelentésben talál egy 410-es oldalt. Az egyetlen dolog, amit javaslok, hogy állítson be egyéni 404-es oldalt az üres 410-es oldal helyett, hogy megtakarítsa a forgalmat, és megakadályozza, hogy a felhasználók visszaugráljanak webhelyéről.

Sok keresőoptimalizálónak és webhelytulajdonosnak megvan a szokása, hogy a 404-eseket a kezdőlapra irányítja, de az igazság az, hogy ez nem a legjobb gyakorlat. Ez zavaró a Google számára, és puha 404-es problémákat eredményez. Nos, nézzük mik is ezek a puha 404-esek.

2. Puha 404

A lágy 404-es problémák akkor fordulnak elő, ha egy oldal 200-as OK-választ kap, de a Google nem találja meg a tartalmát, és 404-esnek tekinti. A lágy 404-es problémák számos okból előfordulhatnak, és előfordulhat, hogy némelyik nem is Öntől függ, például hibák a felhasználók böngészőjében. Íme néhány további ok:

  • Hiányzó szerveroldali include fájl

  • Megszakadt a kapcsolat az adatbázissal

  • Egy üres belső keresési eredményoldal

  • Töltetlen vagy más módon hiányzó JavaScript-fájl

  • Túl kevés a tartalom

  • Oldal álcázása

Ezeket a problémákat valójában nem olyan nehéz megoldani. Íme néhány gyakori forgatókönyv:

  • Ha a tartalom elköltözött, és az oldal valójában 200 OK, de üres, akkor állítson be egy 301-es átirányítást az új címre;

  • Ha a törölt tartalomnak nincs alternatívája, jelölje meg 404-esként, és távolítsa el a webhelytérképről;

  • Ha az oldalnak léteznie kell, akkor adjon hozzá némi tartalmat, és ellenőrizze, hogy minden szkript renderelve és megfelelően jelenik-e meg (nem blokkolja a robots.txt, a böngészők támogatják stb.);

  • Ha a hiba azért történik, mert a szerver leállt, amikor a Googlebot megpróbálja lekérni az oldalt, ellenőrizze, hogy a szerver megfelelően működik-e. Ha igen, kérje az oldal újraindexelését.

3. Jogosulatlan kérés miatt letiltva (401)

401-es hiba akkor fordul elő, amikor a Googlebot olyan oldalt próbál elérni, amelyhez engedély szükséges, és a szervere letiltja a Googlebotot ebben.

Ha szeretné indexelni az oldalt, adja meg a Googlebotnak a megfelelő engedélyt, vagy távolítsa el az engedélyezési kérelmet.

4. Letiltva, mert a hozzáférés tiltott (403)

Ez a fajta hiba akkor fordul elő, ha a felhasználói ügynök megadta az oldalra való belépéshez szükséges hitelesítési adatokat (bejelentkezés, jelszó), de nem kapott hozzáférést ehhez. A Googlebot azonban soha nem ad hitelesítési adatokat, így a szerver 403-at ad vissza a kívánt oldal helyett.

Ha egy oldalt tévedésből blokkoltak, és valóban indexelnie kell, engedélyezze a hozzáférést a be nem jelentkezett felhasználóknak, vagy kifejezetten engedélyezze a Googlebot számára, hogy belépjen az oldalra, hogy elolvassa és indexelje azt.

5. Elküldött URL „noindex” jelzéssel

Amint az a névből is kiderül, ez a hiba akkor fordul elő, ha kifejezetten kéri a Google-t, hogy indexeljen egy oldalt (azaz adja hozzá a webhelytérképhez vagy manuálisan kéri indexelést), de az oldal egy noindex címkével rendelkezik.

A javítás meglehetősen egyszerű – távolítsa el a noindex címkét, hogy a Google hozzáférhessen az oldalhoz.

6. A robots.txt által letiltott URL

Ha letilt egy oldalt a robots.txt segítségével, akkor a Google nem fogja feltérképezni. Távolítsa el a korlátozásokat az oldal indexeléséhez.

Megjegyzés: A Robots.txt nem garantálja, hogy az oldal nem lesz indexelve. Ezért a Google Search Console néha ehhez hasonlót jeleníthet meg:

indexelve, bár a robots.txt blokkolja

Az ehhez hasonló problémák több problémát okozhatnak, mint az indexeletlen oldalak, mivel a Google hozzáférhet és felfedheti azokat az információkat, amelyeknek soha nem volt szándékuk, hogy megjelenjenek a SERP-ekben (például kosarak, személyes adatok stb.).

Ha ilyen problémával találkozik, döntse el, hogy szüksége van-e az oldal indexelésére vagy sem. Ha igen, távolítsa el az URL-t a robots.txt fájlból. Ha nem, távolítsa el a robots.txt fájlból is, de alkalmazza a noindex címkét, vagy korlátozza a hozzáférést a nem jogosult felhasználók számára. Ha új korlátozásokat alkalmaz, megkérheti a Google-t, hogy távolítsa el az oldalt az indexből a GSC-n keresztül ( Index > Eltávolítások > Új kérelem).

7. Tartalom nélkül indexelve

Ez egy másik típusú probléma, amely rosszabbul ronthatja webhelye teljesítményét, mint az indexeletlen oldalak. A Google nem részesíti előnyben az üres oldalakat, és valószínűleg rontja a pozícióit, mivel az üres oldalak a spam jellegű webhelyek és a rossz minőségű tartalom jelei.

Ha azt észleli, hogy egyes oldalai tartalomállapot nélkül indexeltek, manuálisan ellenőrizze az URL-t, hogy megtudja az okot. Például:

  • Lehet, hogy az oldal túl kevés tartalommal rendelkezik;

  • Előfordulhat, hogy az oldal megjelenítést blokkoló tartalommal rendelkezik, amely nem töltődik be megfelelően;

  • A tartalom álcázott.

A látottaktól függően tegyen intézkedéseket.

Például, ha az oldal túl üres, adjon hozzá további tartalmat. Itt ellenőrizheti SERP versenytársait, és követheti bevált gyakorlataikat a WebSite Auditor tartalomszerkesztő részének segítségével.

A Webhely auditorának tartalomszerkesztője
A WebSite Auditor letöltése

Ha gyanítja, hogy az érintett oldalon valamilyen megjelenítést blokkoló tartalom található, ellenőrizze a harmadik féltől származó szkripteket használó felugró ablakokat, és győződjön meg arról, hogy megfelelően működnek, és valóban olvashatók-e a Google számára. Összességében a Google-nak ugyanúgy kell látnia az oldalak tartalmát, ahogyan azt a felhasználók látják.

Ha az oldal tartalma álcázott, ellenőrizze, hogy minden szkript vagy kép elérhető-e a Google számára.

8. Átirányítási hiba

A SEO közösség sokat beszélt az URL-átirányításokról. Ennek ellenére a keresőoptimalizálók folyamatosan követnek el hibákat, amelyek átirányítási hibákhoz és hibás indexelésekhez vezetnek. Íme néhány gyakori ok, amiért a Google nem tudja megfelelően olvasni az átirányításokat:

  • Az átirányítási lánc túl hosszú

  • Az átirányítás végtelen átirányítási ciklust eredményez (átirányítási hurok)

  • Az átirányítási URL meghaladja a maximális URL-hosszt (2 MB Google Chrome esetén)

  • Az átirányítási lánc rossz vagy üres URL-t tartalmaz

Az átirányítási hibák kijavításának egyetlen módja egy kifejezés: az átirányítások helyes beállítása. Kerülje el a hosszú átirányítási láncokat, amelyek csak a SEO feltérképezési költségkeretét pazarolják, és kiürítik a linklevet, ügyeljen arra, hogy ne legyenek 404-es vagy 410-es URL-ek a láncban, és mindig irányítsa át az URL-eket a releváns oldalakra.

9. Szerverhiba (5xx)

Szerverhibák fordulhatnak elő, mert előfordulhat, hogy a szerver összeomlott, lejárt, vagy leállt, amikor a Googlebot megjelent.

Itt először ellenőrizni kell az érintett URL-t. Nyissa meg az URL-ellenőrzés eszközt a GSC-ben, és nézze meg, hogy továbbra is hibát jelez-e. Ha rendben van, akkor az egyetlen dolog, amit tehet, az újraindexelés kérése.

Ha továbbra is fennáll a hiba, a hiba jellegétől függően a következő lehetőségek közül választhat:

  • Csökkentse a túlzott oldalbetöltést dinamikus oldalkérések esetén

  • Győződjön meg arról, hogy webhelye tárhelyszervere nincs leállítva, nincs túlterhelve vagy nincs rosszul beállítva

  • Ellenőrizze, hogy nem blokkolja-e véletlenül a Google-t

  • A webhely feltérképezését és indexelését okosan irányíthatja

Miután mindent kijavított, kérjen újraindexelést, hogy a Google gyorsabban lekérje az oldalt.

10. Másolás a felhasználó által kiválasztott kanonikus nélkül

A felhasználó által kiválasztott gyűjtőfájl nélküli másolás gyakori probléma az olyan többnyelvű és/vagy e-kereskedelmi webhelyeken, amelyeken sok azonos vagy nagyon hasonló tartalmú oldal található, amelyeket különböző célokra terveztek. Ebben az esetben meg kell jelölnie egy oldalt gyűjtőként, hogy elkerülje az ismétlődő tartalommal kapcsolatos problémákat.

11. Duplicate, a Google más kanonikust választott, mint a felhasználót

Ez egy érdekes dolog. Előfordulhat, hogy egy bizonyos oldalt gyűjtőként jelölt meg, de a Google úgy döntött, hogy az oldal másik verzióját választja gyűjtőként, így inkább indexeli.

Az ilyen hibák kijavításának legegyszerűbb módja, ha egy gyűjtőcímkét helyez el a Google által kiválasztott oldalra, hogy a jövőben ne keverje össze. Ha meg szeretné tartani a gyűjtőoldalt a kiválasztott oldalon, átirányíthatja a Google által kiválasztott oldalt a kívánt URL-re.

12. Alternatív oldal megfelelő kanonikus címkével

Megjegyzés: Most azokat a kérdéseket fogom bemutatni, amelyek nem igényelnek semmilyen konkrét műveletet (a legtöbb esetben). Ennek ellenére megjelennek a Google Search Console-ban, és feltételezem, hogy kíváncsi lehet, mit jelentenek.

A Google nem indexel egy oldalt, mert az egy gyűjtőoldal másolata. Csak hagyd úgy ahogy van.

13. Felfedezett – jelenleg nincs indexelve

Ha egy oldal Felfedezett állapotú, akkor a Google már felfedezte, de még nem térképezte fel és nem indexelte. Itt csak annyit tehet, hogy kétség esetén ellenőrizze az oldal indexelési utasításait. Ha minden rendben van (azaz ahogy gondoltad), akkor hagyd, hogy a Google végezze el a többit később.

14. Feltérképezve – jelenleg nincs indexelve

Logikusan ez a leírás azt jelenti, hogy a Google feltérképezte az oldalát, de nem indexelte. Az oldal indexelve lesz, ha az indexelési utasítások nem állítják ennek ellenkezőjét. Nem kell újraindexelést kérnie – a Googlebot tudatában van annak, hogy az oldal indexelésre vár.

Ellenőrizze újra az indexelési problémákat, amelyeket a Google nem észlelt

Ez a lépés megköveteli WebSite Auditor. Most ingyen letöltheti. Letöltés WebSite Auditor

A Google Search Console sokat segíthet az indexelési problémák észlelésében és kijavításában. De túl jó lenne, ha nem lenne de. A helyzet az, hogy a Search Console csak akkor jelenít meg problémákat, ha a Google megpróbál lekérni egy oldalt, de ez bármilyen okból meghiúsul. Ha egy ilyen oldalt még a Google sem fedez fel, akkor a GSC-ben nem fog megjelenni az indexelési probléma. Bár a kérdés fontos lehet, és valójában sok is lehet.

A WebSite Auditor segíthet megtalálni és kijavítani az ehhez hasonló problémákat. Nyissa meg a Webhelyszerkezet > Oldalak menüpontot, és engedélyezze a Gyorsítótár dátuma a Google-ban oszlopot a kívánt munkaterületen.

engedélyezze a Gyorsítótár dátuma a Google oszlopban
A WebSite Auditor letöltése

Ezzel láthatja azt a dátumot, amikor egy oldal gyorsítótárba került a Google-ban.

Megjegyzés: Felteheti a kérdést: "Hogyan látja azokat az oldalakat, amelyeket a Google nem lát?" Íme a válasz: saját indexünket használjuk egy korszerű feltérképező motorral, amely képes kiszúrni azokat az oldalakat, amelyeket más keresőmotorok bármilyen okból nem észlelnek.

Most nézze meg a gyorsítótár dátumát.

nézd meg a gyorsítótár dátumát
A WebSite Auditor letöltése

Ha a dátum valamivel túl távoli (több mint egy éve), vagy egyáltalán hiányzik – akkor a Google valószínűleg nem tudja, hogy az oldal létezik. És ki kell derítened, hogy miért.

Először nézze meg a Hivatkozások az oldalra oszlopot ugyanazon a munkaterületen. Ha nincsenek linkek, ez azt jelenti, hogy ez egy árva oldal, és a Google nem találja meg a webhely feltérképezésével. Ha szeretné az oldalt indexelni, akkor hivatkozzon rá a releváns és forgalomban gazdag oldalakról.

Tekintse meg a Robotokra vonatkozó utasítások oszlopot is, és ásson mélyebbre a Nem engedélyezettként megjelölt oldalakon. Előfordulhat, hogy tévedésből letiltotta az indexelni kívánt oldalakat.

A vizualizáció egy további hasznos modul az indexelési problémák megtalálásához

A WebSite Auditor vizualizációs modulja
A WebSite Auditor letöltése

Itt könnyen észreveheti az árva oldalakat (amelyek nem kapcsolódnak más oldalakhoz), a törött oldalakat (pirossal kiemelve) és a hosszú átirányítási láncokat, amelyek szintén okai lehetnek annak, hogy egyes oldalak nem kerülnek indexelésre.

Miután észlelte és kijavította az összes problémát, kérje meg az eszközt, hogy hozzon létre egy új webhelytérképet (és szükség esetén egy robots.txt fájlt), amelyet továbbküld a Google-nak, hogy megtalálja az összes szükséges oldalt.

webhelytérkép létrehozása a WebSite Auditorban
A WebSite Auditor letöltése

Ha rögzített URL-címekre van szüksége a mielőbbi indexeléshez, manuálisan is kérheti az újraindexelést a Google Search Console-ban.

Összefoglalva

Rendszeresen ellenőrizze az oldalak indexelését, mivel hibák bármikor előfordulhatnak. És bármilyen okból: a tárhelyszolgáltatói problémáktól a Google-hibákig és a Google-frissítésekig, amelyek befolyásolhatják a Google algoritmusainak kezelését.

Melyek az indexelési problémák, amelyekkel leggyakrabban találkozik? Ossza meg tapasztalatait Facebook SEO közösségünkben.

Article stats:
Linking websites N/A
Backlinks N/A
InLink Rank N/A
A Seo SpyGlass adatai: próbáld ki az ingyenes backlink-ellenőrzőt.
Kérdései vagy észrevételei vannak?