Duplicitní obsah aneb jak zamezit jeho vzniku na webové stránce

Duplicitní obsah patří k častým problémům, které na webových stránkách klientů řešíme. Jeho výskyt negativně ovlivňuje indexaci webu a tím i celkovou návštěvnost a šanci na oslovení potencionálních zákazníků.  V článku vám blíže představíme tento jev a poradíme, jak ho řešit.

Čím duplicita negativně ovlivňuje SEO

Duplicita vzniká na webu v okamžiku, kdy se stejný či velmi podobný obsah nachází na odlišných URL adresách – tyto URL adresy jsou pak označovány za duplicitní URL adresy. Tím vzniká problém. Roboti vyhledávačů chtějí ve výsledcích vyhledávání nabídnout uživatelům pouze relevantní, unikátní a neopakující se stránky. 

V praxi si obvykle sami určí, kterou z duplicitních variant URL adres zaindexují a následně zobrazí ve výsledcích vyhledávání. Bohužel se nemusí jednat o tu URL adresu, která pro vás má obchodní potenciál. Kvůli tomu hrozí pád důležitých stránek na nižší a méně navštěvované pozice.

Roboti rovněž mohou zaindexovat všechny dané duplicitní URL adresy, které se zaměřují na zcela totožný obsah. Kvůli tomu opět hrozí, že se všechny tyto URL adresy zobrazí na nižších pozicích. Žádná z nich nemůže dosáhnout tak silné hodnoty, aby byla pro roboty zajímavá a zobrazili ji na vyšší pozici než ostatní varianty.

Duplicitní URL adresy si navzájem škodí

Z výše popsaných situací lze odvodit, že duplicitní URL adresy si navzájem škodí, kanibalizují na sobě a jsou si tak vzájemnou konkurencí. 

Představme si konkrétní příklady, proč si duplicitní URL adresy navzájem ubírají na hodnotách.

Máte 3 duplicitní URL adresy. Na jednu z nich vede velké množství hodnotných zpětných odkazů, které z pohledu SEO zvyšují významnost webu ve vyhledávačích. Na druhou a třetí URL adresu rovněž lidé odkazují, ale v menším množství. V tomto případě každou stránku podporují jiné zpětné odkazy, což vede ke tříštění efektu zpětných odkazů. 

Ke stejnému problému dochází i s klíčovými slovy. Na všech 3 duplicitních URL adresách se totiž nachází stejný obsah s totožnými klíčovými slovy. Opět se zde síla klíčových slov tříští mezi všechny varianty URL adres. 

Žádná z duplicitních stránek pak nemůže získat plnohodnotnou sílu. Ať už z pohledu zpětných odkazů nebo klíčových slov. 

Roboti vyhledávačů sice dnes dovedou duplicitní obsah rozpoznat. Nicméně bez technického upřesnění (nastavení) nejsou schopni sloučit všechny faktory duplicitních URL adres ani vyhodnotit pouze jednu primární URL adresu.  

Duplicitní obsah pak ovlivňuje i přidělování určité kvality a důvěryhodnosti dané webové prezentace i konkrétních URL adres. To se v konečném důsledku může projevit v umístění na horších pozicích ve výsledcích vyhledávání.

Tomuto problému se však dá bezpečně vyhnout prostřednictvím správného technického nastavení. Předtím si však musíte uvědomit, o jaký typ duplicitních URL adres se jedná a podle toho implementovat určitá opatření či kroky k jejich „odstranění“. 

Typy duplicitních URL adres

Nejzásadnější duplicitní URL adresy řadíme do 3 skupin podle toho, jak na dané webové prezentaci mohou vznikat.

1) Typické duplicity homepage

Do první skupiny bychom zařadili tzv. „běžné“ duplicitní URL adresy. Tyto URL adresy mohou vzniknout na každém webu a vyplatí se je včas podchytit.

Jedná se o URL adresy:

  • Na protokolu HTTP, ale i HTTPS
    • http://www.domena.cz
    • https://www.domena.cz 
  • Nesprávně nakonfigurovaný webový server
    • https://www.domena.cz
    • https:/www.domena.cz/index.php 
    • https://www.domena.cz/index.html
  • S koncovým lomítkem a bez koncového lomítka
    • http://www.domena.cz/trika 
    • http://www.domena.cz/trika/ 
  • S variantou www a bez www
    • domena.cz
    • www.domena.cz 

Jestliže danou webovou prezentaci můžeme v prohlížeči načíst a zobrazit v některých výše uvedených situacích a obě varianty budou tak přístupné (odpověď serveru na klientský požadavek činí 200), jedná se z pohledu robotů o duplicitu. 

Na dvou odlišných URL adresách se tudíž nachází zcela totožný obsah. Je zapotřebí tyto duplicity pečlivě ohlídat a technicky zaopatřit. 

2) Přeskupení či síto produktů

Do druhé skupiny duplicit řadíme URL adresy, které závisí na zaměření a velikosti daného webu. Ve většině případů vznikají převážně na e-shopech. Jedná se o kategorické stránky, ve kterých si uživatel může přizpůsobit nabídku produktů dle svého zájmu (např. filtr barva – černá) či zobrazit další produkty.

V tu chvíli se daná změna (filtr/parametr) pro výčet produktů propíše i do URL adresy, na které ale zůstane zcela totožný textový obsah, ale pouze se změní nabídka produktů (např. vyfiltrují se trička v černé barvě). 

Typicky se jedná o filtraci zboží či stránkování

Příklad:

Uživatel se nachází v kategorii Trička a chce si vyfiltrovat pouze produkty značky Nike v černé barvě.

Kategorická stránka má tuto podobu -> https://www.domena.cz/trika/

Filtrovaná stránka by následně měla tuto podobu -> https://www.domena.cz/trika/znacka-nike/barva-cerna/  

Z výše uvedeného příkladu lze jednoznačně poznat, že se jedná o dvě odlišné URL adresy. Na obou URL adresách se však nachází stejný obsah, ale na základě vybraného filtru/parametru – značka Nike , barva černá – se uživateli zobrazí výčet daných triček na míru. Jedná se tedy pouze o rozdíl zobrazení počtu produktů na základě vybraného filtru

K tomu samému problému dochází i v případě stránkování, kdy se do URL adres pouze propíše parametr stránkování (např. pg-2), ale ostatní obsah stránky zůstává rovněž stejný. Pouze se zobrazí další nabídka produktů. 

Jedná se o velmi zásadní duplicity a jestliže nejsou na webu správně opatřeny, může docházet nejen v případě e-shopů až několikanásobnému množství duplicitních URL adres. 

3) Struktura URL adres

Do poslední skupiny duplicit zařazujeme URL adresy vzniklé na základě nevhodné struktury URL adres. K tomuto problému dochází hlavně v případech, kdy se do URL adres propisuje „cesta“ k dané kategorii či produktu. 

URL adresy tak odráží cestu uživatele napříč webem. Například:

https://www.domena.cz/obyvaci-doplnky/produkt-ramecek-001/  

https://www.domena.cz/prislusenstvi-a-doplnky/produkt-ramecek-001/ 

V tuto chvíli se jedná o problém, neboť pro daný produkt (rámeček 001) existují dvě odlišné URL adresy, na kterých se opět nachází zcela stejný textový obsah. Rozdílem je pouze fakt, že se uživatel proklikl na finální produkt přes jinou cestu, respektive kategorii – v prvním případě přes kategorii obývací doplňky a podruhé přes kategorii příslušenství a doplňky.  

I z tohoto důvodu doporučujeme dodržovat zásady jednoduchých struktur URL adres. Tím se vyhnete případným duplicitním URL adresám.

Všechny výše vyjmenované duplicitní URL adresy u klientů řešíme, aby se síla URL adres a klíčových slov netříštila mezi více URL a ty mezi sebou potom nesoupeřily ve výsledcích vyhledávání o lepší pozice. 

Jak vyřešit duplicitní URL adresy

Duplicitní URL adresy můžete eliminovat vhodným technickým nastavením. Z hlediska SEO existují 4 možnosti, jak duplicity ošetřit.

Ne všechny se ale hodí na všechny typy duplicit. Proto musíte na webu veškeré duplicitní URL adresy identifikovat a dle jejich množství, historie a typu přejít k optimálnímu řešení. 

1) Prostřednictvím přesměrování 

Ošetření prostřednictvím trvalého přesměrování (kód 301) není možné u duplicitních URL adres, které vznikly na základě filtrace či stránkování. Původní obsah byste tímto krokem odstranili a roboti by indexovali pouze obsah na nové URL adrese, na kterou přesměrováváme. 

Toto řešení proto využíváme zejména v případech duplicitních URL adres homepage. Přesměrováním samozřejmě ošetřujeme i další technické aspekty webu, mezi které patří například migrační procesy. 

2) Kanonickou URL adresou

Kanonickou značkou doporučujeme ošetřovat typy duplicit, které na webu vznikají v menším množství. Kanonická značka se totiž nachází ve zdrojovém kódu dané URL adresy. Roboti si tento zápis musí přečíst a dané URL adresy navštívit. Tím si však mohou plýtvat svůj denní crawl budget (počet stránek, které mohou roboti vyhledávačů za určitý čas na webu projít). 

Zároveň se nejedná o přímou direktivu, ale pouze o doporučení. Záleží pouze na robotech, zda kanonickou značku budou respektovat. Proto důkladně ověřte, jestli se opravdu jedná o 100% duplicitu. V opačném případě roboti kanonickou značku mohou ignorovat a sami si zvolit prioritní URL adresu.

Výhodou kanonické značky je fakt, že dokáže přenést hodnoty dané URL adresy na primární vybranou URL adresu – tedy na URL adresu označenou jako kanonickou. 

3) Robots.txt – zákazem procházení určitých parametrů

Ošetření prostřednictvím souboru Robots.txt doporučujeme v případech velkého množství stejných duplicitních URL adres – např. nehodnotná filtrace či parametry kampaní. 

V tu chvíli doporučujeme robotům zcela zakázat procházení těchto typů stránek a šetřit tím crawl budget robotů. Tento zápis ale nezakazuje indexaci, jestliže se roboti na dané URL adresy „dostanou“ ze zpětného odkazu. 

4) Meta tagem: noindex, follow

Některé duplicitní URL adresy řešíme přímým zákazem indexace prostřednictvím meta tagu: noindex, follow či noindex, nofollow. 

Tento zápis robotům zakáže indexovat danou URL adresu, ale může či nemusí jim zakázat i procházení po interních odkazech (follow/nofollow).

Tuto metodu radíme využít u duplicitních URL adres, u kterých chcete, aby roboti následovali další interní odkazy. Připomínáme však, že tato metoda spotřebovává crawl budget robotů.

Řešení prostřednictvím meta tagu: noindex, nofollow můžete kombinovat i se zápisem v souboru Robots.txt. Tím šetříte crawl budget, a máte i maximální kontrolu nad indexací.

Když duplicitní URL adresy identifikujete, vždy volte optimální řešení podle jejich množství, historie a typu.

Závěrem

Nepodceňujte vliv duplicitních URL adres. Tříští sílu odkazového profilu i klíčových slov, které vyhledávače berou jako významné faktory celkové kvality webu. To ovlivňuje návštěvnost související s výslednou pozicí, na které Google či Seznam danou webovou stránku zobrazí ve výsledcích vyhledávání.

Když duplicitní URL adresy identifikujete, vždy volte optimální řešení podle jejich množství, historie a typu.

Pokud váháte, zda tato technická část SEO nebrzdí i vás, napište nám. Připravíme pro vás SEO audit, který odhalí případné problémy a poradí, jak je vyřešit.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Štítky: