Skrevet af den

Tag kontrol over dit website og undgå duplicate content

Alle der driver et seriøst website, bør regelmæssigt undersøge, hvordan det klarer sig ud i søgeresultaterne: Hvor godt siderne rangerer, hvilket indhold der er repræsenteret, og hvordan det ser ud. Som en del af dette, skal man være opmærksom på, om identiske (eller næsten identiske) sider på forskellige adresser er blevet indekseret. Det går under betegnelsen duplicate content – noget man altid bør undgå.

Her den anden dag sad vi sammen med en kunde, hvis nuværende web-leverandør har implementeret sprogversionering på deres website, så CMS’et kan håndtere det danske, det engelske og det tyske website – på tre forskellige domæner.

Altså:

  • mitwebsite.de
  • mitwebsite.com
  • mitwebsite.dk

Desværre var løsningen meget uelegant udført, hvilket betød, at hvert eneste website faktisk indeholdt alle siderne på alle sprogene. Noget som kunden ikke selv havde lagt mærke til.

Det tyske website indeholder dermed også alle de danske sider og alle de engelske sider. Det engelske website indholder de tyske og danske sider, ligesom det danske website indholder de engelske og tyske sider.

Sagt på en anden måde:

Enhver side et eller andet sted på de tre websites findes i to identiske kloner på de to øvrige websites. Et meget grelt og iøjnefaldende eksempel på duplicate content – noget man skal undgå.

Hvad er duplicate content?

Kort fortalt dækker begrebet duplicate content over ensartet eller kopieret indhold – det være sig internt på et website eller på tværs af domæner. Eksemplet herover indholder begge typer af duplicate content.

Duplicate content

Duplicate content er noget, som bør undgås på ethvert website, da man kan risikere at sende kedelige signaler til Google. I værste tilfælde straffer Google websites, som ser ud til at spekulere i duplicate content, eller som har skabt slem duplicate content gennem dårlige løsninger og tankeløshed.

Et klassisk eksempel på intern duplicate content er i webshops, hvor man kan sortere produktlisterne (f.eks. efter navn, pris eller mærke) hvilket nogle gange ændrer URL’en men jo stadig giver samme indhold (bare sorteret anderledes). Et andet typisk eksempel er de printvenlige sider, som findes på egen adresse, men jo blot er en klon af den rigtige side.

I det eksempel jeg indledte artiklen med, resulterer det massive omfang af duplicate content – foruden i en stor risiko – også i stor irritation for de danske, tyske og engelske besøgende, som havner på et helt vilkårligt websites, afhængig af hvilken klon-side, der er blevet vist først i søgeresultaterne.

Sådan undgår du duplicate content

Har du købt dit website eller din webshop af en professionel leverandør, bør du være i trygge hænder, når det nye website lanceres. Det er leverandørens ansvar at være opmærksom på duplicate content og dermed levere en løsning, hvor problemet ikke opstår eller omfanget er minimeret.

I de enkelte tilfælde, hvor det ikke kan undgås, (feks. hvis samme produkt død og pine skal kunne findes under to forskellige produkt-kategorier) så skal der selvfølgelig rådgives om problemet, og om hvordan man gennem CMS’et løser det ved at tilføje et bestemt tag til siden (mere om det lidt længere nede).

I eksemplets tilfælde stikker problemet dybere end et par sider og lidt sortering, der skaber duplicate content. Men løsningsforslagene nedenfor kan (på den korte bane) også afhjælpe disse meget omfattende problemer.

Brug 301-redirects

Når man opsætter en 301-redirect er det en måde at fortælle den besøgende (f.eks. Googlebot) at en eller flere sider er permanent flyttet til en anden adresse. Dette vil blive taget til efterretning i Googles indeksering, og efter lidt tid vil Google have opdateret indekset med sidens nye placering. Besøger man selv en side, som er blevet tilknyttet en 301-redirect, vil man automatisk blive sendt videre til den nye side (f.eks. på et helt andet website) på et splitsekund.

Et 301-redirect skal skrives ind i .htaccess-filen (såfremt webserveren kører på Apache) og kan f.eks. se således ud:

  • Redirect 301 /min-gamle-side http://www.domæne.dk/min-nye side

Opsæt canonical URL-tags

Med et canonical URL tag, kan man på den eller de klonede sider fortælle Google, hvilken side der rent faktisk skal indekseres, så man undgår duplicate content. Man kan godt benytte canonical på tværs af domæner. Et eksempel på et canonical URL tag ser således ud:

  • <link rel=”canonical” href=”http://www.domaene.com/denne-side-skal-indekseres”>

Brug “noindex, follow”-tags

Som et form for alternativ til canonical URL-tagget kan man benytte et “noindex, follow”-tag, som fortæller søgemaskinerne, at siden godt må besøges men ikke skal medtages i indekset. Siden skal altså fint eksistere på websitet for brugerne, men ellers være usynligt i søgeresultaterne, for at undgå duplicate content. Tagget ser således ud:

  • <meta name=“robots content=“noindex, follow”>

Muligheder i Google Webmaster Tools

Har du ikke allerede opsat Google Webmaster Tools for dit website, så gør det med det samme. Vi venter her imens.

I Google Webmaster Tools kan man bl.a. fortælle Google hvordan sider med URL-parametre (som f.eks. benyttes til sortering eller filtrering af indhold) skal behandles.

En ulempe er dog, at det kun er Google, der får disse beskeder. Bing (ja, den findes også) ved altså ikke noget om reglerne. Det må du på samme måde fortælle Bing i Bing Webmaster.

Søg efter dit eget website. Ofte

Alle der driver et seriøst website, bør løbende søge efter indholdet på sit eget website. Måske den mest nyttige søgning på Google er:

  • site:domæne.dk

På baggrund af denne søgning vil Google give dig alle de sider, som er blevet indekseret på domænet. Det er efterfølgende nemt at få et indblik i hvordan websitet er blevet indekseret, om der er fejl eller mangler i diverse tags (meta description eller title) eller om der er duplicate content.