Početna stranicaOsnovni pojmovi

Što je Robots.txt?

Što je robots.txt datoteka i zašto je važna?

Robots.txt datoteka je tekstualna datoteka koja se koristi za upravljanje indeksiranjem stranica web lokacije od strane pretraživača.

Ova datoteka sadrži instrukcije o tome koje dijelove stranice trebaju biti indeksirane ili ignorirane od strane pretraživača. Na taj način se može kontrolirati koji dio sadržaja na web lokaciji će biti vidljiv i dostupan u rezultatima pretraživanja.

Kako se koristi robots.txt datoteka?

Robots.txt datoteka se koristi tako što se nalazi na web lokaciji i sadrži instrukcije koje pretraživači trebaju slijediti prilikom indeksiranja stranice.

Pretraživači automatski pregledavaju robots.txt datoteku na web lokaciji i provjeravaju je li sadržaj stranice dozvoljen za indeksiranje ili ne. Na temelju tih instrukcija, pretraživači će odlučiti koji dio sadržaja na stranici će biti indeksiran i prikazan u rezultatima pretraživanja.

Kako se kreira i uređuje robots.txt datoteka?

Robots.txt datoteka se kreira u tekstualnom editoru kao obična tekstualna datoteka. Ova datoteka se zatim sprema u direktorij web lokacije (to je direktorij u kojem se nalazi glavna stranica web lokacije) pod nazivom “robots.txt”. U njoj se nalaze instrukcije koje pretraživači trebaju slijediti prilikom indeksiranja stranice.

Kako bi se uređivala robots.txt datoteka, potrebno je otvoriti datoteku u tekstualnom editoru i izmijeniti instrukcije koje se u njoj nalaze.

Kada su izmjene završene, potrebno je spremiti datoteku i ponovo učitati web lokaciju kako bi se promjene primijenile.

Napomena: Potrebno je biti oprezan prilikom uređivanja robots.txt datoteke jer pogrešne instrukcije mogu dovesti do neželjenih posljedica, poput onemogućavanja indeksiranja važnih dijelova sadržaja na web lokaciji.

Kako se provjerava ispravnost robots.txt datoteke?

Postoji nekoliko načina na koje se može provjeriti ispravnost robots.txt datoteke. Jedan od načina je da se pregleda datoteka u tekstualnom editoru i provjeri je li sve u redu s instrukcijama koje se u njoj nalaze.

Također, postoje i posebni alati koji se mogu koristiti za provjeru ispravnosti robots.txt datoteke.

Na primjer, Google nudi alat za provjeru robots.txt datoteke na sljedećem linku: https://support.google.com/webmasters/answer/6062608?hl=en

Pomoću ovog alata možete unijeti URL web lokacije i provjeriti je li robots.txt datoteka ispravna i funkcionalna.

Alat će prikazati rezultate provjere i dati preporuke za popravak eventualnih pogrešaka u robots.txt datoteci.

Primjeri robots.txt datoteke za različite namjene

Evo nekoliko primjera robots.txt datoteke za različite namjene:

Ako želite zabraniti indeksiranje cijele web lokacije, možete koristiti sljedeću robots.txt datoteku:

User-agent: *
Disallow: /

 

Ako želite dozvoliti indeksiranje cijele web lokacije, osim određenih direktorija ili datoteka, možete koristiti sljedeću robots.txt datoteku:

User-agent: *
Disallow: /direktorij1/
Disallow: /direktorij2/datoteka.html

 

Ako želite dozvoliti indeksiranje određenih direktorija ili datoteka, a zabraniti indeksiranje ostalog sadržaja, možete koristiti sljedeću robots.txt datoteku:

User-agent: *
Allow: /direktorij1/
Allow: /direktorij2/datoteka.html
Disallow: /

 

Ovi su samo neki primjeri kako bi se mogla konfigurirati robots.txt datoteka.

Postoje mnoge druge mogućnosti i kombinacije instrukcija koje se mogu koristiti u ovoj datoteci, ovisno o potrebama i željama web lokacije.

Moguće pogreške u robots.txt datoteci i kako ih ispraviti

Postoje različite moguće pogreške koje se mogu pojaviti u robots.txt datoteci. Ovdje su navedene neke od najčešćih pogrešaka i načini njihovog ispravljanja:

  • Prazna datoteka: Ako je robots.txt datoteka prazna ili ne sadrži nikakve instrukcije, to može dovesti do toga da se cijela web lokacija označi kao dozvoljena za indeksiranje. Kako bi se ispravila ova pogreška, potrebno je unijeti odgovarajuće instrukcije u robots.txt datoteku i spremiti promjene.
  • Pogrešan format instrukcija: Ako se instrukcije u robots.txt datoteci unose u pogrešnom formatu ili sadrže pogreške, to može dovesti do neispravnog funkcioniranja datoteke. Kako bi se ispravila ova pogreška, potrebno je pregledati instrukcije u datoteci i ispraviti eventualne pogreške u formatu.
  • Nepostojanje datoteke: Ako robots.txt datoteka ne postoji u kožnom direktoriju web lokacije, pretraživači neće biti u mogućnosti pročitati instrukcije i indeksirat će cijelu web lokaciju. Kako bi se ispravila ova pogreška, potrebno je kreirati robots.txt datoteku i smjestiti je u kožni direktorij web lokacije.
  • Loša sintaksa: Ako robots.txt datoteka sadrži pogreške u sintaksi, to može dovesti do toga da pretraživači ne razumiju instrukcije i neispravno indeksiraju stranice. Kako bi se ispravila ova pogreška, potrebno je pregledati datoteku i ispraviti eventualne sintaksne pogreške.

Kako se robots.txt datoteka koristi zajedno s drugim alatima za upravljanje indeksiranjem stranica

Robots.txt datoteka se može koristiti zajedno s drugim alatima za upravljanje indeksiranjem stranica na web lokaciji.

Na primjer, postoje alati za upravljanje indeksiranjem u web lokacijama koji omogućuju da se određeni dio sadržaja označi kao “privatno” ili “interno”, što znači da se taj sadržaj neće indeksirati i neće biti vidljiv u rezultatima pretraživanja.

Ovi alati mogu se koristiti zajedno s robots.txt datotekom kako bi se dodatno kontroliralo indeksiranje stranica na web lokaciji.

Primjer: Ako želite da određeni dio sadržaja na web lokaciji bude označen kao “privatno” i ne bude indeksiran od strane pretraživača, možete koristiti alat za upravljanje indeksiranjem da označite taj sadržaj kao “privatno”, a zatim dodati instrukciju u robots.txt datoteku koja će zabraniti indeksiranje tih dijelova stranica. Na taj način se može postići dodatna kontrola nad indeksiranjem stranica na web lokaciji.

Zaključak

Zaključno, robots.txt datoteka je važan alat za upravljanje indeksiranjem stranica na web lokaciji. Ova datoteka sadrži instrukcije koje pretraživači trebaju slijediti prilikom indeksiranja stranice, što omogućuje dodatnu kontrolu nad tim procesom.

Robots.txt datoteka se lako može kreirati i uređivati, a postoje i alati za provjeru ispravnosti datoteke. Koristeći robots.txt datoteku, možete odabrati koji dio sadržaja na web lokaciji želite da bude indeksiran i vidljiv u rezultatima pretraživanja, što je od velikog značaja za SEO i optimizaciju pretraživača.

Imate dodatnih pitanja?

Kontaktirajte nas

    Naš blog