Početna stranica ‣ Osnovni pojmovi ‣
Početna stranica ‣ Osnovni pojmovi ‣
Robots.txt datoteka je tekstualna datoteka koja se koristi za upravljanje indeksiranjem stranica web lokacije od strane pretraživača.
Ova datoteka sadrži instrukcije o tome koje dijelove stranice trebaju biti indeksirane ili ignorirane od strane pretraživača. Na taj način se može kontrolirati koji dio sadržaja na web lokaciji će biti vidljiv i dostupan u rezultatima pretraživanja.
Robots.txt datoteka se koristi tako što se nalazi na web lokaciji i sadrži instrukcije koje pretraživači trebaju slijediti prilikom indeksiranja stranice.
Pretraživači automatski pregledavaju robots.txt datoteku na web lokaciji i provjeravaju je li sadržaj stranice dozvoljen za indeksiranje ili ne. Na temelju tih instrukcija, pretraživači će odlučiti koji dio sadržaja na stranici će biti indeksiran i prikazan u rezultatima pretraživanja.
Robots.txt datoteka se kreira u tekstualnom editoru kao obična tekstualna datoteka. Ova datoteka se zatim sprema u direktorij web lokacije (to je direktorij u kojem se nalazi glavna stranica web lokacije) pod nazivom “robots.txt”. U njoj se nalaze instrukcije koje pretraživači trebaju slijediti prilikom indeksiranja stranice.
Kako bi se uređivala robots.txt datoteka, potrebno je otvoriti datoteku u tekstualnom editoru i izmijeniti instrukcije koje se u njoj nalaze.
Kada su izmjene završene, potrebno je spremiti datoteku i ponovo učitati web lokaciju kako bi se promjene primijenile.
Napomena: Potrebno je biti oprezan prilikom uređivanja robots.txt datoteke jer pogrešne instrukcije mogu dovesti do neželjenih posljedica, poput onemogućavanja indeksiranja važnih dijelova sadržaja na web lokaciji.
Postoji nekoliko načina na koje se može provjeriti ispravnost robots.txt datoteke. Jedan od načina je da se pregleda datoteka u tekstualnom editoru i provjeri je li sve u redu s instrukcijama koje se u njoj nalaze.
Također, postoje i posebni alati koji se mogu koristiti za provjeru ispravnosti robots.txt datoteke.
Na primjer, Google nudi alat za provjeru robots.txt datoteke na sljedećem linku: https://support.google.com/webmasters/answer/6062608?hl=en
Pomoću ovog alata možete unijeti URL web lokacije i provjeriti je li robots.txt datoteka ispravna i funkcionalna.
Alat će prikazati rezultate provjere i dati preporuke za popravak eventualnih pogrešaka u robots.txt datoteci.
Evo nekoliko primjera robots.txt datoteke za različite namjene:
Ako želite zabraniti indeksiranje cijele web lokacije, možete koristiti sljedeću robots.txt datoteku:
User-agent: *
Disallow: /
Ako želite dozvoliti indeksiranje cijele web lokacije, osim određenih direktorija ili datoteka, možete koristiti sljedeću robots.txt datoteku:
User-agent: *
Disallow: /direktorij1/
Disallow: /direktorij2/datoteka.html
Ako želite dozvoliti indeksiranje određenih direktorija ili datoteka, a zabraniti indeksiranje ostalog sadržaja, možete koristiti sljedeću robots.txt datoteku:
User-agent: *
Allow: /direktorij1/
Allow: /direktorij2/datoteka.html
Disallow: /
Ovi su samo neki primjeri kako bi se mogla konfigurirati robots.txt datoteka.
Postoje mnoge druge mogućnosti i kombinacije instrukcija koje se mogu koristiti u ovoj datoteci, ovisno o potrebama i željama web lokacije.
Postoje različite moguće pogreške koje se mogu pojaviti u robots.txt datoteci. Ovdje su navedene neke od najčešćih pogrešaka i načini njihovog ispravljanja:
Robots.txt datoteka se može koristiti zajedno s drugim alatima za upravljanje indeksiranjem stranica na web lokaciji.
Na primjer, postoje alati za upravljanje indeksiranjem u web lokacijama koji omogućuju da se određeni dio sadržaja označi kao “privatno” ili “interno”, što znači da se taj sadržaj neće indeksirati i neće biti vidljiv u rezultatima pretraživanja.
Ovi alati mogu se koristiti zajedno s robots.txt datotekom kako bi se dodatno kontroliralo indeksiranje stranica na web lokaciji.
Primjer: Ako želite da određeni dio sadržaja na web lokaciji bude označen kao “privatno” i ne bude indeksiran od strane pretraživača, možete koristiti alat za upravljanje indeksiranjem da označite taj sadržaj kao “privatno”, a zatim dodati instrukciju u robots.txt datoteku koja će zabraniti indeksiranje tih dijelova stranica. Na taj način se može postići dodatna kontrola nad indeksiranjem stranica na web lokaciji.
Zaključno, robots.txt datoteka je važan alat za upravljanje indeksiranjem stranica na web lokaciji. Ova datoteka sadrži instrukcije koje pretraživači trebaju slijediti prilikom indeksiranja stranice, što omogućuje dodatnu kontrolu nad tim procesom.
Robots.txt datoteka se lako može kreirati i uređivati, a postoje i alati za provjeru ispravnosti datoteke. Koristeći robots.txt datoteku, možete odabrati koji dio sadržaja na web lokaciji želite da bude indeksiran i vidljiv u rezultatima pretraživanja, što je od velikog značaja za SEO i optimizaciju pretraživača.