Robots.txt Nedir? Ne ie yarar?

March 31, 2008 · Filed Under WebmasteRz · 1 Comment 

Arama motorlar覺n覺n indeksleme robotlar覺 bir web sitesine ulat覺klar覺nda ilk olarak k繹k dizinde bulunan robots.txt dosyas覺n覺 ararlar. Bu dosya robotlara hangi sayfalar覺n indekslenip hangilerinin indekslenmeyeceini anlatmak i癟in yerletirilir. Robotlar sadece k繹k dizindeki robots.txt dosyas覺na bakacaklar覺 i癟in alt dizinlere bu dosyay覺 yerletirmek anlams覺zd覺r. Eer alt dizinlerden birisine ait url (veya urllerin) indekslenmesini istemiyorsan覺z bunlar da k繹k dizindeki robots.txt dosyas覺nda bildirmeniz gerekiyor. Ya da alternatif olarak indekslenmesini istemediiniz sayfalarda Meta Tag kullanabilirsiniz. ou 羹cretsiz blog servisi k繹k dizine eriime izin vermediinden Meta Taglardan yararlanmak gerekecetir.

rnek bir robots.txt adresi u ekilde olmal覺d覺r;

http://www.hell-world.org/robots.txt

Aa覺daki 繹rneklerdeki robots.txt dosyalar覺 ise, bulunduklar覺 hatal覺 pozisyon nedeni ile, robotlar taraf覺ndan dikkate al覺nmayacaklard覺r;

http://www.adsense.hell-world.org/robots.txt

robots.txt dosyas覺 sadece belirli bir ekilde d羹zenlenmi metin i癟eriine sahip olmal覺d覺r ve asla HTML kodlar覺 i癟ermemelidir. Aa覺daki 繹rnekleri inceleyelim;

T羹m robotlar覺n blogunuzun tamam覺n覺 indekslemesini engellemek i癟in;

User-agent: *
Disallow: /

Blogunuzun tamam覺n覺n robotlar覺n birisi taraf覺ndan indekslenmesini engellemek i癟in;

User-agent: Googlebot
Disallow: /
User-agent: *
Disallow:

T羹m robotlar覺n blogunuzun tamam覺n覺 indekslemesi i癟in;

User-agent: *
Disallow:

Not: Bo bir robots.txt dosyas覺 da ayn覺 mesaj覺 verecektir.

Bir dizinin t羹m robotlar taraf覺ndan indekslenmesini engellemek i癟in;

User-agent: *
Disallow: /dizin-adi/

Bir sayfan覺n t羹m robotlar taraf覺ndan indekslenmesini engellemek i癟in;

User-agent: *
Disallow: /dizin-adi/ozel-sayfa.html

Robots.txt dosyas覺nda /dizin-adi/* veya /dizin-adi/*.html gibi ifadeler kullanamazs覺n覺z. Hari癟 tutulmas覺n覺 istediiniz sayfalar覺 ve dizinleri teker teker belirtmek zorundas覺n覺z. Tabii ki hari癟 tuttuunuz bir dizinin i癟indeki dosyalar覺 ayr覺ca belirtmenize gerek yok :)

rnek bir kod aa覺daki ekilde olabilir;

# www.ornek.com i癟in robots.txt dosyas覺
User-agent: *
Disallow: /cgi-bin/
Disallow: /images/private/
Disallow: /private.html

Kaynaklar;

  • Hell-World.Org

  • Son Yaz覺lanlar

  • Bunlar覺da Okuyun!

    Installing WordPress on your own Windows computer

    Resim 襤mza Program覺 v.1.0

    Bedava Forum Sitesi Kurmak 襤steyenlere [ MyBB 1.2.7 ]

    Yahoo Mail

    Winrarla Par癟alanm覺 Filimlerin tek b繹l羹m羹n羹 bilgisayar覺n覺za inndirip izleyebilirsiniz..

    Abyss Web Server X1 2.5

    Trojan Remover 6.6.5

    300 Farkl覺 Dilde Fotoraf Arayan Sistem

    Rapidshare'de S覺n覺rs覺z Download Kesin 繹z羹m

    Linux e-book arivleri

  • Etiketler

  • Son Yorumlar

  • RSS Oyun Blogu



- Google - Google Adsense - Google Pagerank - Security - Hosting - Linux - Messenger - Messenger Hata Kodlari - Msn -
- Msn Hatalari ve 繹z羹mleri - Webmaster - Web Konulari / Haberleri - Program - Sxe - Sxe Download - Windows Update Agent 5.8.02469 -
Hell-World.Org/Ownz - Teknoloji Blogu - Teknolojik olaylar覺n blogu
intro - Root - Html - Home - hellboy726 - Developer - Desing - Site Haritasi - Kullanim Policesi - Ownz -Teknoloji Blogu - iLetisim(contact) - Sitemap