robots.txt dosyası, bir web sitesinin kök dizininde yer alan bir metin dosyasıdır. Bu dosya, web tarayıcılarına ve arama motoru botlarına siteyi nasıl tarayacaklarını ve hangi sayfaların dizine eklenebileceğini belirtir. robots.txt dosyası, web sitesi sahiplerinin arama motorlarına ve diğer botlara siteye erişim izinlerini ve kısıtlamalarını kontrol etmelerini sağlar.
robots.txt dosyası, web sitesi sahiplerinin istemedikleri belirli botların (örneğin, arama motoru botları veya web tarayıcıları) belirli sayfalara veya dizinlere erişimini engellemelerine olanak tanır. Ayrıca, dosya, site haritası (sitemap) dosyasının konumunu da belirtebilir.
Dosyanın içeriği basit bir yapıya sahiptir ve bir dizi kural içerebilir. Örnek bir robots.txt dosyası aşağıdaki gibi görünebilir:
User-agent: *
Disallow: /gizli_dizin/
Disallow: /ozel_sayfa.html
Allow: /kategoriler/
Allow: /sayfalar/izinli.html
Sitemap: http://www.example.com/site-haritasi.xml
Yukarıdaki örnek, tüm botlara (User-agent: *
) site kök dizinindeki “gizli_dizin” adlı dizine ve “ozel_sayfa.html” adlı sayfaya erişimi engeller (Disallow
). Ancak “kategoriler” dizini ve “sayfalar/izinli.html” sayfasına erişime izin verir (Allow
). Ayrıca, site haritasının konumunu (Sitemap
) belirtir.
robots.txt dosyası, web siteleri için bir rehber niteliği taşır ve web tarayıcılarının ve arama motoru botlarının web sitesini tararken uyacakları kuralları belirler. Ancak, robots.txt dosyası, siteye erişmek isteyen botlar tarafından tamamen uygulanması gereken bir kısıtlama değildir ve kötü niyetli botlar tarafından görmezden gelinebilir. Bu nedenle, hassas veya gizli verileri korumak için ek güvenlik önlemleri almak önemlidir.
© 2023, Bedri Yılmaz.
BedriYilmaz.com by Bedri Yılmaz is licensed under Attribution-NonCommercial-NoDerivatives 4.0 International
Tüm hakları saklıdır! İçeriği izinsiz kullanmayınız!