Robots.txt Nedir, Nasıl Oluşturulur?

Robots.txt Nedir, Nasıl Oluşturulur?
{"id":118,"post_type_id":24,"title":"Erkan Eren","sefurl":"erkan-eren","status":1,"index":1,"order":0,"published_at":"2020-10-07 10:16:00","created_at":"2020-10-07 10:16:33","updated_at":"2020-10-22 00:47:34","post_type":{"id":24,"type":2,"title":"Yazarlar","singular_title":"Yazar","menu_title":"Yazarlar","icon":"far fa-signature","single_url":null,"single_template":"single-author","single_status":1,"comment_status":0,"tag_status":0,"priorty":"0.5","change_frequency":"monthly","seo_title_rule":"[title] - Grey Medya","seo_desc_rule":null,"direct_content":0,"status":1,"only_admin":0,"visual_part":0,"order":13,"created_at":"2020-05-31 21:09:59","updated_at":"2020-07-01 00:15:17"},"details":[{"id":644,"post_id":118,"post_type_input_id":189,"value":"Erkan Eren","order":0,"created_at":"2020-10-07 10:16:33","updated_at":"2020-10-07 10:16:33","post_type_input":{"id":189,"post_type_id":24,"type":"text","title":"Seo Ba\u015fl\u0131k","sefurl":"seo-baslik","required":0,"grid":6,"right_area":0,"sortable":0,"list_item":0,"only_admin":0,"properties":"{\"limit\":70,\"force_limit\":\"false\"}","order":0,"created_at":"2020-05-31 21:09:59","updated_at":"2020-05-31 21:09:59"}},{"id":645,"post_id":118,"post_type_input_id":188,"value":null,"order":0,"created_at":"2020-10-07 10:16:33","updated_at":"2020-10-07 10:16:33","post_type_input":{"id":188,"post_type_id":24,"type":"textarea","title":"Seo A\u00e7\u0131klama","sefurl":"seo-aciklama","required":0,"grid":6,"right_area":0,"sortable":0,"list_item":0,"only_admin":0,"properties":"{\"limit\":160,\"force_limit\":\"false\"}","order":0,"created_at":"2020-05-31 21:09:59","updated_at":"2020-05-31 21:09:59"}},{"id":646,"post_id":118,"post_type_input_id":190,"value":"yuklemeler\/yazar-gorselleri\/erkan-eren.jpg","order":0,"created_at":"2020-10-07 10:16:33","updated_at":"2020-10-07 10:16:33","post_type_input":{"id":190,"post_type_id":24,"type":"image","title":"G\u00f6rsel","sefurl":"gorsel","required":1,"grid":12,"right_area":0,"sortable":0,"list_item":0,"only_admin":0,"properties":"{\"folder\":\"yazar-gorselleri\",\"thumbs\":{\"default\":{\"width\":\"350\",\"height\":\"345\"},\"small\":{\"width\":\"32\",\"height\":\"32\"}}}","order":1,"created_at":"2020-05-31 21:11:44","updated_at":"2020-05-31 21:12:04"}},{"id":647,"post_id":118,"post_type_input_id":191,"value":null,"order":0,"created_at":"2020-10-07 10:16:33","updated_at":"2020-10-07 10:16:33","post_type_input":{"id":191,"post_type_id":24,"type":"editor","title":"A\u00e7\u0131klama","sefurl":"aciklama","required":0,"grid":12,"right_area":0,"sortable":0,"list_item":0,"only_admin":0,"properties":null,"order":2,"created_at":"2020-05-31 21:12:20","updated_at":"2020-05-31 21:12:20"}}]} Erkan Eren
07 Ekim 2020

Arama motoru botların sitenize gelmeden önce uğradıkları yerdir. Robots.txt dosyası arama motoru botlarına hangi bölümlerin taranması veya taranmaması gerektiğini söyleyen komut dosyasıdır. Arama motoru botlarına bilgi vermek amacıyla  kullanılan dosyadır.

 

Robots.txt Dosyası Nasıl Kullanılır?

 

Allow: / : Tüm sayfaları indexle demektir.

User-agent: * : İndexlemesini istemediğimiz arama motoru botlarını buradan engelleyebiliriz.

Örnek:

User-agent: Googlebot

User-agent: YandexBot 

Burada yapmış oluğumuz işlem ise Google botları ve Yandex botlarının web sitemizi taramaması için kısıtlama veya erişim getirebiliriz.

Disallow: Engellemek istediğimiz dosyayı, sayfayı buradan engelleriz.

Disallow: /örnek* ise URL’mize örnek ile başlayan tüm sayfaları engeller.

Disallow: /*.html$  ile belirli bir dosya türünü engelleyebiliriz.

Örnek:

User-agent: Googlebot

Disallow: /admin

Disallow: /sayfayı.engelle.html

Google botlarına web sitemizde admin ve sayfa.engelle.html sayfasını taramaması için komut göndermiş oluruz.

User-agent:*

Disallow:/Erkan/Eren.html*

Tüm arama motoru botları eren.html dosyasını indexlemeyecektir. Yalnız Erkan dizindeki Eren.html hariç tüm dosyaları tarar ve indexler.

 

User-Agent: *

Allow: /

Disallow: index.php?p=search&search=*

Disallow: /tmp*

Site Haritası: https://www.orneksite.com.tr/sitemap.xml

Site Haritası: https://www.orneksite.com.tr/image_sitemap.xml



Arama motoru botlarına tüm sayfalarımı indexle, site içerisindeki aramaları indexleme ve tmp ile başlayan tüm sayfaları indexlememesi gerektiğini söylemiş oluruz.

Robots.txt dosyamızda site haritası ve image site haritasında yer veririz. Bunun nedeni arama motoru botları robots.txt dosyamıza geldiğinde hangi sayfaları tarayacak, hangi sayfaları taramayacağını açık bir şekilde belirtmemiz gerekir. Bu sayede arama motoru botları web sitemizi daha hızlı taraması için yardımcı olmuş oluruz.

 

Demo Siteler İçin Robots.txt Dosyası Nasıl Olmalıdır?

User-agent: *

Disallow: /

Burada yapmış olduğumuz işlem tüm arama motoru botlarına indeksleme için izin verilse de, ikinci satırda “disallow / ” komutunun verilmesi robot txt folder dissallow anlamına gelir ve web sitesindeki tüm dosyalar böylece indekslenmez.

Bir Web Sitesinde Robots.txt Dosyasını Nasıl Kontrol Ederiz?

Bir web sitesinde robots.txt dosyası olup olmadığını kontrol etmemiz için arama motoru çubuğuna

http://www.greymedya.com/robots.txt 

Yazarak robots.txt dosyası olup olmadığını kolayca görebiliriz.

 

Robots.txt Dosyası Nereye Eklenir?

Robots.txt dosyasını Ftp den ana dizine kolayca ekleyebiliriz.

Wordpress temalar da ise eklenti ile eklenebilir.

Özel yazılım web siteleri için robots.txt dosyasını nasıl ekleriz 4 adımda haydi birlikte ekleyelim…

 

 

  • İlk olarak cpanel’e giriş yapalım.

  • Cpanel’e giriş yaptıktan sonra açılan sayfada Dosyalar menüsünün altında Dosya Yöneticisi’ne tıklıyoruz.

 

  • Daha sonra açılan sayfada sol tarafta Public_html klasörüne tıklıyoruz.

  • Açılan yeni pencerede yükle seçeneğine tıklayıp, yükleyeceğimiz dosyayı seçerek kolay bir şekilde robots.txt dosyasını yükleyebiliriz. Dosya yükleme işlemi artık bitti. 

Web siteniz için arama motoru botlarını çağırabilir veya indexlemesini istemediğiniz arama motoru botlarını engelleyebilirsiniz.

arrow up