Jabse : българската търсеща машина Форуми
Регистрирайте сеТърсенеВъпроси/ОтговориПотребителиПотребителски групиВход
Напишете отговор Страница 1 от 1
Паякът ви подчинява ли се на правила в robots.txt файл?
Автор Съобщение
Отговорете с цитат
Мнение Паякът ви подчинява ли се на правила в robots.txt файл? 
Също така на метатаговете noindex, pragma no-cache и т.н.?

Какъв е "подписа" на паяка ви, т.е. UA, с който се представя?

Също така защо слагате това ограничение "1.1 Сайтът се намира физически на сървър, разположен в България" - има бг сайтове, хостващи в чужбина, така ги орязвате.

"1.2 Сомейнът на сайта е .bg , bg.com, bg.net или bg.org"

още ограничения? Много български сайтове ще останат извън индекса ви...

" Са съществува линк " - просто правописна грешка, както и в горния цитат.

Преценяването на съдържанието на сайта (дали е на български и се отнася към България) много по-добре ще е, ако го направите, взимайки предвид методите, описани тук -
http://www.seochat.com/c/a/Search-Engine-Optimization-Help/Multilingual-Sites-and-Search-Engines-part-1/

и тук - http://www.seochat.com/c/a/Search-Engine-Optimization-Help/Multilingual-Sites-and-Search-Engines-Part-II/

Ето моето ревю и още коментари за търсачката ви, което си позволих да напиша тук - http://inet.blog.bg/viewpost.php?id=11562


_________________
inet.blog.bg
Вижте профила на потребителя Изпратете лично съобщение Изпрати мейла ICQ Номер
Отговорете с цитат
Мнение  
Здравейте,

Много благодаря за вашето ревю - мисля че ще ми е от голяма полза. Ще се опитам да отговоря на повечето въпроси, поставени в него.

1. Домейнът наистина е регистриран през 2005, но до 08.2006 просто използваше Google за търсене и не е бил самостоятелна търсачка.
2. Относно проблема с кирилицата тук http://jabse.com/compare/ - оправен е
3. Относно подреждането на резултатите - най-големия проблем в момента е сравнително малкия брой страници в индекса.
Паякът сканира непрекъснато и в началото на следващия месец ще се появят много нови страници и ще има промени в подреждането.
4. Относно разпознаването на даден сайт като български - целта ми беше да мога да определя дали дадено url е българско, без да трябва
да отворя съответния документ. Съгласен съм, че ако отворя всички документи ще мога по-точно да определя кой е български и кой не,
но по този начин ще се загуби много време за сканиране на сайтове, които няма да попаднат в индекса.
Що се отнася до http://www.russkayagazeta.com/ - домейнът си е сменил IP-то от българско на руско. След време ще отпадне от индекса.
5. За robots.txt - планирам да го взимам в предвид в близко бъдеще.


Ами това е засега

Още веднъж благодаря

Вижте профила на потребителя Изпратете лично съобщение Изпрати мейла
Покажи мнения от преди:
Напишете отговор Страница 1 от 1
Не Можете да пускате нови теми
Не Можете да отговаряте на темите
Не Можете да променяте съобщенията си
Не Можете да изтривате съобщенията си
Не Можете да гласувате в анкети