В обойме единственного независимого сервиса по оценке качества поисковых систем появился новый анализатор. Он называется "анализатор полноты индексов". Каков принцип его работы? По большинству частотных и среднечастотных запросов любая поисковая машина выдает сотни тысяч результатов. Однако, реальный размер поискового индекса у разных поисковиков может отличаться в несколько раз. Его истинный размер - это важный критерий мощности поисковой машины, частоты и объема индексации. Чем больше в индексе документов, тем больше будет ответов на поисковый запрос. Это особенно важно, если запрос низкочастотный.
Определить истинный размер базы непросто. Доверять заявлению самого поисковика о том, что по запросу найдено N документов, нельзя. В одних поисковых машинах считаются только документы, где есть все заданные в запросе слова, а кто-то считает все документы, где встретилось хотя бы одно слово из запроса. Каждый поисковик стремится создать у пользователя ощущение большого количества найденных страниц. Это маркетинговый ход.
Поэтому был выбран наиболее простой и надёжный способ анализа полноты поисковой базы по редким запросам. Был построен набор редких запросов, по каждому из которых поисковики выдают не более нескольких десятков результатов. Анализатор раз в сутки проверяет все поисковики на предмет того, сколько страниц найдёно каждым поисковиком по каждому запросу.





4-03-2012, 19:00

