Rambler выпустил обновленную версию поисковой машины
Как сообщили сегодня представители пресс-службы Rambler, благодаря закупке новейших серверных систем AMD/TYAN компания получила мощности, необходимые для дальнейшего развития программных алгоритмов.Наличие полной копии всех обработанных Rambler страниц позволяет без потерь провести кардинальные изменения в алгоритмах поиска и индексирования информации, а также ранжирования результатов поиска. Готовится к вводу новый поиск по новостям.
Изменился "паук", или "crawler" - робот, который собирает первичный материал для поисковой системы. Новый робот трудится благодаря новым возможностям масштабирования и распределению нагрузки по серверам. Если до введения в строй нового оборудования его максимальная отдача на пике составляла 4,5 млн. веб-страниц, то теперь он собирает более 6,9 миллионов страниц в сутки. Это означает, что теперь Rambler может быстрее вносить в базу новые страницы и "замечает" изменения на уже знакомых ему веб-сайтах.
Изменилась система индексирования. Новый модуль уже успел установить внутренний рекорд Rambler, обработав за сутки 603 гигабайта документов, хотя и это не предел. Для владельцев веб-ресурсов и пользователей Rambler это означает рост объема индекса и частоты его обновления. В начале нового года компания планирует модернизировать поиск по новостям, обеспечив индексацию ведущих информационных ресурсов с интервалом в два часа.
Кроме того, доработана система ранжирования результатов поиска. Теперь Rambler формирует ответ на поисковый запрос с использованием не только традиционных методов определения релевантности, но и так называемого "коэффициента популярности". Этот коэффициент рассчитывается путем анализа гиперссылок и учета показателей счетчиков рейтинговой системы Rambler's Top100.
Источник: пресс-релиз Rambler.