Разделы

Наука Цифровизация Бизнес-приложения

Поисковики стараются "перегуглить" лидера

Одна компания уверена, что поисковая машина может каталогизировать «мировую паутину» более полно, другая полагает, что ей лучше известно, какая информация на самом деле нужна конкретному пользователю, третья прилагает все усилия, чтобы разобраться, как именно человек формирует информационные запросы. Как новички, так и признанные лидеры, как, например Google, упорно ищут новые решения поиска и отбора информации — решения, которые должны произвести очередную революцию в интернет-поиске.

«Невидимая» информация

Пользователи, которые считают, что какая-то поисковая машина, например, популярный Google, охватывает весь интернет, — сильно ошибаются. Как сообщает CNN.com, по мнению экспертов, современные поисковые машины охватывают всего лишь около 1% той информации, которая в действительности находится в Сети. Причина этого — несовершенство методов нахождения и регистрации онлайн-ресурсов. В то же время интернет буквально «замусорен» системами поиска, которые оказались неэффективными и неспособными привлечь интерес потенциальных инвесторов.

Необходимо отметить, что для поисковых машин практически «невидимой» остается информация, находящаяся в базах данных, недоступных для индексации поисковыми роботами (indexing crawlers). К числу таких «закрытых» источников относятся, например, отчеты правительственных организаций или архивы (здесь имеются в виду именно архивы в публичном доступе) большинства периодических печатных изданий.

Другая проблема — неспособность поисковых систем адекватно работать с сайтами, которые построены на принципе изменения в зависимости от интересов пользователя, как, например, в случае выбора того или иного цвета машины на сайте Cars.com. Для того чтобы решить эту проблему, одна из компаний уже разработала программу, которая будет автоматически работать с простыми онлайн-формами, требующими поэтапного заполнения.

Где лежит основная задача и что делать?

Компания StreamSage Inc. использует технологию распознавания текста запроса, что позволяет ее «двигателю» осуществлять более дискретный и более релевантный поиск, выдавая последовательные «порции» информации, в случае работы с «длинным» запросом.

Один из лидеров — Yahoo Inc. предлагает свой путь решения проблемы «невидимого интернета»: бизнес может платить за индексацию сайтов в каталоге поисковой машины.

Однако индексация рождает новую проблему — определение релевантности запросу именно данного документа среди миллионов отвечающих тем же параметрам. Поэтому многие разработчики считают, что основная задача лежит именно в области персонализации поисковой машины с учетом требований конкретного пользователя.

Как пишет CNN.com, компания Eurekster Inc., основанная в январе этого года, решила объединить поисковую систему с «общественной сетью», в которую входят ваши друзья, знакомые, знакомые знакомых и т.д. Идея состоит в том, что вы с большой долей вероятности будете искать то же самое, что и ваши знакомые, ввиду общности интересов. Используя это, можно значительно сузить круг поиска и увеличить релевантность ответов на запрос.

Как с помощью ad-hoc инструмента снизить расходы на внедрение аналитики
Импортонезависимость

Ведущие компании используют и такой способ определения интересов конкретного пользователя, как анкетирование при регистрации. Это, в частности, позволяет «локализовать» его в пространстве и выдать информацию, которая будет наиболее соответствовать интересам пользователя в конкретный момент. С этой точки зрения, у поисковых систем Yahoo или America Online есть серьезное преимущество перед Google.

Идеал: библиотечный поиск?

Программисты Microsoft уверены, что пользователю нужны не горы документов, а конкретная фактическая информация, и на запрос «День рождения Мэрилин Монро» должен выводиться четкий и конкретный ответ «1 июня 1926 г.», а не сайты о ее знаменитом представлении «С днем рождения, мистер президент».

Принцип библиотечного поиска — «вот ряд книг, в которых может быть то, что вы ищете» — отнимает у человека слишком много времени и не гарантирует конечный результат, а значит, неэффективен. Необходимо следовать принципу «позвольте, я просмотрю эти книги и найду то, что вы ищете», считают в Microsoft.

Александр Бабкин, Газпромбанк: Сейчас иностранные ИБ-решения в Газпромбанке замещены на 65%
безопасность

Компания Mooter, как заявляет CNN.com, пытается определить взаимосвязь конкретного запроса с подтемами, которые могут в той или иной мере интересовать пользователя. Так, запрос «отдых в Испании» может предполагать, помимо информации о стоимости отелей, также и предупреждения о террористической угрозе.

Однако существование столь значительного числа компаний, которые занимаются разработкой поисковых систем, не означает начало «заката» Google. Компания не стоит на месте и ведет активный поиск новых идей и решений, которые позволят ей не только сохранить свою позицию лидера, но и закрепить ее в будущем. Одно из ноу-хау — система Google WebQuotes, которая размещает в листинге сайтов комментарии других пользователей, что дает более объективную оценку того или иного сайта.

Екатерина Соловьян / CNews.ru