«Почта Mail.Ru» научилась находить вложения по их содержанию

Интернет Веб-сервисы
мобильная версия
, Текст: Татьяна Короткова

«Почта Mail.Ru», проект Mail.Ru Group, научилась находить вложения по их содержанию. Таким образом, отыскать нужный документ в почтовом ящике стало легче, сообщили CNews в Mail.Ru Group.

Порядка 5 млн писем (по внутренним данным компании), проходящих через «Почту Mail.Ru» в сутки, содержат вложения, многие из них — в текстовом формате. Например, документы, презентации, таблицы, подтверждения бронирования, интернет-заказы, счета. Теперь пользователи смогут найти нужный файл, даже если они забыли его название. Кроме того, часто случается так, что файл проще найти именно по содержанию. Для этого нужно ввести ключевые слова из текста документа в строку поиска. «Почта Mail.Ru» не только покажет письмо с найденным файлом, но и подсветит слово, по которому осуществлялся поиск. А если к письму приложено несколько файлов, но ключевое слово содержится лишь в одном из них, пользователю будет показан только нужный файл, рассказали в Mail.Ru Group.

«Название файла далеко не всегда адекватно отражает его содержимое. Еще одна распространенная ситуация — когда пользователи одинаково называют несколько разных файлов. В этом случае поиск только по названию файлов становится неэффективен. Мы сами неоднократно сталкивались c подобной проблемой и рады, что можем предложить пользователям возможность ее решить», — отметил Алексей Сергеев, заместитель вице-президента Mail.Ru Group по стратегическим продуктам.

Увеличить
«Почта Mail.Ru» покажет письмо с найденным файлом и подсветит слово, по которому осуществлялся поиск

По словам представителей компании, поиск по содержимому вложений — достаточно сложная задача с технической точки зрения. Решить её удалось, во-первых, благодаря возможности парсинга офисных документов (.rtf/.doc/.docx, .xls/.xlsx, .ppt/.pptx), которая появилась в «Почте Mail.Ru» в рамках функции онлайн-редактирования документов. Во-вторых, в «Почте» работает технология полнотекстового поиска, основой которой является хранилище индексов, способное менее чем за секунду осуществить поиск по ящикам с миллионом писем практически без использования оперативной памяти.

Поиск по тексту документов работает так же, как и по тексту писем. Если ключевые слова нашлись, «Почта Mail.Ru» отобразит всю информацию о письме c найденным файлом: имя отправителя, тему, дату, путь в почтовом ящике, а также контекст, в котором будет выделено найденное слово. Поиск поддерживается по тексту файлов в форматах .doc, .docx, .xls, .xslx, .txt, .ppt, .pptx., .rtf. Кстати, все документы, которые хранятся в почтовом ящике Mail.Ru, можно посмотреть в разделе «Файлы».