В Московском Политехе представили эффективный метод защиты электронной почты от нежелательных сообщений
В Московском Политехе докторант третьего курса обучения кафедры «Криптология» Ташкентского университета информационных технологий имени Мухаммада ал-Хоразмий Шерзод Хамидов представил инновационный ансамблевый метод повышения эффективности защиты почтовых сервисов от нежелательных сообщений. Об этом CNews сообщили представители Московского Политеха.
Электронная почта является одним из наиболее широко используемых средств коммуникации в современном мире. Помимо обмена сообщениями, она используется для хранения данных, синхронизации устройств и создания учетных записей на различных онлайн-сервисах, включая платежные системы и онлайн-банкинг. Однако эта популярность также привлекает внимание киберпреступников, которые рассылают нежелательные и вредоносные письма с целью кражи конфиденциальной информации и получения доступа к учетным записям пользователей.
Ансамблевый подход в машинном обучении заключается в комбинировании нескольких моделей классификации для повышения точности и надежности результатов. В случае защиты электронной почты от спама и вредоносных писем, ансамблевый метод позволяет использовать преимущества различных алгоритмов классификации, компенсируя их недостатки и повышая общую эффективность системы.
В отличие от традиционных методов защиты, таких как фильтрация по ключевым словам или черные списки отправителей, ансамблевый подход, предложенный Шерзодом Хамидовым, учитывает множество характеристик электронных писем, включая структуру и содержание текста, метаданные и поведенческие паттерны отправителей. Это позволяет более точно идентифицировать нежелательные сообщения и минимизировать количество ложных срабатываний.
Особое внимание в разработанном методе уделяется предварительной обработке текстовых данных, которая включает в себя токенизацию (разбиение текста на отдельные слова или токены), удаление стоп-слов (наиболее часто встречающихся и не несущих смысловой нагрузки слов), стемминг (приведение слов к их основе) и векторизацию (представление текста в виде числовых векторов для машинного обучения).
«Наш ансамблевый метод показал высокую эффективность в задаче классификации электронных писем, превосходя существующие решения по точности и скорости обработки данных, — отметил Шерзод Хамидов. — Он может быть легко интегрирован в почтовые сервисы и системы защиты от спама, обеспечивая надежную защиту пользователей от фишинговых атак, кражи личных данных и финансовых потерь».