Интернет Веб-сервисы

06 Октября 2023 13:03 06 Окт 2023 13:03 |

Бизнесу доступен сервис «Сбера» для проверки и корректуры текстов с помощью технологий ИИ

«Сбер» представил новый сервис для бизнеса. Он представляет собой инструмент для проверки орфографии в текстах на русском языке, работающий на основе нейросетевой генеративной модели. Решение может быть использовано бизнесом для корректуры текста любой длины и формата — в копирайтинге и редактуре, при создании маркетинговых и рекламных материалов, в работе редакций СМИ. Сервис разработан партнёром «Сбера» компанией SberDevices и доступен в каталоге AI Services на платформе ML Space для зарегистрированных пользователей.

Денис Филиппов, вице-президент по цифровым поверхностям «Салют» Сбербанка, сказал: «Современные модели на основе искусственного интеллекта предоставляют всё больше возможностей для текстовой редактуры. С помощью представленного решения можно обработать любой текст, переписав его без ошибок, использовать генеративные возможности моделей для коррекции правописания в текстах различных доменов. Инструмент может стать ИИ-помощником в различных информационных проектах и поможет быстро и качественно исключить орфографические ошибки в текстах, сэкономив время и ресурсы».

ИИ-лаборатории уже превратились в ИИ-фабрики

внедрения

Перед командой разработчиков стояла задача изучить и решить проблемы корректуры правописания с помощью генеративных моделей. Результатом стала разработанная методология генеративной коррекции орфографии для русского языка, которая показывает качество уровня SOTA на задаче проверки орфографии. По итогам работы выпущены: библиотека SAGE с открытым исходным кодом (лицензия MIT), семейство предобученных генеративных моделей (ruM2M100-1.2B, ruM2M100-418M, FredT5-large-spell, T5-large-spell) для корректуры правописания на русском и английском языках и хаб с размеченными данными для задачи коррекции орфографии в текстах разных доменов.

На данный момент представленный инструмент опережает по качеству открытые решения для русского языка и проприетарные модели конкурентов. Существенный прирост в метриках относительно других решений является следствием разработанной методологии. Было предложено два метода аугментации ошибок для воспроизведения естественных человеческих опечаток и орфографических ошибок в текстах. С помощью этих модулей был создан корпус текстов с ошибками (около 7 ГБ), на котором обучались генеративные модели M2M100 и FredT5-large. Второй этап заключался в дообучении моделей на комбинации собранных параллельных датасетов для исправления орфографии. Лучшая конфигурация полученного решения представлена в виде ИИ-сервиса на платформе ML Space.

Лучший российский софт для видеосвязи: ищем замену Teams и Zoom

Подписаться на новости

Короткая ссылка

Бизнесу доступен сервис «Сбера» для проверки и корректуры текстов с помощью технологий ИИ

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

VPS

S3-хранилище

ИТ-безопасность

CRM

Техника

Как техника Apple и Samsung калечит людей: скрытая угроза

Самые необычные смартфоны в 2026 году: выбор ZOOM

Самые полезные гаджеты при отключениях электроэнергии: выбор ZOOM

Наука

Ученые выяснили, что при недостатке сна мозг запускает странную «очистку»

Когда и как водород попал на Землю? Крупнейший на планете резервуар — прямо у нас под носом

Почему наступают ледниковые периоды? Ученые назначили козлом отпущения Марс

Топ-10
ИТ-трендов
в России на 2026 г.

Топ-10 решений для видеоконференцсвязи

Топ-10 решений для видеоконференцсвязи

Топ-10
ИТ-трендов
в России на 2026 г.

Студентам говорят «используй ИИ при написании диплома, только объясни,
где,
как и для чего»

Чем дольше тянешь с уходом от SAP,
тем дороже внедрение

Бизнесу доступен сервис «Сбера» для проверки и корректуры текстов с помощью технологий ИИ

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

VPS

S3-хранилище

ИТ-безопасность

CRM

Техника

Как техника Apple и Samsung калечит людей: скрытая угроза

Самые необычные смартфоны в 2026 году: выбор ZOOM

Самые полезные гаджеты при отключениях электроэнергии: выбор ZOOM

Наука

Ученые выяснили, что при недостатке сна мозг запускает странную «очистку»

Когда и как водород попал на Землю? Крупнейший на планете резервуар — прямо у нас под носом

Почему наступают ледниковые периоды? Ученые назначили козлом отпущения Марс

Топ-10 ИТ-трендов в России на 2026 г.

Топ-10 решений для видеоконференцсвязи

Топ-10 решений для видеоконференцсвязи

Топ-10 ИТ-трендов в России на 2026 г.

Студентам говорят «используй ИИ при написании диплома, только объясни, где, как и для чего»

Чем дольше тянешь с уходом от SAP, тем дороже внедрение

Топ-10
ИТ-трендов
в России на 2026 г.

Топ-10
ИТ-трендов
в России на 2026 г.

Студентам говорят «используй ИИ при написании диплома, только объясни,
где,
как и для чего»

Чем дольше тянешь с уходом от SAP,
тем дороже внедрение