Разделы

Открытое ПО

Yandex Cloud выложила нейросеть для мониторинга экосистемы Байкала в открытый доступ

Облачная платформа Yandex Cloud опубликовала исходный код алгоритма машинного обучения для экомониторинга Байкала. Технология помогает анализировать пробы воды: определять и классифицировать содержащиеся в ней микроорганизмы. Теперь биологи и ML-специалисты по всему миру смогут использовать нейросеть для разработки собственных систем мониторинга водоемов и отслеживать важные экологические тренды. Алгоритм опубликован на GitHub по открытой лицензии Apache 2.0.

В открытый доступ выложены датасеты, модели машинного обучения и документация для мониторинга. Такой набор поможет тестировать гипотезы по детекции, сегментации и классификации объектов в разных научных проектах. В частности, разработчики смогут выявлять проблемы в балансе микроорганизмов водных объектов, и следовательно — помогать сохранять водоемы в неизменном состоянии дольше.

Изначально нейросеть разрабатывалась для проекта «Точка №1», который длится с 1945 г. Ученые НИИ биологии Иркутского государственного университета более 75 лет анализируют фито- и зоопланктон Байкала для мониторинга состояния озера вручную. Нейросеть помогла автоматизировать и ускорить весь цикл исследований. Сейчас алгоритм умеет работать с 70 формами планктона и продолжает обучаться в облачном сервисе для разработки и эксплуатации ML-алгоритмов Yandex DataSphere. В создании технологии также участвовали компания MaritimeAI и Фонд поддержки прикладных экологических разработок и исследований «Озеро Байкал».

О том, как ученые и разработчики прошли путь от решения локальной задачи на Байкале до выкладки нейросети в опенсорс, рассказывает документальный фильм. В основе сюжета — беседы со специалистами НИИ биологии, разработчиками MaritimeAI и сотрудниками «Яндекса». Участники рассказали, почему иногда непросто найти общий язык людям из науки и ИТ, как они боролись с основными сложностями в проекте, и зачем облачные технологии и искусственный интеллект решают научные задачи. Фильм «Двенадцать тысяч проб» можно бесплатно посмотреть на канале «Яндекса» на YouTube и «Кинопоиске».

«Доступность технологий — один из наших ключевых приоритетов. «Яндекс» не только систематически выкладывает в опенсорс свои собственные решения, но и помогает развивать открытый исходный код в совместных проектах со сторонними разработчиками. «Яндекс» является лидером среди российских компаний по вкладу в опенсорс, по данным ossindex. Публикуя алгоритм экомониторинга с MaritimeAI, мы продолжаем следовать нашим главным принципам. Разработка поможет не просто решить задачу конкретной научной группы, а тестировать гипотезы о состоянии водных объектов повсюду. Ведь Байкал — далеко не единственное место на планете, где ведется подобный мониторинг», — сказал Алексей Башкеев, руководитель платформы Yandex Cloud.

Также компания представила документальный фильм о проекте.