Разделы

Бизнес Кадры Интернет Веб-сервисы

«Яндекс» запустил онлайн-курс про разметку данных на платформе Сoursera

С сегодняшнего дня пятинедельный курс «Яндекса» «Practical Crowdsourcing for Efficient Machine Learning» бесплатно открыт для слушателей из любой точки мира. Он рассказывает о том, что такое краудсорсинг, как с его помощью можно быстро получать и размечать большие объемы данных, решать сложные бизнес-задачи, например, тестировать функциональность сервисов.

Чтобы пройти курс Practical Crowdsourcing for Efficient Machine Learning, нужно зарегистрироваться на платформе Сoursera. Лекции проходят на английском языке, сопровождаются русскими субтитрами и не требуют специальной подготовки. Курс рассчитан на пять недель.

Онлайн-курс будет полезен людям, которые работают с большими данными — разработчикам машинного обучения, аналитикам данных, исследователям и менеджерам, работающим с искусственным интеллектом. Он пригодится как практикующим специалистам, так и студентам. Понимание краудсорсинга создаст конкурентное преимущество на рынке труда для специалистов, а владельцы бизнеса получат возможность без дополнительных затрат развивать внутри компании экспертов, способных ускорять решение однотипных формализуемых задач и экономить бюджет.

Пройдя онлайн-курс Practical Crowdsourcing for Efficient Machine Learning, слушатели получат знания о возможностях разметки и генерации больших массивов данных с помощью краудсорсинга, его основных компонентах. Курс содержит практическую часть, в рамках которой студенты смогут выполнить один из трех проектов на выбор. Проекты основаны на реальных задачах для машинного обучения — классификации запросов и определении релевантности результатов поиска, распознавании и выделении объектов на фотографиях, транскрипции аудиофайлов в текст.

Большая часть задач внутри машинного обучения требует ручной разметки данных. Краудсорсинг — особый способ организации процессов по сбору и обработке данных, когда крупная задача делится на мелкие формализованные шаги. При этом с помощью разных методов контроля качества выстраивается процесс, устойчивый к ошибкам отдельных исполнителей.

Краудсорсинг позволяет обрабатывать крупные объемы информации в короткие сроки, поставляя размеченные данные, например, для обучения нейросетевых алгоритмов: компьютерного зрения, обработки естественного языка, информационного поиска, речевых технологий и т.д.

Разработчик российской ОС подвел итоги года
Бизнес

Кроме того, краудсорсинг помогает решать сложные бизнес-задачи, внутри которых есть однотипные формализуемые действия, например, модерировать контент или тестировать функциональность сервисов. С этим методом уже работают Facebook, NASA, Netflix, Ozon, Тинькофф, ЦИАН и другие компании.

«Яндекс» использует краудсорсинг более 10 лет, сформировав собственный подход к работе с ним и отдельное направление методологии и исследований, направленных на более эффективное использование его техник.

Сотрудники «Яндекса» делились своим опытом на крупнейших конференциях по машинному обучению — KDD, SIGMOD, CVPR, WSDM, NeurlIPS. В 2019 году Яндекс представил курс «Сбор и обработка данных при помощи краудсорсинга», который входит в программу Школы анализа данных и Факультета компьютерных наук НИУ ВШЭ. Обучение по этой программе у специалистов Яндекса прошли более тысячи специалистов.

Владимир Бахур