Разделы

ПО Софт Бизнес Цифровизация Внедрения Инфраструктура Ритейл Общепит Розница Техника

McDonald's отказалась от приема заказов через ИИ. Он добавлял в мороженое бекон и отправлял клиентам наггетсы на сотни долларов

Искусственный интеллект (ИИ) распознавал голосовые заказы в McDonald’s, но вместо воды клал кетчуп и масло либо включал в заказ наггетсы на сотни долларов или добавлял бекон в мороженое. Руководство бизнеса сообщило, что технология однажды все же будет использоваться, но она еще сырая.

Отказ от использования ИИ

Американская корпорация McDonald’s прекратил испытания системы ИИ после неоднократных жалоб клиентов на ошибки в заказах. Об этом в середине июня 2024 г. сообщил телеканал SkyNews.

Компания McDonald’s испытывала систему заказа с ИИ, разработанную компанией IBM, в более чем 100 своих заведениях в США начиная с 2021 г. Технология использует систему распознавания голоса для обработки заказов, но иногда системе не удается распознать голос правильно или верно понять ингредиенты для блюд.

По информации SkyNews, в социальных сетях появились сообщения об ошибках в заказах клиентов. Один клиент получил мороженое с беконом, в другом случае ИИ добавил курицу и клиент получил свой заказ с куриными наггетсами на $213, хотя изначально заказ был на $15.

Масштабный эксперимент с внедрением искусственного интеллекта в систему приема заказов в McDonald's завершился неудачей

В видеоролике, опубликованном на частном канале в социальной сети TikTok под названием «Борьба с роботом McDonald's», женщина пытается заказать ванильное мороженое и бутылку воды у ИИ-помощника. Вместо своего заказа она получила несколько порций мороженого, пакетики с кетчупом, и две порции масла.

«Несмотря на успехи, достигнутые на сегодняшний день, мы считаем, что есть возможность более широко изучить решения для ИИ-помощника, но в будущем», - сообщает компания McDonald’s на своем официальном сайте.

В связи с тем, что McDonald’s решила прекратить партнерство с IBM в области автоматизированного приема заказов (AOT). Эта технология будет отключена во всех ресторанах тестирующих ее в настоящее время, не позднее 26 июля 2024 г.

McDonald’s является лидером в использовании технологий в ресторанах быстрого обслуживания (РБО). Группа внедрила киоски самообслуживания по всей территории США за последние несколько лет и перестроила многие из своих ресторанов, чтобы убрать традиционную возможность обслуживания у стойки. Компания также отметила значительный рост продаж в Великобритании точках McDonald’s, где вид услуги на вынос. Компания заявляет, что уверена в том, что технология ИИ будет частью ее будущего, но не в ближайшее время.

Технология распознавания речи

Распознавание речи - это способность машины или программы распознавать слова, произнесенные вслух, и преобразовывать их в читаемый текст. Рудиментарные программы распознавания речи имеют ограниченный словарный запас и могут распознавать слова и фразы только при четком произношении. Более сложные программы могут работать с естественной речью, различными акцентами и языками.

В распознавании речи используется широкий спектр исследований в области информатики, лингвистики и компьютерной инженерии. Многие современные устройства и программы, ориентированные на работу с текстом, оснащены функциями распознавания речи, что позволяет использовать устройство более легко или без использования рук.

Олег Лексин, начальник ИТ-службы Fix Price в интервью CNews: В первую очередь ритейлерам не хватает российской ERP-системы
Цифровизация

Распознавание речи и распознавание голоса - это две разные технологии, и их не следует путать, ведь распознавание речи используется для идентификации слов в устной речи, а технология распознавание голоса - это биометрическая технология идентификации голоса человека.

Системы распознавания речи используют компьютерные алгоритмы для обработки и интерпретации произнесенных слов и преобразования их в текст. Программа превращает звук, записанный микрофоном, в письменную речь, которую могут понять компьютеры и люди, выполняя следующие четыре действия: проанализировать звук; разбить его на части; перевести его в цифровой формат, пригодный для чтения компьютером; и использование алгоритма для подбора наиболее подходящего текстового представления.

Программное обеспечение (ПО) для распознавания речи должно адаптироваться к изменчивой и контекстно-зависимой природе человеческой речи. Программные алгоритмы, обрабатывающие и преобразующие аудио в текст, обучаются на различных речевых паттернах, стилях речи, языках, диалектах, акцентах и фразах. Кроме того, ПО отделяет разговорный звук от фонового шума, который часто сопровождает сигнал. Для того чтобы удовлетворить этим требованиям, ИТ-системы распознавания речи используют два типа моделей: акустические модели - они отражают взаимосвязь между языковыми единицами речи и аудиосигналами; языковые модели - здесь звуки сопоставляются с последовательностями слов, чтобы различать слова, которые звучат похоже.

Михаил Шишкин, Т-Банк: Найти замену Slack было сложно, поэтому пришлось ее создать
Импортонезависимость

У систем распознавания речи довольно много применений. Смартфоны используют голосовые команды для маршрутизации звонков, обработки речи в текст, голосового набора и голосового поиска. Пользователи могут отвечать на текст, не глядя на устройство. В смартфонах Apple iPhone распознавание речи используется для работы с клавиатурой и виртуальным помощником Siri. Функционал доступен и на дополнительных языках. Распознавание речи можно найти и в приложениях для работы с текстом, таких как Microsoft Word, где пользователи могут диктовать слова для преобразования в текст.

Есть и другие сфера применения технологии в 2024 г., ПО для распознавания речи используется при обучении иностранным языкам. Программа прослушивает речь пользователя и предлагает помощь в произношении. Автоматические голосовые помощники выслушивают запросы клиентов и предоставляют полезные ресурсы. Врачи могут использовать программы распознавания речи для транскрибирования записей в реальном времени в медицинские карты. Софт может использоваться для расшифровки судебных заседаний, что исключает необходимость в человеке-транскрибаторе. Эта технология анализирует определенные голосовые характеристики, чтобы определить, какую эмоцию испытывает говорящий. В сочетании с анализом настроения это позволяет определить, как человек относится к продукту или услуге. Водители используют голосовое управление для громкой связи, например, для управления телефонами, радиоприемниками и системами глобального позиционирования.

Антон Денисенко