Хозяева Facebook** и Instagram*** тестируют собственные чипы для нейросетей. Они уменьшат расходы на инфраструктуру
В компании Meta* (компания признана экстремистской организацией на территории России) приступили к обучению нейронных сетей с фирменными чипами. Пока обучение осуществляется с использованием небольшого количества чипов, но в случае успеха руководство компании намеревается запустить данные чипы в массовое производство. Ожидается, что переход на компоненты собственной разработки позволит Meta снизить расходы на содержание своей вычислительной ИТ-инфраструктуры.
Тестирование чипов
В Meta* (компания признана экстремистской организацией на территории России) приступила к тестированию чипов для искусственного интеллекта (ИИ) собственной разработки, пишет Reuters. Это важный шаг в стратегии компании, направленной на снижение зависимости от внешних поставщиков, в частности Nvidia.
По данным источников Reuters, Meta запустила ограниченное испытание нового чипа и планирует расширить его использование в случае успешного тестирования. Разработка собственных ИИ-чипов является частью долгосрочного плана компании, который должен сократить расходы на ИТ-инфраструктуру. Поскольку руководство Meta планирует и дальше активно вкладывать средства в развитие ИИ-технологий. Общие расходы компании на 2025 г. оцениваются в $114-119 млрд, из которых до $65 млрд запланировано именно на ИИ.
Новый чип является специализированным ускорителем для работы с ИИ, что делает его более энергоэффективным по сравнению с графическими процессорами (GPU), которые обычно используют для таких задач. Производством занимается тайваньская компания Taiwan Semiconductor Manufacturing Company (TSMC).
Первый тестовый образец Meta получила после завершения стадии tape-out — это критический этап в разработке ИИ-чипов, когда готовый дизайн отправляют на производство. Процесс стоит десятки миллионов долларов и занимает от трех до шести месяцев, однако не гарантирует успеха. В случае неудачи инженеры компании Meta будут вынуждены дорабатывать дизайн и повторять процедуру уже повторно.
Опыт Meta в производства чипов
Новый чип от Meta продолжает серию Meta Training and Inference Accelerator (MTIA), которую компания-разработчик развивает несколько лет. Ранее Meta уже выпустила чип для инференса — процесса выполнения ИИ-задач в реальном времени, например, для рекомендаций в Facebook** (принадлежит организации Meta, которая признана экстремистской на территории России) и Instagram*** (принадлежит организации Meta, которая признана экстремистской на территории России). Руководство компании планирует начать использование собственных чипов для обучения ИИ к 2026 г., сначала в системах рекомендаций, а затем и для генеративного ИИ, такого как чат-бот Meta AI.
Meta уже имела неудачный опыт с собственным чипом для инференса, который не оправдал ожиданий, после чего компания в 2022 г. вернулась к заказу графических процессоров Nvidia на миллиарды долларов. С тех пор Meta остается одним из крупнейших клиентов Nvidia, используя ее GPU для обучения моделей, в частности рекламных алгоритмов и языковой модели Llama.
В 2025 г. перспективы использования графических процессоров для масштабирования ИИ вызывают сомнения среди исследователей. Запуск в январе 2024 г. нейронной сети с использованием малобюджетных ИИ-чипов вызвал падение акций Nvidia. Хоть компания Nvidia и вернула большую часть утраченных позиций на фондовом рынке, вопрос дальнейшего развития ИИ-чипов остается открытым.
Заказ ИИ-чипов у поставщиков
В 2024 г. графические процессоры Nvidia Blackwell B200 AI вызвали ажиотаж на рынке после того, как стало известно, что Meta разместила первоначальный заказ на эти чипы. Известно, что Meta стала первой крупной технологической компанией, разместившей заказ на B200. Однако финансовый директор Nvidia Колетт Кресс (Colette Kress) заявила, что массовое производство чипов Blackwell начнется не ранее 2025 г., что может указывать на то, что в ближайшее время заказы будут небольшими.
Meta давно является ключевым партнером Nvidia на рынке ИИ и одним из ее крупнейших клиентов. Известно также, что руководство во главе с Марком Цукербергом (Mark Zuckerberg) намерено использовать возможности Blackwell для обучения своей большой языковой модели.
Что касается характеристик самого чипа B200, то он включает в себя 160 SM на 20 480 ядер, также анонсирована поддержка обновленного NVLink (высокопроизводительная компьютерная шина) для масштабирования до 8 GPU, 400 GbE сетевого коммутатора и восьми канальной памяти HBM3e объемом 192 ГБ. Новинка обеспечивает 30 кратный прирост производительности по сравнению с Nvidia H100 для рабочих нагрузок, связанных с большими языковыми моделями, а она до 25 раз более экономична и энергетически эффективна. Кстати, архитектура GPU Blackwell получила название в честь математика Дэвида Блэквелла (David Blackwell).
*Meta (компания признана экстремистской организацией на территории России).
**Facebook (принадлежит организации Meta, которая признана экстремистской на территории России).
***Instagram (принадлежит организации Meta, которая признана экстремистской на территории России).