Источник: The Financial Times
Ведущие китайские IT-компании начали обучать свои модели искусственного интеллекта за рубежом, чтобы продолжать работать с чипами Nvidia и обходить американские ограничения, направленные на замедление развития передовых технологий в Китае.
По словам двух источников, знакомых с процессом, Alibaba и ByteDance тренируют новые большие языковые модели в зарубежных дата-центрах, прежде всего в Юго-Восточной Азии. Рост этой практики ускорился после того, как в апреле администрация Дональда Трампа ограничила продажу в Китай специализированных чипов Nvidia H20.
«Выбор очевиден: для обучения самых передовых моделей нужны топовые чипы, и здесь все полностью легально», — говорит оператор одного из сингапурских дата-центров.
Почему обучение уезжает за границу
За последние 12 месяцев модели Qwen от Alibaba и Doubao от ByteDance вошли в число самых производительных LLM в мире. Qwen получила широкое распространение у зарубежных разработчиков благодаря открытому исходному коду.
Сингапур и Малайзия переживают настоящий бум строительства дата-центров — значительную часть спроса создают китайские компании. Многие площадки работают на высокопроизводительных GPU Nvidia, аналогичных тем, что используют американские корпорации для тренировки своих моделей.
По словам источников, китайские компании, как правило, арендуют мощности у дата-центров, которыми владеют некитайские юридические лица. Такая схема стала возможной после того, как Трамп отменил «правило распространения» — норму экспортного контроля времен Байдена, закрывавшую подобные лазейки.
Исключением является DeepSeek — разработчик недорогих и высококачественных моделей ИИ. Компания успела создать крупный кластер Nvidia до вступления ограничений и теперь обучает модели внутри страны. По словам источников, DeepSeek тесно работает с китайскими чипмейкерами во главе с Huawei: инженеры Huawei постоянно присутствуют в штаб-квартире DeepSeek в Ханчжоу, помогая оптимизировать новое поколение китайских ИИ-процессоров. Для Huawei это стратегическая возможность продвигать свои полупроводниковые и программные решения по всей стране.
На Nvidia обучают, на китайских чипах — запускают
Обучение больших языковых моделей требует огромных вычислительных ресурсов, поэтому группы в КНР по-прежнему опираются на топовые GPU Nvidia. Но для стадии «инференса» — работы моделей в режиме ответов пользователям — все чаще используются китайские процессоры, и их доля в общих нагрузках постоянно растет.
Помимо обучения, дата-центры Юго-Восточной Азии служат для обслуживания зарубежных клиентов Alibaba и ByteDance, которые пытаются укрепить позиции на мировом рынке облачных сервисов. Китайские компании параллельно наращивают доступ к дата-центрам на Ближнем Востоке и в других регионах.
Главное ограничение остается прежним: китайским IT-компаниям запрещено вывозить персональные данные пользователей за рубеж. Это означает, что все проекты, где нужно дообучение модели на данных конкретного клиента, обязаны проходить внутри страны.
Alibaba, ByteDance, DeepSeek и Huawei не ответили на запросы о комментариях. Nvidia также отказалась от комментариев.
Подготовлено Profinance.ru по материалам The Financial Times
MarketSnapshot - ProFinance.Ru в Telegram