Три кита новой AI эры. Google, AMD и Huawei меняют правила игры
Google впервые разделил архитектуру своих TPU на отдельные чипы для обучения и инференса, AMD отчитался о рекордном росте и обозначил амбиции на «сотни миллиардов» к 2027 году, а Huawei на фоне ажиотажного спроса после релиза DeepSeek V4 ускоряет развёртывание нового поколения супернод. На этом фоне даже нишевые игроки, такие как Moore Threads, впервые выходят в прибыль, подтверждая тезис, что гонка за умы искусственного интеллекта вступает в новую фазу, где правила переписываются буквально на глазах. Давайте разберёмся, подробнее что произошло.
Google представил 8-е поколение TPU
В конце апреля Google Cloud Next 2026 компания анонсировала сразу два чипа: TPU 8t (специально для обучения моделей) и TPU 8i (специально для инференса). Это первый случай в истории TPU, когда Google отказался от универсальной архитектуры в пользу узкой специализации.
Логика Google понятна рынок AI сместился от «обучаем всё подряд» к «инференс на продакшене». По данным CICC (中国国际金融有限公司), Google впервые также начнёт продавать TPU как физическое оборудование напрямую клиентам, а не только через Google Cloud. Это стратегический поворот, Google становится прямым конкурентом NVIDIA и AMD на рынке AI-акселераторов, а не только облачным провайдером.
AMD отчитался за Q1 2026, рынок взлетел на 16%
5 мая AMD опубликовал квартальные результаты, которые превзошли все даже скромные ожидания:
- Выручка:$10,3 млрд. (+38% г/г);
- Дата-центр: $5,8 млрд. (+57% г/г);
- Прогноз Q2: $11,2 млрд. (консенсус $10,5 млрд);
- Акции: +16% на постмаркете.
AMD заявил о «высочайшей уверенности» в достижении цели «сотни миллиардов долларов» на рынке AI дата-центров к 2027 году. На фоне этого китайские акции AI-чипов взлетели: Haiguang Information (海光信息) - лимит-up 20%, Cambricon (寒武纪) - рост более 10%.
Отдельно стоит отметить, что AMD и Intel поднимают цены на CPU. Потребительские чипы дорожают на 5 — 10%, серверные на 10 — 20%. По данным CITIC Securities, дефицит может продлиться до 2027 года.
Стратегический поворот Google к специализированным чипам и рекордные показатели AMD отражают общую тенденцию рынка: переход от универсальных решений к узкоспециализированным AI-ускорителям. Именно в этом контексте взрывной рост спроса на решения от Huawei выглядит закономерным шагом крупнейших технологических игроков.
Заказы на Huawei Atlas 350 с Ascend 950PR посыпались
На Huawei China Partner Conference 2026 (конец апреля) компания представила ускорительную карту Atlas 350 на базе нового процессора Ascend 950PR. По сравнению с предыдущим поколением, 950PR обеспечивает почти 3х-кратный прирост производительности на операциях низкой точности (FP4/FP8) и поддерживает полный спектр вычислений — от обучения до инференса.
Huawei уже развернула более 500 коммерческих «супернод» Ascend 384 (по 384 чипа Ascend 910C каждая). Следующее поколение Ascend 950 super-node уже на подходе.
После релиза V4 (24 апреля) ByteDance, Tencent и Alibaba обратились к Huawei за дополнительными партиями чипов 950PR. По данным The Information, речь идёт о заказах на сотни тысяч процессоров. Huawei планирует выпустить около 600 000 чипов Ascend 910C в 2026 году и нарастить общую выручку от AI-чипов до $12 млрд. на 60% больше, чем в 2025-м.
Успех Huawei и лавинообразный рост заказов на её чипы свидетельствуют о зрелости китайской экосистемы AI-ускорителей. Менее крупные, но амбициозные игроки также начинают пожинать плоды своих многолетних инвестиций. Яркий пример — Moore Threads, которая после череды убыточных лет наконец зафиксировала чистую прибыль.
Moore Threads первый раз за всю историю вышел в прибыль
Ещё один знаковый milestone, Moore Threads (摩尔线程) впервые заработал прибыль в Q1 2026. Выручка — ¥738 млн. (+155% г/г), чистая прибыль — ¥29,36 млн. Годом ранее компания была в убытке.
Драйвер становится контракт на ¥660 млн. на кластер KUAE (10 000 GPU, полное обучение триллионных моделей) и коммерческое развёртывание флагманского чипа MTT S5000 на архитектуре Pinghu (1000 TFLOPS, поддержка FP8 — FP64).
Впрочем, по итогам 2025 года все четверо «маленьких драконов» китайского GPU (Moore Threads, MetaX, Iluvatar CoreX, Biren Technology) остаются в убытке. R&D-расходы Moore Threads составили ¥1,305 млрд. примерно 86,7% выручки. Коммерциализация идёт, но инвестировать в софт приходится столько же, сколько в железо.
Выход Moore Threads на прибыль — яркий, но лишь один из симптомов фундаментальных сдвигов в отрасли. Если взглянуть на картину шире, можно выделить три главных тренда, которые объясняют, почему это стало возможным именно сейчас.
Три тренда, которые стоит запомнить
Тренд 1: Эпоха специализированных чипов.
Google разделил TPU на обучение и инференс. Huawei делает Ascend 950PR для инференса и 950DT для обучения. Это конец эпохи «один чип на все задачи» — рынок фрагментируется по сценариям использования.
Тренд 2: DeepSeek V4 как катализатор.
Один релиз модели спровоцировал волну заказов на сотни тысяч чипов. DeepSeek доказал: в эпоху инференса модель может быть драйвером спроса на железо так же сильно, как раньше были только облачные гиганты.
Тренд 3: Китайские GPU-стартапы проходят точку безубыточности.
Moore Threads — первый, но не последний. Cambricon (寒武纪) уже вышла в прибыль в 2025 году. Остальные сокращают убытки. Это значит, что экосистема переходит от «инвестируем в R&D на перспективу» к «можем продавать и зарабатывать».
Эти три ключевых тренда формируют совершенно новую реальность на мировом рынке AI-ускорителей, и их влияние уже ощутимо для российских компаний. Сочетание растущей доступности, обостряющейся ценовой конкуренции и быстрого развития программного обеспечения создаёт для России уникальное «окно возможностей».
Как это влияет на российский рынок
Доступность китайских AI-чипов растёт — и это главная новость для России. Три фактора работают в пользу российских покупателей:
- Китайские производители наращивают объёмы. Huawei планирует 600 000 Ascend 910C + новые заказы на 950PR. Moore Threads масштабирует S5000. Когда предложения становится больше, появляются реальные коммерческие предложения, а не только «запишитесь в лист ожидания».
- Ценовая конкуренция усиливается. Google выходит на рынок TPU-железа напрямую. AMD теснит NVIDIA в дата-центре. NVIDIA теряет 100% рынка в Китае. Эта конкуренция на верхнем уровне сегмента давит цены вниз по всей цепочке — включая альтернативные чипы, которые конкурируют за тех, кому NVIDIA недоступна.
- Экосистема софта догоняет железо. DeepSeek V4 работает на Ascend. Moore Threads поддерживает Transformer и MoE на уровне железа. Для российских компаний, которые сомневались в зрелости китайского софта, появляются аргументы ЗА.
Однако глобальный дефицит CPU (AMD/Intel поднимают цены, дефицит до 2027 года) означает, что стоимость серверной инфраструктуры в целом будет расти. Даже если GPU-карта стоит дешевле NVIDIA, сервер под неё — дороже. Это нужно учитывать при расчёте TCO.
Российским предприятиям стоит ускорить пилотные проекты на китайских GPU сейчас — пока объёмы растут, а производители готовы к гибким условиям. Окно «раннего покупателя» закрывается быстрее, чем кажется.
Рынок AI-инфраструктуры переживает фундаментальную трансформацию: на смену универсальным чипам приходят узкоспециализированные решения, что наглядно демонстрируют новые TPU от Google и ускорители Huawei. Этот сдвиг сопровождается беспрецедентным ростом спроса, который уже невозможно удовлетворить только за счёт традиционных лидеров. В результате на авансцену выходят новые игроки, в первую очередь из Китая, чьи экосистемы GPU и AI-чипов стремительно коммерциализируются и достигают зрелости.
Ключевыми драйверами изменений стали фрагментация рынка по сценариям использования, появление новых моделей катализаторов спроса и выход китайских стартапов на прибыльность. Эти тренды не только меняют расстановку сил среди производителей, но и напрямую влияют на доступность и стоимость технологий для конечных пользователей. Для российских компаний это открывает уникальное «окно возможностей», позволяя получить доступ к передовым вычислительным мощностям в условиях дефицита и высоких цен на западные решения.
Однако
при планировании внедрения новых технологий важно учитывать и обратную сторону: глобальный дефицит центральных процессоров и рост цен на серверную инфраструктуру могут нивелировать часть выгоды от удешевления GPU-ускорителей.
Поэтому сейчас для российских предприятий наступает решающий момент: пилотные проекты с китайскими чипами необходимо запускать как можно скорее, чтобы воспользоваться периодом растущего предложения и гибких условий, пока «окно возможностей» не закрылось.