28 Апреля 2026 Chaitex Андрей 58 0 В избр. Сохранено

Светлая и темная сторона одной архитектуры

На фоне стремительного развития технологий искусственного интеллекта возник острый дефицит памяти, а эпоха AI-агентов неожиданно привела к нехватке CPU. В этом материале мы разбираем, как эти изменения влияют на российский рынок и чего ожидать в ближайшем будущем.

Мнение автора может не совпадать с мнением редакции

Мир делится на CUDA и суверенный стек

За три года NVIDIA потеряла в Китае 40 процентных пунктов — от доминирующих 95% до 55% рынка. Сам Дженсен Хуанг признал это публично:

«Мы потеряли Китай — от 95% до нуля».

По данным IDC, в 2025 году NVIDIA поставила в Китай 2,2 млн. AI-ускорителей, но это уже 55% рынка, а не монополия.

Причина кроется не только в экспортных ограничения США. Пекин с начала 2026 года официально не одобрил импорт H200, китайские таможенники получили указание блокировать поставки. Китай имеет значительную мотивацию для продвижения собственной полупроводниковой промышленности. Китайские компании, которые ещё в 2023 году рассматривали китайские чипы как «крайний вариант», теперь предпочитают их по стратегическим соображениям.

Результат ожидаемый, мир разделился на две экосистемы:

Глобальный CUDA-стандарт: NVIDIA, AMD, Intel, с единой программной платформой;
Китайский суверенный стек: Huawei CANN, Moore Threads MUSA, Iluvatar, MXMACA — десятки совместимых, но не взаимозаменяемых платформ.

Этот раскол сказывается на весь мировой рынок GPU. Страны, которые не могут или не хотят зависеть от NVIDIA, а их становится всё больше, получают реальную альтернативу. Китайские чипы активно экспортируются: в первые два месяца 2026 года экспорт интегральных схем из Китая вырос на 72,6% - до $43,3 млрд, при среднем росте экспорта 21,8%. При этом объём поставок вырос лишь на 14% — то есть средняя цена выросла на 52%. Китай продаёт не дешёвые микросхемы, а дорогие AI-ускорители.

Этот тектонический сдвиг на рынке — не просто статистика. Он напрямую влияет на то, как развиваются технологии и кто задаёт тон в индустрии.

Яркий пример — история Moore Threads. Компания, которая ещё недавно воспринималась как нишевый стартап, сегодня становится полноценным коммерческим вендором и одним из символов новой эры.

Moore Threads скачок от стартапа к коммерческому вендору

Главный событие уходящего апреля, отчётность Moore Threads (摩尔线程, тикер 688795.SH). Компания, вышедшая на IPO в декабре 2025 года, отчитала первый прибыльный квартал в своей истории.

Ключевые показатели завершенного Q1 2026:

Выручка: ¥738 млн. ($101,5 млн), рост +155%;
Чистая прибыль: ¥29,36 млн.;
Годовой отчёт 2025: выручка ¥1,505 млрд. (рост +243%); валовая прибыль ¥987 млн. (рост +218%);
R&D расходы за 2025: ¥1,305 млрд. (86,7% от общей выручки);
Накоплено 2014 патентных заявок, из которых 1743 — на изобретения;
Маржинальность около 69% (второе полугодие 2025).

Флагманский продукт — MTT S5000 на архитектуре «Pinghu» (平湖). Карта достигает 1000 TFLOPS (dense) с поддержкой FP8 — FP64, с аппаратным ускорением Transformer и MoE. По завренениям компании S5000 уже массово поставляется и спрос превышает предложение.

В марте Moore Threads подписала контракт на ¥660 млн. для поставки в кластер «KUAE» (夸娥) - тренировочного кластера уровня 10 000 карт для обучения триллионных параметров моделей. Следующим шагом компания видит построение новой архитектуры «Huagang» (花港) для кластеров уровня 100 000 карт.

MetaX (曦云) также сообщил о своем прогрессе: C600 построен полностью на китайском техпроцессе с существенным приростом производительности и новым HBM-контроллером ожидается в первом полугодии 2026.

Китайский рынок AI-чипов, по прогнозу Frost & Sullivan, вырастет с ¥142,5 млрд. в 2024 году до ¥1,3 трлн. к 2029 — CAGR 54%.

Однако вычислительная мощность — это только половина дела. История успеха любого чипмейкера сегодня пишется не только на кремнии, но и в микросхемах памяти. Как только инженеры научились создавать сверхмощные GPU, индустрия столкнулась с новой, не менее острой проблемой.

GPU есть, а памяти нет

Проблема, о которой говорили с 2024 года, стала реальностью: мировой рынок памяти вошёл в фазу острого дефицита, и главный виновник AI.

SK Hynix отчиталась о рекордной прибыли за Q1 2026 — и предупредила рынок, что дефицит чипов может сохраняться до 2030 года;
Цены на DRAM удвоились с начала 2025 года; HBM поглощает уже 23% всех плафонных пластин DRAM;
Samsung и SK Hynix подписали с OpenAI соглашение о поставке 900 000 пластин DRAM в месяц для проекта Stargate;
IDC прогнозирует падение поставок смартфонов на 12,9% и ПК на 11,3% в 2026 году — производители памяти переключаются на более прибыльный HBM-сегмент.

HBM (High Bandwidth Memory) — ключевой компонент AI-ускорителей, каждый GPU нового поколения требует всё больше памяти:

NVIDIA B200 — 192GB HBM;
GB200 NVL72 — 13.5 TB на стойку.

Потребление HBM растёт экспоненциально, а производственные мощности линейно.

Для рынка серверных решений это означает следующее стоимость GPU-кластера определяется не только ценой чипов, но и доступностью памяти. Вендоры, которые контролируют цепочку поставок памяти — Huawei с собственными HBM-разработками, Moore Threads с китайскими HBM-контроллерами получают дополнительное конкурентное преимущество.

Пытаясь утолить «голод» GPU, индустрия наткнулась на новую стену. Пока все силы были брошены на гонку за терафлопсами и HBM-памятью, незаметно назрел другой, не менее острый дефицит. Эпоха, когда балом правили графические ускорители, породила неожиданного аутсайдера — и теперь уже центральные процессоры становятся главным узким местом.

Эпоха AI-агентов меняет баланс

Вот это поворот: в эпоху, когда все говорят о GPU, дефицитным становится CPU.

Логика проста, но контринтуитивна. AI-агенты главный тренд 2026 года выполняют огромный объём вычислений: маршрутизация задач, управление памятью, координация между моделями. Эти операции выполняются на CPU, а не на GPU. С ростом числа AI-агентов потребность в CPU резко выросла.

Дополнительный фактор: мировые мощности 2 — 3nm литографии перегружены — TSMC и Samsung приоритизируют производство GPU-кристаллов, ущемляя производство CPU. Результат вполне ожидаемый: CPU дефицитны, цены растут, очереди удлиняются.

NVIDIA отреагировала на событие весьма оперативно — выпустила процессор Vera, первый CPU за много лет. Arm пошла ещё дальше компания анонсировала собственный проект разработки CPU-чипов, заключив партнёрства с Meta и OpenAI. Глава Arm Рене Хаас открыто заявил:

В эпоху AI CPU выполняют ключевые вычислительные задачи.

Для российского рынка это очередной важный сигнал: строить AI-инфраструктуру нужно не только с прицелом на GPU, но и с запасом CPU-мощностей — особенно если речь идёт о развёртывании агентных систем.

Полупроводники преодолели $1 трлн: Goldman Sachs говорит о «мультилетнем суперцикле»

По данным Omdia, мировая полупроводниковая отрасль впервые в истории превысила отметку в $1 трлн. годовой выручки. Рост сконцентрирован в сегментах AI-ускорителей и высокопропускной памяти (HBM) — потребительская электроника растёт скромно.

Goldman Sachs прогнозирует, что AI-компании вложат более $500 млрд. в инфраструктуру в 2026 году. Корзина акций инфраструктурных компаний, отслеживаемая Goldman Sachs Research, принесла 44% доходности с начала года — против 9% у широкого рынка. Аналитики банка описывают текущую ситуацию как «мультилетний AI-суперцикл».

TSMC — главный бенефициар: Goldman Sachs прогнозирует рост выручки тайваньского гиганта на 30% в 2026 году. Компания запустила производство по 2нм техпроцессу. TrendForce прогнозирует рост выручки литейных производств на 24,8% — но мощности ограничены, а геополитические риски (Тайвань, экспортные ограничения) остаются фоном для всего рынка.

В России инвестиции в дата центры за период с апреля 2025 по апрель 2026 года достигли 53,5 млрд. рублей (данные TAdviser AI Day 2026). Спрос на вычислительные мощности растёт быстрее, чем инфраструктура успевает строиться — и каждый из описанных выше дефицитов усугубляет ситуацию.

Глобальные тренды — от дефицита памяти и процессоров до миллиардных инвестиций — сходятся в одной точке. И для российского рынка эта точка становится настоящим испытанием на прочность, но вместе с тем открывает и уникальные возможности.

Как эти события влияют на российский рынок

Раскол на две экосистемы — это шанс для российского рынка. Пока мир делится на CUDA и Sovereign Stack, российские заказчики могут выбирать. Китайский стек уже коммерчески зрелый: Moore Threads прибыльна, Huawei CANN открыт, экосистема развивается. Для российских компаний это означает: можно строить AI-инфраструктуру, не завися от NVIDIA легально, с поддержкой и гарантиями.
Экспортный рост китайских чипов — 72,6% меняет мировую карту. Китай больше не только потребитель AI-оборудования, но и экспортёр. Для России это расширяет каналы поставок и снижает риски монополии.
Дефицит памяти — скрытый риск для любых GPU-проектов. Цены на DRAM удвоились, HBM поглощает 23% мирового производства. Планировать GPU-кластеры нужно с учётом доступности памяти — вендоры с контролируемой цепочкой поставок (Huawei Ascend, Moore Threads с китайским HBM) получают преимущество.
CPU-дефицит — фактор, который недооценивают. Эпоха AI-агентов создаёт новый тип нагрузки, где CPU становится bottleneck. Российские компании, планирующие развёртывание агентных систем, должны закладывать CPU-мощности в проект с самого начала.
$500 млрд. инвестиций Goldman Sachs — для российского рынка это и угроза, и возможность. Львиная доля инвестиций идёт гиперростоверам. Для компаний вне этого круга доступ к инфраструктуре становится критическим фактором. Именно поэтому решения, позволяющие строить собственные AI-кластеры на альтернативном оборудовании, приобретают стратегическое значение.

Мировая индустрия искусственного интеллекта столкнулась с парадоксальной ситуацией: на фоне бурного роста вычислительных мощностей и появления всё более совершенных GPU-ускорителей, главным сдерживающим фактором становятся не сами процессоры, а сопутствующие компоненты.

Острая нехватка HBM-памяти, поглощающей всё большие объёмы производственных мощностей, и неожиданный дефицит CPU, вызванный переходом к AI-агентам, превращают создание инфраструктуры из технологической задачи в логистическую.

Для российского рынка это означает, что стоимость и сроки реализации проектов теперь зависят не только от доступности самих GPU, но и от способности выстроить надёжные цепочки поставок памяти и центральных процессоров, что в текущих условиях требует особого стратегического планирования.

Уход от монополии NVIDIA и формирование двух несовместимых миров — глобального CUDA-стандарта и китайского суверенного стека диаметрально меняет правила игры.

Для России это не просто вызов, связанный с санкциями, а стратегическая возможность. Зрелость китайских платформ (например, коммерческий успех Moore Threads) и их готовность к экспорту позволяют диверсифицировать закупки, снизить риски технологической зависимости и строить инфраструктуру на альтернативном оборудовании.

Это шанс для отечественных заказчиков получить юридически чистую, поддерживаемую и гарантированную платформу для развития AI, не оглядываясь на ограничения западных вендоров.

Полупроводниковая отрасль переживает инвестиционный бум: по прогнозам, в 2026 году в инфраструктуру будет вложено более $500 млрд., а спрос на вычислительные мощности в России уже превышает темпы строительства дата-центров.

Однако этот «суперцикл» усугубляет глобальный дефицит, так как производственные мощности литейных заводов, особенно по передовым техпроцессам (2 — 3 нм), ограничены. В результате возникает опасный разрыв: с одной стороны, есть колоссальный спрос и инвестиции, а с другой — физическая нехватка чипов и компонентов.

Для российских компаний это сигнал о том, что доступ к инфраструктуре становится критическим фактором конкурентоспособности, а решения, позволяющие строить собственные AI-кластеры на альтернативном оборудовании, приобретают стратегическое значение для выживания и развития.

Вопросы и ответы

В: Если мир раскололся на CUDA и Sovereign Stack, насколько зрел китайский стек для enterprise-нагрузок в России?

О: Зрелость быстро растёт. Moore Threads обеспечивает Day 0 адаптацию крупнейших LLM, Huawei открыла CANN, поддерживает Qwen 3.5, MiniMax M2.5, GLM-5 из коробки. Главный вызов остаётся в локальной поддержке — но именно этим и занимаются компании-интеграторы, работающие с китайскими вендорами в России. Ключевой аргумент: 10 000-картовый кластер Moore Threads для обучения триллионных параметров моделей — это уже не «подходит для инференса», а полноценное enterprise-решение.

В: Китайские чипы дорожают — экспорт вырос на 72,6% в деньгах при росте объёма всего на 14%. Не становятся ли китайские чипы дороже NVIDIA?

О: Цифры говорят не о росте цен на конкретные модели, а о сдвиге продуктового микса. Китай экспортирует всё больше дорогих AI-ускорителей (Huawei Atlas, Moore Threads S5000) вместо дешёвых микроконтроллеров. Средняя цена выросла на 52% именно потому, что доля высокомаржинальных AI-чипов в экспорте растёт. Для российских заказчиков это хороший знак: китайские вендоры продают не «дешёвую замену», а полноценные решения с рыночной ценообразованием.

Светлая и темная сторона

В избр. Сохранено