COMPUTEX 2026: локальный ИИ‑бум наступил, и он не из облака
ASUS и Supermicro привезли новые стоечные ИИ‑системы. Это вам не игрушки. ASUS RUC-2000, AMD Helios с 72 GPU это не просто «очередной сервер». Это шанс поставить себе локальную ИИ‑фабрику прямо в цеху или на складе. И забыть про облако на месяцы.
Прошлые годы были про облако. Если у тебя 50 пользователей ок, платишь и работаешь. Но тут другое: скорость, приватность, локальная задержка. Всё это теперь решается железом, а не очередным API‑запросом через полмира.
Я к чему. 72 видеокарты это не шутки. Теоретически можно натянуть большие модели, делать inference локально, распознавать видео, контролировать качество на конвейере в реальном времени. Без миллисекундных сюрпризов от сети.
AMD Helios выглядит как зверь. Много GPU, приличная пропускная способность памяти, и вроде бы они нормально проработали поддержку NVLink или его аналогов. Короче, связали всё по‑человечески. ASUS RUC-2000 более компактный. Похоже, для тех, кто хочет поставить стойку рядом с офисом и не тащить всё в дата‑центр.
Цены, конечно, не низкие. Но если у вас фабрика с сотней камер и нужно делать инспекции амортизация окупается. Плюс энергопотребление, охлаждение, место под всё это. Кто думал, что будет легко? Тот, кто не видел плату за электричество.
Но если сравнивать с постоянным облачным трафиком и платой за inference по 0,х центов за запрос иногда локально выходит дешевле. Короче, математика за вами, считайте.
В коридорах говорят, что это начало новой волны. Не просто центры данных, а так называемые «ИИ‑фабрики». Локальные кластеры под конкретные задачи: производство, логистика, медицина, розница. Локально значит данные не уезжают к кому‑то. Плюс для конфиденциальности и для тех, кто под регуляцией.
Минус: нужно кого‑то, кто это установит и поддержит. Тут как раз Supermicro и ASUS предлагают готовые наборы. Чтобы системщики не выдумывали велосипед.
По софту это всегда геморрой. Железо есть. Но чтобы заставить его работать с вашим пайплайном, надо портировать модели, оптимизировать под конкретные GPU, смотреть на драйвера, контейнеры, оркестрацию. И да, если думаете, что возьмёте модель «из облака» и она просто поедет на 72 GPU не факт.
Но возможности большие. Кто‑то из стартапов уже показывал демки для инспекции на линии. Говорят, задержка упала в 5–10 раз по сравнению с облаком.
В общем, если у вас производство, логистика или большие данные, и вы устали платить облаку присмотритесь. Если вы маленький стартап с одним сервером в офисе может, не нужно брать 72 GPU прямо сейчас. Возьмите что‑то поменьше и понаблюдайте.
Железо мощное. Идеи простые локальная ИИ‑фабрика для реального сектора. А дальше: кто быстрее внедрит и кто сможет прикрутить софт без месячных плясок с бубном.