Мир высоких технологий уже не первый год наблюдает довольно стремительную гонку искусственного интеллекта — крупные компании стремятся сделать большую языковую модель, которая будет точнее отвечать, лучше понимать контекст, быстрее генерировать ответ, лучше программировать, генерировать изображения или видео.
Естественно, в наши дни эта гонка никуда не делась — новые версии LLM с рекордами в бенчмарках выходят с завидной частотой. Но теперь к «гонке моделей» добавилась ещё и «гонка железа» — вычислительные мощности стали узким горлышком ИИ-рынка. И тот, у кого этих мощностей будет больше, в долгосрочной перспективе победит конкурентов. Почему? Сейчас объясню.
Неважно, кто умнее. Важно — у кого видеокарты
Если вы хотя бы мельком следите за новостями из мира высоких технологий, то могли заметить возросшее количество публикаций о том, что гиганты рынка довольно активно инвестируют впечатляющие суммы в инфраструктуру центров обработки данных, работающих с ИИ. Например, по информации издания MarketWatch, Alphabet, Amazon, Meta и Microsoft только в 2026 году планируют потратить на работу в этом направлении 650 миллиардов долларов — огромные средства, которые необходимы, чтобы сохранять за собой лидирующие позиции в мире, где без ИИ, кажется, уже ничего не работает и работать не будет.
При этом ещё года три назад подобные суммы в новостях не фигурировали даже близко — что же изменилось? А изменилось на самом деле очень многое — во-первых, большие языковые модели стали действительно большими, если не сказать огромными.
В далёком 2018 году, когда в интернете впервые начало мелькать упоминание LLM, компания OpenAI, один из лидеров индустрии, представила GPT-1 — модель с 117 миллионами параметров, которую обучили на объёме данных в 4,5 ГБ. Сейчас, по оценкам специалистов, GPT-5.5 оценивается в диапазоне от 8 до 10 триллионов параметров (OpenAI начиная с 2023 года перестала предоставлять официальные данные), а Gemini 3.1 Pro построена на базе 1,5-2 триллионов параметров. Да, гиганты рынка перешли на архитектуру Mixture of Experts, которая позволяет огромной модели содержать большое количество параметров, но при этом использовать лишь их часть для ускорения работы, но факт остаётся фактом — размеры LLM раздуваются катастрофическими темпами.
Во-вторых, изменились сценарии применения искусственного интеллекта. Пять-восемь лет назад ИИ находился лишь в рамках чат-бота или специальных сервисов для генерации контента (в большей степени текстового, реже — графического), умел очень мало и выглядел скорее игрушкой, нежели реальным инструментом. Сейчас ИИ применяют повсеместно — алгоритмы программируют, анализируют большие базы данных, генерируют аудио и видео с очень высоким качеством, составляют краткие пересказы информации, улучшают качество звука в рамках видеозвонков. Да и ИИ-агенты развиваются семимильными шагами — они уже пробрались в ваш компьютер и помогают выполнять различного рода задачи, кликая курсором вместо человека. Естественно, на всё это нужно гораздо больше ресурсов и вычислительных мощностей.
И, в-третьих, ИИ банально созрел для корпоративного рынка. Да, на заре формирования ИИ не вызывал особого интереса и не внушал доверия, так что банки, корпорации, большие компании, то есть те, кто могут принести реальную прибыль, применяли привычные для себя инструменты. Сейчас ИИ используют для оптимизации рабочих процессов, в кибербезопасности, роботизации, в финансовой сфере и многих других направлениях. Это приносит всё больше и больше денег, позволяя в будущем выйти в плюс (об этом чуть позже).
Соответственно, мастодонты ИИ-рынка просто вынуждены масштабироваться — им нужны мощные центры обработки данных по всему миру, нужно очень много графических ускорителей, чипов памяти, процессоров и даже электроэнергии. Но, естественно, столь ценных ресурсов на всех не хватает — спрос на данный момент сильно превышает предложение. Не просто так NVIDIA зарабатывает десятки миллиардов долларов в год, а производители NAND- и DRAM-памяти взвинтили цены в три-четыре раза. Желающих купить мощное «железо» для своего ИИ-ЦОДа гораздо больше, чем тех, кто может это «железо» выпустить.
И тот, кто сможет сформировать продуманную цепочку поставок, победит конкурентов в сражении за мощности — потому что какая разница, насколько твоя LLM лучше, чем решение оппонента, если у тебя недостаточно вычислительных ресурсов для её инференса (процесс использования уже обученной LLM для генерации контента) и удовлетворения запросов потребителя? Кроме того, что довольно примечательно, на фоне новой гонки за GPU-мощности отношение к этому самому потребителю планомерно смещается в сторону коммерциализации.
Гиганты рынка начали считать деньги
Суть в том, что изначально абсолютно все крупные игроки ИИ-рынка вкладывали колоссальные средства в субсидирование привлекательных для аудитории технологий — они банально «сжигали деньги», чтобы привлечь пользователей в свои сервисы. Ярче всего это проявлялось в разрезе платных подписок. Допустим, пользователь приобретал подписку Claude Pro от Anthropic за 20 долларов в месяц (что по меркам современного мира не так уж и дорого), получая при этом определённые лимиты на количество запросов, а также доступ к самым передовым моделям. И если этот юзер активно использовал возможности ИИ, он мог без проблем потратить токенов на 50, 100 или даже 200 долларов за месяц эксплуатации.
Аналогичная ситуация наблюдалась с Perplexity AI Pro, ChatGPT Plus и платной подпиской Cursor (ИИ-редактор кода). Активные пользователи покупали тир за 10-20 долларов, получая взамен в 5-10 раз больше «ресурсов» искусственного интеллекта, чем если бы они платили за использованные токены посредством API (сценарий, когда пользователь платит не за фиксированное количество запросов, а за реально израсходованные входящие и исходящие токены). Такие предложения в период с 2023 по 2025 год были буквально вынужденным решением — лидерам рынка необходимо было демонстрировать рост пользовательской базы, попутно собирая данные для дообучения своих LLM. И, естественно, таким образом ИИ-гиганты вырабатывали у пользователей привычку жить с чат-ботами на расстоянии вытянутой руки.
Тем более, что, по мнению экспертов, с течением времени из-за развития вычислительных мощностей и масштабирования инфраструктуры стоимость инференса ИИ должна была значительно снизиться. Вот только этого не произошло, так как новые умные модели наоборот стали ещё более дорогими — на их работу нужно больше ресурсов, что приводит к дополнительному наращиванию расходов, возложенных на плечи гиперскейлеров. Соответственно, компании перестали «сжигать деньги» — теперь лидеры рынка их очень даже умело считают, планомерно переходя к следующему этапу развития ИИ.
Например, компания Microsoft, по информации инсайдеров, решила в корне изменить механизм монетизации своего ИИ-инструмента GitHub Copilot. Если раньше юзер приобретал подписку и получал определённое количество запросов, то в обозримом будущем всех планируется перевести на оплату токенов. Сколько потратил ресурсов ИИ — за столько и заплатил. Естественно, для тех, кто отдавал 10 долларов, получая ресурсов на 100-200 долларов, это не очень хорошая новость. Да и другие компании не отстают — кто-то урезает лимиты, кто-то добавляет рекламу в бесплатный тир, а кто-то прямо говорит, что его модель невероятно мощная, но при этом настолько же и дорогая.
Безусловно, пользователи этим крайне недовольны, но на самом деле это было вполне ожидаемо — никто из корпораций не будет вкладывать сотни миллиардов долларов в инфраструктуру просто так. Рано или поздно начнётся этап отбития расходов и выхода на прибыль — и мы, очевидно, находимся на пороге этого этапа.
В золотую лихорадку больше всего разбогатели те, кто продавал лопаты
Правда, хотелось бы отметить, что в эру искусственного интеллекта зарабатывают на передовых технологиях далеко не только те компании, которые этот ИИ разрабатывают. К примеру, очень показательной является ситуация с компанией Allbirds, которая отражает текущее положение дел на рынке GPU-мощностей. Раньше этот производитель никак с высокими технологиями связан не был — компания выпускала совершенно стандартные кроссовки, используя шерсть и различные экологичные материалы, имея огромную базу фанатов по всему миру.
На момент выхода на IPO (первичное размещение акций на бирже), Allbirds оценивалась в миллиарды долларов, но популярность продукции постепенно падала, продажи, естественно, снижались, и по состоянию на начало 2026 года общие активы бренда оценивались уже примерно в 30-40 миллионов долларов. Понимая, что такими темпами бизнес просто обанкротится, руководство Allbirds приняло ошеломительное для рынка решение — продать обувной бизнес и имеющиеся активы, после чего вложить все вырученные средства (39 миллионов долларов) в ИИ-инфраструктуру. Компанию переименовали NewBird AI, а приобретённые графические ускорители руководство начало сдавать в аренду по модели GPU-as-a-Service.
То есть, условно говоря, если компании OpenAI нужна вычислительная мощность, она просто платит NewBird AI за её видеокарты, получает их в аренду на какой-то срок и на них обучает новые модели или выполняет инференс для своих сервисов. Безусловно, пока что оценить финансовые успехи бренда тяжело, но на бирже стоимость акций компании в определённый момент взлетела на 582%.
Кроме того, заработать на сдаче «видеокарт» в аренду решило не только руководство NewBird AI — компания xAI, принадлежащая Илону Маску, тоже недавно сообщила о похожих планах. Собственно, сам миллиардер рассказал, что его ИИ-стартап будет планомерно превращать центры обработки данных в полноценный источник дохода — ЦОДы будут работать не только как инфраструктура для Grok, но и в роли облачного провайдера. То есть компания будет строить огромные GPU-кластеры, чтобы затем часть вычислительных мощностей продавать сторонним клиентам на условиях долгосрочной аренды.
И, собственно, первые клиенты уже нашлись — недавно, 20 мая, Anthropic заключила с компанией SpaceX (материнская компания xAI) соглашение, в рамках которого ИИ-гигант будет платить бренду Илона Маска по 1,25 миллиарда долларов в месяц (в контракте указан срок до мая 2029 года) за доступ к Colossus 1 и Colossus 2. То есть SpaceX заработает только на этом партнёрстве 45 миллиардов долларов за три года.
И первый такой клиент уже нашёлся — стартап Cursor, который предлагает ИИ-IDE, получит доступ к дата-центрам xAI с десятками тысяч графических ускорителей для того, чтобы обучить новую большую языковую модель Composer 2.5. Конкретные детали этой сделки, естественно, не раскрываются, но есть ощущение, что в будущем подобное станет новым мейнстримом — оказалось, что сдавать в аренду мощности под ИИ может быть не менее выгодно, чем этот ИИ создавать и потом продавать аудитории.
И, естественно, в разрезе заработка на GPU-мощностях нельзя не отметить NVIDIA — «зелёные» заработали на ИИ-буме гораздо больше, чем любой конкурент. Например, прошлый финансовый год компания завершила (в январе 2026 года) с выручкой на уровне 216 миллиардов долларов, из которых сегмент Data Center принёс 194 миллиарда долларов — это почти 90% от всей выручки бренда.
«Из 100 долларов, заработанных NVIDIA, 90 приносит ИИ-бум»
Потому что в NVIDIA понимают одну простую истину — во времена «Золотой лихорадки» больше всего денег заработали производители лопат, кирок и прочего инструмента для золотодобытчиков. В современном мире ничего не изменилось — Microsoft, Amazon, Google, OpenAI, Anthropic, Perplexity, xAI закупают десятки тысяч дорогущих графических ускорителей. Более того, им нужны процессоры, серверные стойки, провода, сетевые чипы и многое другое — это NVIDIA тоже весьма успешно продаёт, демонстрируя чистую прибыль, о которой гигантам ИИ-рынка остаётся лишь мечтать.
Собственные чипы и ЦОДы в космосе
Для того, чтобы снизить зависимость от продукции компании NVIDIA, а также иметь чуть больше контроля над своей же инфраструктурой, крупные мастодонты ИИ-рынка начали активно трудиться над разработкой своих собственных решений.
Например, у компании Google имеется целая линейка чипов под названием TPU — они построены на кастомной ARM-архитектуре и применяются для машинного обучения, глубокого обучения больших языковых моделей и непосредственной работы с нейросетями. Преимуществ у этого чипа хоть отбавляй: он более энергоэффективен, чем графические ускорители NVIDIA, и имеет внушительную производительность (правда, V6, новейший чип Google на данный момент, сильно уступает B200 от NVIDIA — 918 ТФлопс против 2250 ТФлопс). Но, что самое главное, Google может оптимизировать свой кристалл или свои модели так, чтобы выжать максимальную выгоду.
У компании AWS (Amazon Web Services — крупнейшая в мире облачная платформа) тоже есть свои чипы — Trainium2 (тренировка моделей) и Inferentia2 (инференс). Эти кристаллы компания объединяет в огромные кластеры (в составе UltraCluster имеется 100 тысяч чипов), после чего использует для обучения своих моделей или сдачи этих мощностей в аренду — например, Anthropic тренирует свои новейшие модели Claude именно на этих чипах.
Свои собственные процессоры уже есть у Microsoft, HUAWEI и Tesla; работают над кастомными решениями OpenAI и даже Apple. Потому что в мире, когда идёт настолько тяжёлая гонка за «железо», иметь свой чип равно не зависеть от сторонних компаний и их ценовой политики.
Основное сражение идёт за кулисами
Когда пользователи, которые интересуются темой высоких технологий и искусственного интеллекта, смотрят на публикации от OpenAI, Anthropic и Google, у них может сложиться впечатление, что гиганты рынка сражаются лишь за возможность обладать самой умной большой языковой моделью.
Но на деле за кулисами идёт даже более ожесточённое сражение — за «железо», без которого реализовывать те самые умные модели в современном мире банально невозможно. Учитывая кризис памяти и ограниченные поставки графических ускорителей, в обозримом будущем борьба за «железо» вполне может выйти на передний план.







