GLM-4.5 рвёт рынок: новая модель ИИ обходится дешевле DeepSeek

29 июля 2025 10:25, Татьяна Кондакова, Игры и IT-новости, 👁 8

Китайская индустрия искусственного интеллекта готова к очередному прорыву: стартап Z.ai (ранее Zhipu) представил модель GLM-4.5, которая по стоимости использования оказывается почти вдвое дешевле популярного DeepSeek. По данным Finam (https://www.finam.ru/publications/item/noveyshaya-model-ii-v-kitae-eshche-deshevle-v-ispolzovanii-chem-deepseek-20250729-0859/), GLM-4.5 основана на агентном подходе, автоматически разбивая сложные задачи на подзадачи и повышая точность ответов. Открытый исходный код снимает барьер входа для разработчиков, а оптимизация под чип H2O от Nvidia снижает расходы на вычислительные узлы. В этом материале разберём ключевые особенности GLM-4.5, сравним эксплуатационные затраты с DeepSeek и оценим потенциал новой китайской разработки для российской индустрии.

Принцип работы: агентная архитектура

Модель GLM-4.5 использует так называемый агентный ИИ, что позволяет ей:

Самостоятельно декомпозировать пользовательский запрос на логические фазы
Распределять ресурсы под каждую подзадачу с учётом приоритета
Комбинировать результаты и выдавать единый оптимальный ответ

Подход существенно повышает качество генерации текстов и анализа данных, сокращая лишние вычисления.

Сравнение эксплуатационных затрат

Параметр	DeepSeek	GLM-4.5
Стоимость часа	условно 0,10 USD	~0,05 USD
Размер модели	40 млрд параметров	20 млрд параметров
Число GPU-узлов	16 x Nvidia H100	8 x Nvidia H2O

GLM-4.5 требует вдвое меньше вычислительных ресурсов и ориентирована на чип H2O, сертифицированный США для китайского рынка.

Вычислительные ресурсы и экспортный контроль

Для обучения GLM-4.5 стартап Z.ai использует чипы H2O, разработанные Nvidia специально под требования американского экспортного контроля. Несмотря на возобновление поставок после трёхмесячной паузы, сроки поступления новых партий остаются неопределёнными. Компания отказалась раскрыть конечные затраты на обучение, отметив лишь, что текущей мощности достаточно.

Перспективы для России и мира

Доступность. Открытый исходный код позволяет локальным разработчикам интегрировать GLM-4.5 без лицензий и абонентских платежей.
Эффективность. Экономия на GPU-узлах снижает стоимость решений на их основе до уровня малых и средних предприятий.
Конкуренция. Россия может использовать GLM-4.5 для развития внутренних продуктов наравне с западными аналогами.

С учётом ускоренного перехода бизнеса на ИИ, GLM-4.5 способна стать массовым инструментом аналитики, автоматизации и генерации контента. Официальное открытие исходного кода ожидается в ближайшие недели.