Шанхайский стартап, о котором никто не слышал год назад, сегодня обрабатывает больше запросов, чем ChatGPT и Claude вместе взятые на крупнейшей API-платформе. Это не прогноз. Это данные OpenRouter за февраль 2026 года. И это меняет правила игры для каждого, кто работает с ИИ.
- 📊 Цифры, от которых у Big Tech перехватило дыхание
- 💰 Цена, которая разрушает бизнес-модели западных гигантов
- 🧠 Качество, которое больше нельзя игнорировать
- 🏢 IPO, которые потрясли Гонконг
- 🌍 Глобальная экспансия: Китайские модели проникают везде
- 🔧 Технические прорывы: как Китай добился эффективности
- 🏭 Инфраструктура: пустыни, энергия и государственная воля
- 📱 Потребительский рынок: 515 миллионов пользователей
- ⚠️ Риски и вызовы: что может пойти не так?
- 🎯 Что это значит для России?
- 🔮 Кульминационный инсайт: гонка сместилась с чипов на API
- 💡 Выводы и рекомендации
- ❓ FAQ: вопросы, которые задают все
📊 Цифры, от которых у Big Tech перехватило дыхание
OpenRouter — крупнейший агрегатор API для языковых моделей — опубликовал данные, которые перевернули представление о балансе сил в индустрии искусственного интеллекта. Китайские модели впервые заняли 61% всего объёма потребления токенов на платформе.
Три разработчика из Поднебесной — MiniMax, Zhipu AI и Moonshot AI — генерируют порядка 45% всех запросов. Ещё несколько месяцев назад ни MiniMax, ни GLM-5 от Zhipu даже не входили в топ-10.
| Модель | Токенов за неделю | Рост | Доля рынка |
|---|---|---|---|
| MiniMax M2.5 | 2,45 трлн | +197% | ~25% |
| Moonshot Kimi K2.5 | 1,21 трлн | −20% | ~10% |
| Zhipu GLM-5 | 780 млрд | +158% | ~7% |
Китайские модели потребили 5,3 трлн из 8,7 трлн токенов, использованных топ-10 моделями платформы. Общий недельный объём на OpenRouter достиг 12,1 трлн токенов — рост в 12,7 раза за год.
Вопрос на засыпку: если китайские нейросети работают не хуже, а стоят в 10–20 раз дешевле — какой смысл переплачивать?
💰 Цена, которая разрушает бизнес-модели западных гигантов
Главный драйвер экспансии — агрессивное ценообразование. Сравнение говорит само за себя:
| Модель | Input / 1M токенов | Output / 1M токенов |
|---|---|---|
| MiniMax M2.5 | $0,12–0,30 | $0,95–1,10 |
| Zhipu GLM-5 | $0,30 | $2,55 |
| DeepSeek V3.2 | $0,28 | $0,42 |
| Claude Opus 4.6 | $5,00 | $25,00 |
| GPT-5.4 | $2,50 | $15,00 |
| GPT-5.4 Pro | $30,00 | $180,00 |
MiniMax дешевле Claude в 16–40 раз на входных токенах и в 22–26 раз на выходных. DeepSeek предлагает GPT-5-уровень производительности за $0,28 против $15 — разница в 50 раз.
💡 Что это значит на практике?
Обрабатываете 10 миллиардов токенов в месяц?
- DeepSeek: ~$3 700
- GPT-5.4: ~$112 500
Экономия: $108 800 ежемесячно. За год — $1,3 миллиона. И это только на API. Для стартапов и enterprise-клиентов такие цифры решают судьбу продукта.
MiniMax утверждает: час непрерывной работы модели обходится в $1.
🧠 Качество, которое больше нельзя игнорировать
Скептики годами твердили: «Китайские модели — это дешёвые копии, которые никогда не догонят frontier». Февраль 2026 года поставил точку в этом споре.
MiniMax M2.5 набирает 80,2% на SWE-Bench Verified — бенчмарке для инженерных задач в программировании. Claude Opus 4.6 показывает 80,8%. Разница — 0,6 процентных пункта. При цене в 20 раз ниже.
Kimi K2 от Moonshot демонстрирует 97,4% на MATH-500 и 65,8% на SWE-bench, превосходя GPT-4.1 по математике и коду. DeepSeek R1, обученный за $294 000, достигает уровня GPT-4 Turbo — при том, что обучение GPT-4 оценивают в $100+ миллионов.
Китайские модели достигают 90% производительности американских frontier-моделей, затрачивая на 82% меньше капитала.
🎯 Почему именно сейчас?
Структурный сдвиг в паттернах использования сыграл на руку китайским разработчикам. Программирование выросло с 11% до более 50% всего объёма токенов на OpenRouter за 2025 год. Агентские workflows — задачи, где модель автономно выполняет многошаговые операции — генерируют более половины всех output-токенов.
Все три лидера — MiniMax, Kimi, GLM — оптимизированы именно под код и агентскую автоматизацию. Совпадение? Нет. Стратегия.
🏢 IPO, которые потрясли Гонконг
Капитал голосует ногами — и кошельками. MiniMax и Zhipu AI вышли на IPO в Гонконге в январе 2026 года, став первыми в мире публичными AI-компаниями.
MiniMax разместила акции по HK$165. В первый день торгов бумага взлетела на 109%. Выручка компании выросла с $3,5 млн в 2023 до $79 млн в 2025 — рост более чем в 22 раза за два года. Более 70% выручки приходит с зарубежных рынков.
Zhipu AI привлекла $558 млн, MiniMax — $620 млн. Оценка Moonshot AI достигла $4,3 млрд.
Инвесторы поняли: эпоха, когда AI-рынок принадлежал только OpenAI, Anthropic и Google, закончилась.
🌍 Глобальная экспансия: Китайские модели проникают везде
🇺🇸 США: 80% open-source стартапов выбирают Китай
Партнёр Andreessen Horowitz Мартин Касадо оценивает: примерно 80% стартапов, использующих open-source стек, запускают китайские модели. OpenRouter COO Крис Кларк подтверждает: китайские open-weight модели захватили значительную долю, потому что они «непропорционально heavily представлены в агентских потоках американских фирм».
📈 Рост доли: с 1,2% до 30% за 12 месяцев
| Период | Доля китайских моделей | Рост |
|---|---|---|
| Конец 2024 | 1,2% | База |
| Q1 2025 | 13% | +983% |
| Август 2025 | 30% | +2 400% |
| Февраль 2026 | 61% (OpenRouter) | Лидерство |
Китайские модели захватили более 10% рынка в 30 странах и более 20% в 11 странах в течение месяцев после релиза. 600+ миллионов загрузок Qwen по всему миру. 180 000+ производных моделей от семейства Qwen.
🏆 Лидерство в open-source
9 из 14 лучших глобальных моделей — китайские и open-source. США имеют 0 open-source моделей в топ-14. Китай выпустил 1 509 LLM к июлю 2025 года — 40% от мирового total.
🔧 Технические прорывы: как Китай добился эффективности
💡 MoE-архитектура и sparse attention
DeepSeek V3 — модель с 671 млрд параметров, из которых активны только 37 млрд на токен. Kimi K2 использует 1 трлн параметров в MoE-конфигурации. Такой подход радикально снижает inference costs без потери качества.
DeepSeek Sparse Attention (DSA) уменьшает сложность attention с O(L²) до O(Lk) для длинных последовательностей. Результат: высокая скорость при длинном контексте.
🎓 Обучение за копейки
| Модель | Стоимость обучения | Уровень |
|---|---|---|
| DeepSeek R1 | $294 000 | GPT-4 Turbo |
| DeepSeek V3 | $5,58 млн | Near GPT-4 |
| Kimi K2 | $4,6 млн | GPT-5 coding |
| MiniMax M2 | $4,6 млн | 90% GPT-5 |
| GPT-4 (оценка) | $100+ млн | Frontier |
DeepSeek R1 обучен за $294 000 — 99,7% дешевле, чем оценка для GPT-4. Это не магия. Это инженерная дисциплина, оптимизация каждой операции и отказ от избыточных вычислений.
🚀 Скорость релизов
Alibaba выпускает новую модель каждые 20 дней в среднем. 57% быстрее, чем Anthropic с её 47-дневным циклом. 500+ моделей выпущено в 2024 году.
🏭 Инфраструктура: пустыни, энергия и государственная воля
Китай строит дата-центры в Синьцзяне — регионе с дешёвой зелёной энергией и холодным климатом. В Карамае мощность уже превысила 17 000 PFLOPS, с планами достичь 100 000P. 80% мощности обслуживает восточный Китай и зарубежных клиентов.
Энергия по $0,07 за кВт·ч против американских $0,12–0,15 даёт структурное преимущество. В 2024 году Китай добавил 429 GW новой энергомощности — против 51 GW в США.
Государственные guidance funds установили цель в $500 млрд ещё в 2016 году, превысив private VC. Стратегия «AI+» до 2035 года предполагает превращение ИИ в базовую социальную инфраструктуру.
📱 Потребительский рынок: 515 миллионов пользователей
Китайская база пользователей генеративного ИИ удвоилась за 6 месяцев — с 257 млн в декабре 2024 до 515 млн в июне 2025. Проникновение: 36,5% населения.
74,6% пользователей — моложе 40 лет. 37,5% имеют высшее образование. Это цифровое поколение, которое принимает ИИ как естественную часть жизни.
🆓 Бесплатный доступ как оружие
| Платформа | Бесплатный доступ | Pro-тариф |
|---|---|---|
| DeepSeek | Безлимит | Нет |
| Kimi | Бесплатно | Нет |
| Qwen | Бесплатно | Нет |
| Ernie Bot | Бесплатно | Нет |
| ChatGPT | Ограничен | $20/мес |
| Claude | Очень ограничен | $20/мес |
Китайские чат-боты работают по модели zero subscription cost — 100% преимущество перед Claude и ChatGPT. Результат: Ernie Bot достиг 200+ млн пользователей, DeepSeek — 130+ млн, Kimi — 100+ млн.
⚠️ Риски и вызовы: что может пойти не так?
🔥 Сжигание денег
MiniMax потратила $512 млн чистых убытков при выручке $53,4 млн за 9 месяцев 2025 года — соотношение 10:1. Zhipu и MiniMax сжигают $10 на каждый $1 выручки.
R&D расходы MiniMax достигли $180 млн — 337% от выручки. Такая модель устойчива только при постоянном притоке капитала. IPO даёт передышку, но путь к прибыльности остаётся тернистым.
📈 Рост цен неизбежен?
Zhipu, Moonshot, MiniMax и StepFun уже подняли цены на некоторые API в 2025 году. Zhipu GLM-5 повысил цену на 30% в первом увеличении 2026 года. Давление на маржу растёт вместе с масштабом.
🧱 Чипы и экспортные ограничения
США сохраняют контроль над передовыми GPU. Китай компенсирует это через оптимизацию архитектуры, квантование, дистилляцию и национальные чипы Huawei Ascend. Но разрыв в hardware остаётся фактором риска.
🛡️ Безопасность и доверие
Anthropic обвинила DeepSeek, Moonshot и MiniMax в использовании 24 000 fraudulent accounts для создания 16+ миллионов exchanges с Claude — якобы для «дистилляции» возможностей. Китайские компании отрицают нарушения. Спор поднимает вопросы о защите IP и этике данных.
🎯 Что это значит для России?
Российский рынок ИИ находится в уникальной позиции. Доступ к западным моделям ограничен санкциями и платежами. Китайские open-source модели — реальная альтернатива для бизнеса, госсектора и разработчиков.
Qwen, DeepSeek, GLM можно разворачивать on-premise. Низкая цена API делает интеграцию доступной для среднего бизнеса. Открытые веса позволяют дообучать модели под русскоязычные задачи без зависимости от зарубежных провайдеров.
Урок для российских игроков: не пытаться догнать frontier в лоб. Найти нишу, где цена, скорость и специализация дают преимущество. Китай показал: можно победить не бюджетом, а эффективностью.
🔮 Кульминационный инсайт: гонка сместилась с чипов на API
Долгое время казалось, что победа в ИИ определяется доступом к H100 и дата-центрам. Февраль 2026 года показал: реальная битва идёт за developer mindshare и token volume.
Китайские компании выиграли не потому, что у них больше GPU. Они выиграли, потому что:
- Сделали модели доступными — open weights, низкие цены, простая интеграция.
- Сфокусировались на реальных use cases — код, агенты, автоматизация.
- Запустили маховик adoption — чем больше используют, тем быстрее улучшают.
- Использовали open-source как стратегическое оружие — экосистема растёт сама.
80% американских open-source стартапов уже строят на китайских моделях. Это не «китайский пузырь». Это структурный сдвиг, который Big Tech не сможет обратить вспять простым снижением цен.
💡 Выводы и рекомендации
Для бизнеса:
- Тестируйте китайские модели на production-нагрузках. Экономия в 10–20 раз реальна.
- Считайте TCO, а не только цену токена. Надёжность, SLA, поддержка — всё имеет значение.
- Диверсифицируйте провайдеров. Зависимость от одного вендора — риск в любой юрисдикции.
Для разработчиков:
- OpenRouter даёт единый API к 400+ моделям от 60+ провайдеров. Идеальная площадка для экспериментов.
- Следите за бенчмарками, но тестируйте на своих данных. Реальная производительность важнее синтетических scores.
- Кэширование снижает costs на 90% у всех провайдеров. Архитектура имеет значение.
Для инвесторов:
- Китайские AI-компании демонстрируют гиперрост, но burn rate остаётся высоким.
- IPO в Гонконге открывает доступ к ликвидности, но волатильность будет значительной.
- Сектор open-source становится мейнстримом. Модели с закрытыми весами теряют долю.
❓ FAQ: вопросы, которые задают все
🔹 Правда ли, что китайские модели дешевле в 10–20 раз?
Да. MiniMax M2.5 стоит $0,12–0,30 за миллион входных токенов против $5 у Claude Opus 4.6. Разница составляет 16–40 раз на input и 22–26 раз на output.
🔹 Насколько точно цифра в 45% потребления?
Три китайских разработчика открытых моделей — MiniMax, Zhipu и Moonshot — генерируют порядка 45% всего потребления на OpenRouter. Важно: OpenRouter отражает часть рынка и смещён в сторону open-weight моделей.
🔹 Откуда взялись 61% рынка?
По данным OpenRouter от 24 февраля 2026 года, китайские модели account for 61% total token consumption на платформе. Это включает все китайские модели, не только топ-3.
🔹 Можно ли доверять бенчмаркам?
MiniMax M2.5 набирает 80,2% на SWE-Bench Verified против 80,8% у Claude Opus 4.6. Kimi K2 показывает 97,4% на MATH-500 и 65,8% на SWE-bench. Разрыв с frontier сократился до статистической погрешности в ключевых задачах.
🔹 Почему именно программирование стало драйвером?
Программирование выросло с 11% до более 50% всего объёма токенов на OpenRouter в течение 2025 года. Китайские модели оптимизированы под код и агентские workflows, что совпало с рыночным спросом.
🔹 Как Китай добился такой эффективности в обучении?
DeepSeek R1 обучен за $294 000, достигая уровня GPT-4 Turbo. Секрет — MoE-архитектура, sparse attention, reinforcement learning без SFT и дистилляция reasoning в меньшие модели.
🔹 Что с надёжностью API?
DeepSeek API испытывал проблемы с доступностью в периоды высокой нагрузки. OpenAI имеет лучший track record по SLA. Для production-систем с жёсткими требованиями это может быть фактором выбора.
🔹 Будут ли цены расти?
Zhipu, Moonshot, MiniMax и StepFun уже поднимали цены на некоторые API в 2025 году. Zhipu GLM-5 повысил цену на 30% в начале 2026 года. Давление на маржу растёт, но конкуренция сдерживает резкие скачки.
🔹 Как обстоят дела с IPO?
MiniMax и Zhipu AI вышли на IPO в Гонконге в январе 2026 года, став первыми публичными AI-компаниями globally. Акции MiniMax выросли на 109% в первый день торгов.
🔹 Что ждёт рынок в 2026 году?
Китайские модели продолжат захватывать долю в enterprise и developer сегментах. Ценовая война усилится. Open-source станет доминирующей парадигмой. Западные гиганты будут вынуждены адаптироваться — либо через партнёрства, либо через радикальное снижение цен.
Последний кадр: год назад китайские нейросети воспринимались как «догоняющие». Сегодня они диктуют темп, устанавливают цены и заставляют Кремниевую долину пересматривать стратегии. Вопрос больше не в том, «догонят ли». Вопрос в том, кто успеет адаптироваться к новой реальности, где эффективность важнее бюджета, а открытый код побеждает закрытые экосистемы. 🚀
Оставить комментарий