Boom metrics
Наука29 января 2025 11:30

Китай добивает западную ИИ-индустрию: появилась нейросеть «мощнее DeepSeek»

Alibaba представила свою модель ИИ Qwen 2.5 Max после триумфа DeepSeek
Alibaba представила свою модель ИИ Qwen 2.5 Max после триумфа DeepSeek

Alibaba представила свою модель ИИ Qwen 2.5 Max после триумфа DeepSeek

Фото: Shutterstock.

На днях Китай потряс мир, выпустив нейросеть DeepSeek. Мощь нового продукта и то, что его создали за копейки (12 миллионов долларов против сотен миллионов у американских конкурентов) произвели наимрачнейшее впечатление на Силиконовую долину. Вниз полетели акции западных ИИ-компаний, например, производитель чипов Nvidia потерял одномоментно 600 миллиардов долларов. Но беда (для Запада) не приходит одна. В первый день китайского нового года крупный ИИ-игрок Alibaba презентовал нейросеть Qwen 2.5 Max, и она еще мощнее. С такими темпами лидерство Китая становится неоспоримым.

НЕ С ЧИСТОГО ЛИСТА

Alibaba – это в Китае, как Open AI в США, компания давно и успешно создает сетки. Весной прошлого года на технологический горизонт Поднебесной ворвалась новая (создана в 2023-м) компания DeepSeek. На Западе появление первой версии их нейросети не заметили (а теперь кусают локти). А вот в Китае она нашумела. В той же Alibaba созывали совещания и антикризисные штабы. Молодежь нас обходит!

И вот новый поворот. Сеть от Alibaba рвет внутренний рынок, а вместе с DeepSeek они прямо-таки разделывают под орех рынок международный.

QWEN 2.5 MAX: ЧТО ЭТО ТАКОЕ

Продукт от Alibaba обошел DeepSeek во всех тестах (бенчмарках), на которых обычно испытывают возможности нейросети. Сеть оказалась лучше в точности ответов, скорости обработки данных и в адаптивности. Что немудрено: учили ее на совесть.

На самом деле создатели нейросетей давно соревнуются именно в обучении. Если верить американской Open AI, это очень дорого и долго. Так, на обучение следующего поколения GPT, GPT5, Open AI планирует потратить миллиард. Компании приобретают целые электростанции, чтобы запитывать центры обучения. А воровство контента где угодно (в Сети, в социальных сетях, даже в персональных данных) давно стало предметом споров и разбирательств. Но контент остро нужен, ведь ИИ требуются примеры, чтобы изучить жизнь людей.

DeepSeek потому стала великой нейросетью, что умудрилась обучиться всего за 5,5 миллионов долларов (впрочем, говорят, что в сумму не включили некоторые расходы; все равно дешево), а получилось в общем-то неплохо. Нейросеть точно не хуже GPT4, а обошлась в сотни раз дешевле.

Qwen учили не на минималках. В нее закачали 20 триллионов единиц информации (токенов), но дополнительно задействовали методологии тонкой настройки (SFT), а также обратную связь с человеком (RLHF), то есть применили самые современные приемы. Это не будет так быстро, как с DeepSeek, но это будет лучше. Неудивительно, что Qwen превзошла и существующие американские аналоги.

Alibaba не утверждает, что обучила сеть за копейки. Но дает понять: не так дорого, как американцы. Компания подробно рассказала, как именно учили. Что больше всего поразило экспертов в этом рассказе – оптимизация на каждом этапе. В результате для обучения (и потом для работы) требуется минимум вычислительных мощностей.

КАК ПОЛЬЗОВАТЬСЯ QWEN 2.5 MAX

Сообщается, что Qwen в состоянии однократно переварить 1 миллион единиц информации. Это все равно, как если бы вы могли в моменте, дословно, держать в голове 10 романов объема «Властелина колец». Эксперты пишут, что это переломный момент в развитии ИИ. Большинство нейросетей едва в состоянии помнить 120 тыс. единиц информации.

Разработчики уже кинулись тестировать: сетка доступна для экспериментов по свободной лицензии.

Хотя у Qwen, как и у DeepSeek, есть чат, и с нейронкой можно поболтать (после регистрации), главным образом Qwen – это набор инструментов, из которых продвинутые пользователи могут ваять решения под себя, например, создавать картинки, анализировать компьютерные коды, решать инженерные и научные задачи, и так далее.

Собственно, так работает и тот GPT, который мы знаем. Вы наверняка обращались за помощью к GPT, но где вы ее нашли? Явно не сами скачали, а, например, в телеграме, на каком-то сайте. Это значит: кто-то купил доступ к основной системе, адаптировал и теперь предлагает воспользоваться рядовым юзерам. Его интерес – как правило, реклама, которая вставляется в тг-канал или на сайт, или авторские права на созданные ИИ картинки-тексты.

Отзывов от российских пользователей пока немного, на Западе новинка понравилась.

ПРЕКРАСНЫЙ НОВЫЙ МИР

Выход DeepSeek удостоился внимания президента США: Дональд Трамп сказал, что мировая конкуренция усиливается, и американским компаниям нужно еще поднажать, чтобы опередить.

Команда Трампа рассматривает ИИ-технологии крайне серьезно. Там понимают: владеющий мощным ИИ владеет современным миром. ИИ в руках твоего врага раскрывает все твои секреты, как на ладони. Не говоря о том, что мощный ИИ – это быстрая разработка нового лекарства, техники, оружия.

Что может сделать Америка? Эксперты сходятся на том, что американские компании оказались не в лучшей ситуации. Во-первых, они были первопроходцами, и потратили кучу денег на то, что сейчас «очевидно». Это как с сотовой связью: первые телефоны и тарифы дороги. Во-вторых, большие компании уже обросли жирком и потеряли темп. Колоссальные траты на зарплаты и необязательные проекты, приоритет управленца над инженером – все как всегда.

Сможет ли Запад выставить когорту молодых, злых старапов и ввязаться в гонку с новыми силами? Скорее всего да, но им придется пройти через кризис.

Так или иначе, 2025-й в самом деле становится годом ИИ, но вовсе не потому, что Open AI выпускает некую потрясающую основы нейросеть. Все намного интереснее.

ЧИТАЙТЕ ТАКЖЕ

Успех китайской нейросети DeepSeek сравнили с запуском первого советского спутника

Нейросеть DeepSeek из Китая за считанные дни стала самой популярной в мире (подробности)

СЛУШАЙТЕ ТАКЖЕ

Искусственный интеллект на тропе войны: как сегодня применяют ИИ на поле боя (подробнее)