Photo by John Schnobrich on Unsplash

Alibaba представляє нову модель штучного інтелекту Qwen і стверджує, що вона перевершує DeepSeek-V3

Reading Time: 2 min

First published Jan 31, 2025

Updated 2 times since publishing

Written by: Андреа Міліані В минулому — спеціаліст з технічних новин
Translated by Команда з локалізації та перекладу Послуги локалізації та перекладу

Китайський гігант Alibaba представив останню версію своєї флагманської AI моделі, Qwen, цієї середи. Компанія стверджує, що вона може працювати краще, ніж популярний DeepSeek-V3.

У поспіху? Ось основні факти!

Alibaba представила свою останню модель розуміння Qwen 2.5-Max цього середи.
Китайський гігант стверджує, що вона перевершує популярні моделі, такі як DeepSeek-V3, GPT-4o та Llama-3.1-405B.
Компанія також запустила Qwen2.5-VL на цьому тижні, модель штучного інтелекту, здатну обробляти зображення та виконувати роль агента штучного інтелекту, який використовує комп’ютери та мобільні пристрої для виконання завдань.

Згідно з Reuters, Alibaba запустила нову модель розуміння Qwen 2.5-Max, як вона назвала нову модель міркувань, прямо під час святкування Лунного Нового року в Китаї, щоб приєднатися до масових розробок AI останніх днів та додати внутрішнього змагання.

У понеділок DeepSeek зайняв перше місце в магазині додатків Apple у Сполучених Штатах, обігнавши ChatGPT, що викликало непокій серед інших компаній в галузі ШІ та налякало інвесторів — акції Nvidia впали на 17% за один день.

Тепер Alibaba оголосила про останні версії своєї моделі Qwen – вона випустила 100 відкритих моделей ШІ для набору Qwen у вересні минулого року, обіцяючи кращі результати, ніж популярні моделі на передовій.

“Qwen 2.5-Max перевершує (…) майже у всьому GPT-4o, DeepSeek-V3 та Llama-3.1-405B”, – написала компанія на своєму офіційному акаунті WeChat.

API нової моделі розуміння Qwen 2.5-Max доступна через хмару Alibaba, і користувачі також можуть тестувати модель на її сторінці чату.

“Ми розробляємо Qwen2.5-Max, великомасштабну модель MoE, яка була попередньо навчена на понад 20 трильйонах токенів і додатково післятренована за допомогою відібраних методологій Supervised Fine-Tuning (SFT) та Reinforcement Learning from Human Feedback (RLHF)”, – написала команда Qwen у Github.

Китайський гігант також випустив Qwen2.5-VL у понеділок, серію багатомодальних моделей ШІ, які також можуть обробляти зображення та мати доступ до мобільних телефонів та комп’ютерів для виконання завдань. OpenAI анонсував подібну функцію, Operator, яка дозволяє ChatGPT виконувати завдання автономно, контролюючи комп’ютер користувача.

За словами команди Alibaba, всі моделі Qwen перевершують аналогічні версії від OpenAI, Microsoft, Google, Meta та DeepSeek.

Alibaba представляє нову модель штучного інтелекту Qwen і стверджує, що вона перевершує DeepSeek-V3

We're thrilled you enjoyed our work!