Photo by John Schnobrich on Unsplash

阿里巴巴发布新款Qwen人工智能模型，声称其性能超越DeepSeek-V3

阅读时间: 1 分钟

最近更新： Jan 31, 2025

中国巨头阿里巴巴于本周三发布了其旗舰AI模型Qwen的最新版本。该公司声称，其性能优于热门的DeepSeek-V3。

赶时间？这里有重点速览！

根据路透社的报道，阿里巴巴在中国农历新年期间推出了新的推理模型Qwen 2.5-Max，以加入过去几天大规模的人工智能开发，并增加国内竞争。

周一，DeepSeek在美国苹果应用商店中位居第一，超过了ChatGPT，引起了AI行业其他公司的关注，也使投资者感到警觉——Nvidia的股价在短短一天内下跌了17%。

现在，阿里巴巴已经宣布了其Qwen模型的最新版本——去年9月份，它推出了Qwen套件的100种开源AI模型，并承诺比流行的前沿模型有更好的效果。

“Qwen 2.5-Max 在几乎所有方面都超越了 GPT-4o、DeepSeek-V3 和 Llama-3.1-405B。” 这家公司在其官方微信账户上写道。

新的推理模型 Qwen 2.5-Max 的 API 可以通过阿里巴巴的云服务获得，用户也可以在其聊天页面上测试该模型。

“我们正在开发Qwen2.5-Max，这是一个大规模的MoE模型，已经在超过20万亿个标记上进行了预训练，并进一步通过精心策划的监督精细调教（SFT）和人类反馈的强化学习（RLHF）方法进行了后期训练。”Qwen团队在Github上写道。

这家中国巨头公司在周一还发布了Qwen2.5-VL，一系列可以处理图像并可以访问手机和电脑进行任务的多模态AI模型。OpenAI宣布了一个类似的功能，Operator，允许ChatGPT自主控制用户的电脑并执行任务。

根据阿里巴巴的团队，所有的Qwen模型都超越了来自OpenAI、微软、谷歌、Meta和DeepSeek的类似版本。