阿里巴巴发布新款Qwen人工智能模型,声称其性能超越DeepSeek-V3

Photo by John Schnobrich on Unsplash

阿里巴巴发布新款Qwen人工智能模型,声称其性能超越DeepSeek-V3

阅读时间: 1 分钟

中国巨头阿里巴巴于本周三发布了其旗舰AI模型Qwen的最新版本。该公司声称,其性能优于热门的DeepSeek-V3。

赶时间?这里有重点速览!

  • 阿里巴巴本周三发布了其最新的推理模型Qwen 2.5-Max。
  • 这个中国巨头声称其性能超越了诸如DeepSeek-V3、GPT-4o和Llama-3.1-405B等流行模型。
  • 该公司本周还推出了Qwen2.5-VL,这是一个能够处理图像并作为AI代理使用电脑和手机执行任务的AI模型。

根据路透社的报道,阿里巴巴在中国农历新年期间推出了新的推理模型Qwen 2.5-Max,以加入过去几天大规模的人工智能开发,并增加国内竞争。

周一,DeepSeek在美国苹果应用商店中位居第一,超过了ChatGPT,引起了AI行业其他公司的关注,也使投资者感到警觉——Nvidia的股价在短短一天内下跌了17%

现在,阿里巴巴已经宣布了其Qwen模型的最新版本——去年9月份,它推出了Qwen套件的100种开源AI模型,并承诺比流行的前沿模型有更好的效果。

“Qwen 2.5-Max 在几乎所有方面都超越了 GPT-4o、DeepSeek-V3 和 Llama-3.1-405B。” 这家公司在其官方微信账户上写道。

新的推理模型 Qwen 2.5-Max 的 API 可以通过阿里巴巴的云服务获得,用户也可以在其聊天页面上测试该模型。

“我们正在开发Qwen2.5-Max,这是一个大规模的MoE模型,已经在超过20万亿个标记上进行了预训练,并进一步通过精心策划的监督精细调教(SFT)和人类反馈的强化学习(RLHF)方法进行了后期训练。”Qwen团队在Github上写道

这家中国巨头公司在周一还发布了Qwen2.5-VL,一系列可以处理图像并可以访问手机和电脑进行任务的多模态AI模型。OpenAI宣布了一个类似的功能,Operator,允许ChatGPT自主控制用户的电脑并执行任务。

根据阿里巴巴的团队,所有的Qwen模型都超越了来自OpenAI、微软、谷歌、Meta和DeepSeek的类似版本。

你喜欢这篇文章吗?为它打分!
我非常不喜欢 我不怎么喜欢 一般 挺好! 非常喜欢!

我们很高兴您喜欢我们的作品!

尊贵的读者,您介意在Trustpilot上给我们点赞吗?这很快,但对我们来说意义重大。不胜感激!

在Trustpilot上给我们评分
00 用户投票
标题
评论
谢谢你的反馈
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

留下评论

Loader
Loader 显示更多…