阿里巴巴发布新款Qwen人工智能模型,声称其性能超越DeepSeek-V3
中国巨头阿里巴巴于本周三发布了其旗舰AI模型Qwen的最新版本。该公司声称,其性能优于热门的DeepSeek-V3。
赶时间?这里有重点速览!
- 阿里巴巴本周三发布了其最新的推理模型Qwen 2.5-Max。
- 这个中国巨头声称其性能超越了诸如DeepSeek-V3、GPT-4o和Llama-3.1-405B等流行模型。
- 该公司本周还推出了Qwen2.5-VL,这是一个能够处理图像并作为AI代理使用电脑和手机执行任务的AI模型。
根据路透社的报道,阿里巴巴在中国农历新年期间推出了新的推理模型Qwen 2.5-Max,以加入过去几天大规模的人工智能开发,并增加国内竞争。
周一,DeepSeek在美国苹果应用商店中位居第一,超过了ChatGPT,引起了AI行业其他公司的关注,也使投资者感到警觉——Nvidia的股价在短短一天内下跌了17%。
现在,阿里巴巴已经宣布了其Qwen模型的最新版本——去年9月份,它推出了Qwen套件的100种开源AI模型,并承诺比流行的前沿模型有更好的效果。
“Qwen 2.5-Max 在几乎所有方面都超越了 GPT-4o、DeepSeek-V3 和 Llama-3.1-405B。” 这家公司在其官方微信账户上写道。
新的推理模型 Qwen 2.5-Max 的 API 可以通过阿里巴巴的云服务获得,用户也可以在其聊天页面上测试该模型。
“我们正在开发Qwen2.5-Max,这是一个大规模的MoE模型,已经在超过20万亿个标记上进行了预训练,并进一步通过精心策划的监督精细调教(SFT)和人类反馈的强化学习(RLHF)方法进行了后期训练。”Qwen团队在Github上写道。
这家中国巨头公司在周一还发布了Qwen2.5-VL,一系列可以处理图像并可以访问手机和电脑进行任务的多模态AI模型。OpenAI宣布了一个类似的功能,Operator,允许ChatGPT自主控制用户的电脑并执行任务。
根据阿里巴巴的团队,所有的Qwen模型都超越了来自OpenAI、微软、谷歌、Meta和DeepSeek的类似版本。
留下评论
取消