观点:中国AI模型DeepSeek对OpenAI和其他硅谷公司构成多大威胁?

Image generated with DALL·E through ChatGPT

观点:中国AI模型DeepSeek对OpenAI和其他硅谷公司构成多大威胁?

阅读时间: 1 分钟

DeepSeek进入了美国市场,超越了App Store上的OpenAI,影响了Nvidia的股票,并引发了人们的关注,惊讶和广泛的采用 – 甚至在硅谷公司中也是如此。这个中国初创公司成功地创建了一个有竞争力的AI产品,挑战了美国AI公司的未来

AI领域有了新的领导者,其到来震动了全球科技行业。就在几天前,一个小型的中国初创公司DeepSeek发布了其最新的开源AI模型,强大的R1,让许多科技巨头,投资者和AI开发者感到惊慌。

新的AI模型比许多人预期的要强大。很快,DeepSeek的AI模型就取得了广泛的知名度——可能得益于中国网络的炒作和推广,它被宣传为世界上最先进的技术——并且在美国的Apple App Store上排名第一

几乎立刻,新闻媒体纷纷报道了DeepSeek的情况。

OpenAI,曾在2024年自信满满地赢得AI竞赛,开始失去力量,而Nvidia的股价大幅下跌,一天之内几乎损失了6亿美元。很难精确衡量这个新威胁对美国经济的影响有多大,但肯定不小。

从安全问题和潜在诉讼,到脆弱的科技市场,再到开源AI模型的爆炸式采用,以下是理解当前DeepSeek剧变的必要信息:

什么是DeepSeek,为什么它现在如此重要?

DeepSeek是一个小型创业公司,由中国工程师和企业家梁文峰于2023年创立,并得到了中国量化对冲基金High-Flyer Capital Management的支持。自创建以来,它一直在开发开源的AI模型,但直到几个月前才开始引起关注。

在Wizcase,我们报道了他们在11月份发布了DeepSeek-R1-Lite模型的预览,并注意到了专家和用户对这个能与OpenAI的o1竞争的产品产生的兴趣。

DeepSeek发布了DeepSeek-L3,R1的前身,于去年12月吸引了硅谷专家的注意,如Andrej Karpathy—OpenAI的前研究员和现任Tesla的AI主管,他目前正在建设一个AI本地化教育平台。Karparthy强调了构建模型的成本降低和其他有趣的特性。

它的成本更低,低很多

根据其官方论文DeepSeek-L3的建造成本为557.6万美元—考虑到所有的训练成本—而OpenAI在2023年建造GPT-4时花费了超过1亿美元

这比GPT-4便宜了大约94%!

1月15日,他们推出了一款手机应用程序,1月20日,这个中国初创公司推出了其最新的推理AI模型R1。这个模型似乎在Daft Punk的“更硬、更好、更快、更强”的魔咒下诞生,他们成功地提供了一个免费的、开源的高质量产品,该产品的成本只有前沿模型的一小部分,而且交付时间创下了纪录。Boom!

新款R1模型的价格尚未公布。但许多人推测,其价格必须保持在较低水平,因为DeepSeek目前提供的API价格远低于OpenAI的o1,而且根据《自然》杂志的报道,DeepSeek正在允许研究人员试用该模型。

马里奥·克伦——德国埃尔兰根马克斯·普朗克光学科学研究所人工科学实验室的负责人——表示,用OpenAI的o1进行的实验花费大约为370美元,而用R1进行同样的实验甚至不到10美元。克伦在接受《自然》杂志采访时表示:“这是一个巨大的差异,肯定会影响其未来的采用情况。”

有待改进

全球的用户开始下载这个应用程序,测试DeepSeek的模型,并对其令人着迷的推理能力,比如其思维链条,表示赞赏。同时,他们也注意到了一些奇特之处。

就像其他所有的AI模型一样,DeepSeek的R1也会产生幻觉,但这个中国模型还会过滤信息,特别是当它可能影响到中国政府的时候。

用户分享了R1的审查示例。它避免讨论如天安门大屠杀、台湾,或回答习近平是谁的问题。

法律战斗开始了

所以,一款新的中国应用在几天内就引起了美国人的好奇心,那么……关于美国政府此前对另一款叫做TikTok—目前陷入僵局的热门中国应用的所有数据问题呢?中国的技术看起来势不可挡,而美国政府似乎控制力下降。

尽管公众祝贺纷至沓来,但大家都对这家中国初创公司如何在如此短的时间内,尽管面临种种限制和缺乏获取关键信息的途径,建立这种强大的模型保持怀疑

美国政府一直在实施严格的规定,以防止这种情况的发生。他们禁止芯片制造商将他们先进的AI技术销售给中国,但DeepSeek仍然成功地使用不太先进的Nvidia芯片——比如论文中提到的H800 GPU——创建了尖端的人工智能工具。

但是美国政府对此持怀疑态度,现在美国商务部正在对此进行调查,他们怀疑Nvidia最先进的芯片已经被偷运到中国。

OpenAI 与 DeepSeek

气氛十分紧张。美国政府并不是唯一有信任问题的。OpenAI以及其合作伙伴微软也在对DeepSeek进行调查。他们认为这家中国公司未经许可使用了由ChatGPT产生的数据。

OpenAI声称,它的模型可能已经通过一种被称为“蒸馏”的过程帮助训练了中国的DeepSeek模型——这是一种大型AI模型将信息传递给更小且更高效的模式的过程。

一位来自OpenAI的发言人在接受《纽约时报》采访时表示:“我们知道中华人民共和国的一些团体正在积极利用包括所谓的蒸馏在内的方法来复制美国的先进AI模型。我们已经注意到并正在审查DeepSeek可能不适当地蒸馏了我们的模型的迹象,并将在我们了解更多信息后分享。”

非常讽刺的是,OpenAI正面临着多项版权和数据使用违规指控,包括由纽约时报提起的诉讼在意大利因数据违规被罚款1500万美元,以及最近印度出版商提出的版权案件

如果不能击败他们,那就加入他们?

AI领域出现了另一种现象。所有大公司都在采用DeepSeek的开源技术——甚至包括那些正在调查这家中国初创公司的公司。

Perplexity并没有去寻找DeepSeek技术的问题,反而迅速采用了这项技术。这家美国人工智能搜索公司创纪录地将R1快速整合到其平台中,为用户提供了更加丰富且由DeepSeek驱动的服务。紧随其后的是微软——没错,就是那家也在调查DeepSeek的公司——他们也在Azure AI Foundry和GitHub上添加了DeepSeek R1。

每天,似乎都有更多的公司加入了这个趋势。亚马逊刚将DeepSeek-R1模型添加到亚马逊Bedrock和亚马逊SageMaker AI中,其他公司,如Aurora Mobile也已经整合了这项技术,甚至还获得了股票的增值。

DeepSeek会在2025年成为新的OpenAI吗?

DeepSeek的影响尚未确定,中国似乎在这场游戏中有多张牌。阿里巴巴也发布了其最新的推理模型Qwen 2.5-Max,并声称其比DeepSeek-V3更强大,但尚未获得太多关注。

DeepSeek的影响巨大,许多人认为这是OpenAI霸主地位的终结。美国的人工智能公司不再像以前那样遥不可及,我们可能很快就会看到一个令人惊讶的结果。像科学家Gary Marcus这样的专家表示,OpenAI被高估了,可能会面临一个类似于WeWork的近期未来。那么,OpenAI、SoftBank和唐纳德·特朗普总统刚刚宣布的5000亿美元的Stargate项目将会怎样呢?让我们拭目以待!

所有迹象表明,就像OpenAI全速进入,席卷一切一样,DeepSeek已经来到并准备长期存在。在中国,他们已经开始被公众赞扬,他们的影响力和普及程度已经无法被从美国市场中挤出——可能比TikTok的影响力还要大。

你喜欢这篇文章吗?为它打分!
我非常不喜欢 我不怎么喜欢 一般 挺好! 非常喜欢!

我们很高兴您喜欢我们的作品!

尊贵的读者,您介意在Trustpilot上给我们点赞吗?这很快,但对我们来说意义重大。不胜感激!

在Trustpilot上给我们评分
00 用户投票
标题
评论
谢谢你的反馈
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

留下评论

Loader
Loader 显示更多…