彭博:DeepSeek的诞生说明,为何川普很难打赢贸易战(图)
大鱼新闻 科技 1 day
【文/泰勒·考恩】
如今,人工智能领域出现突破是如此的普遍,以至于很难区分真正重要与无意中出现的突破。但最近的一次事态发展值得特别关注:来自中国的全新系列大语言模型DeepSeek-V3的出现。这件事对中美贸易的影响与在科技领域的影响一样大。
笔者已经对DeepSeek进行了好几天的测试,这是笔者过去几年中测试过的数十个大语言模型中最好的之一。它快速、容易上手,且有一个免费的版本。虽然在应对复杂或晦涩的问题上无法与美国最好的大语言模型相提并论,但笔者会把它归入一流的一档。其他人,包括测试人员也持同样的看法。
Deepseek-V3与多个国内外大模型的测试数据对比。 “Deepseek”公众号
DeepSeek还有几个值得注意的地方。首先,它来自一家对冲基金,而不是一家科技公司(不过,这样的分类方式可能也需要更新了)。其次,据报道,它的训练成本非常低,估计只有约550万美元,还不包括非计算成本(non-compute costs),这类统计通常都会排除那部分成本。
也许最引人注意的是,DeepSeek并没有使用质量最高级的半导体芯片。美国拜登政府一直在努力限制向中国出口这类芯片,希望减缓中国在人工智能和相关军事技术应用方面的进步。由于无法获得最新的尖端芯片,DeepSeek不得不寻找其他更便宜的方法来训练其模型。
笔者过去曾支持这类贸易限制措施,理由是人工智能技术事关国家安全。但笔者现在认为,这项禁令设置的目标过高以至于难以实现。禁令也许可以让中国在人工智能领域的进步推迟数年,但也间接导致了中国的一项重要创新——即DeepSeek的诞生。
现在全世界都知道了,只需花费相对较少的资金就足以训练出质量相当高的人工智能系统。对于俄罗斯、伊朗、巴基斯坦和其它国家来说,这可能会让发展类似的人工智能系统成为现实的愿景。可以想象,来自外国的亿万富翁也有能力发起类似的项目,虽然网罗技术人才会是一个制约因素。无论中国的人工智能系统及其潜在用途会带来哪些“风险”,其它国家在DeepSeek启发下发展的分支项目可能会更加令美国人担忧。
无论如何,各国几乎肯定能找到更便宜的构建人工智能系统的方法。但这里涉及一个权衡:美国的政策成功地拖延了中国将高质量芯片用于人工智能系统的能力,这相应地给美国带来了国家安全利益,但同时也加速了不依赖高质量芯片却有效的人工智能系统的发展。
这样的权衡最终是否会证明对美国有利,还需要时间观察。但这种权衡不仅仅体现在狭义的层面,尽管目前围绕DeepSeek的动机、定价策略、未来规划以及“与中国政府的关系”依然有许多尚未解答或无法回答的疑问,但在更广泛的层面,这种权衡也面临着不确定性。
借用奥地利经济学家路德维希·米塞斯(Ludwig Mises)的一句话:“政府干预会产生重要的、意想不到的次生后果。”要看一项政策是否奏效,不仅要考虑其直接影响,也要看它的二阶甚至三阶影响。
美国芯片禁令产生的一个次生效应是,它可能会鼓励一些中国使用者通过其它国家的第三方获得高质量芯片,或者租用非中国的、使用了高质量芯片的人工智能系统。在这种情况下,中国企业根本不需要购买芯片,至少在某些应用上不需要。美国的对策是更进一步地施加行业限制——但它真的能对全球半导体市场进行微观管理吗?笔者越来越表示怀疑。
美国当选总统特朗普的政府在考虑升级对华贸易措施时,最好仔细研究一番其前任政策带来的意外后果。可以肯定的是,一部分(而非全部)非人工智能贸易限制措施自有其国家安全层面的理由。但任何政策带来的直接影响很少是故事的全部结局。
例如,如果联邦政府决定限制一款在美国销售的中国商品或者服务,或选择对其征税,中国可以尝试通过第三方更换名称,销售同一款商品,而许多亚洲国家愿意助其一臂之力。擅长钻规则漏洞的企业家往往比政府官僚行动更加迅速。
抽象地说,关于“国家安全”的观点自有其说服力。但在现实中,以保护国家安全为目标的政策很难设计得周全。重要的是思考如何让实践更好地符合理论。
一夜间,DeepSeek在美国刷屏,股民们焦虑“这是在做空英伟达吗?”
R1模型发布一周之后,来自中国的神秘AI公司DeepSeek刷屏美国各大主流媒体和社交网站。以至于AI投资者“modest proposal”一脸问号地发推:
为何DeepSeek今天突然成为主流焦点,导火索是什么?
一石激起千层浪,各位网友纷纷表示“是啊是啊,确实蹊跷”,大家七嘴八舌,好不热闹。
有人猜测,可能是因为:1月20日DeepSeek发布了可以媲美OpenAI O1的R1模型。但proposal老哥很执着的追问,这是周一的事了,但为什么偏偏是今天火了?
拥有20年投资经验的大V TMT Breakout总结了可能的四个原因:
1、X平台算法导致;
2、Andreesen发推称赞;
3、纽约时报发了文章;
4、因为反身性,英伟达盘前下跌。
这里提到的Andreesen,显然就是指华尔街顶级风投A16Z创始人Marc Andreesen,他说了什么呢?
DeepSeek R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是对全世界的大礼。
好家伙,大佬对DeepSeek真是毫不吝惜溢美之词。Andreesen投过OpenAI、Databricks、Shield AI,无一不是行业翘楚。聊天机器人一个Character.ai也是他投出来的。
可以说,对于AI的最前沿发展,Andreesen算得上是权威了。
现在权威大佬给DeepSeek“盖戳认证”,这分量还真不轻。
不过,DeepSeek当得起这份“盛赞”。上个月发布的V3模型,仅用550万元2000张卡做的,和OpenAI几亿烧出来的一样好。
本周一发行的R1推理模型,更是技惊四座,赢得赞誉无数。
1月24日,在专业大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。
至于纽约时报对DeepSeek的报道,我们也看了下,对DeepSeek的成功,纽约时报是既羡慕又警惕:
在我们的要求下,DeepSeek最新的R1模型很贴心地对文章内容进行了总结:
文章认为DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了"唯有科技巨头才能研发尖端AI"的行业共识。
其成功源于中国工程师在美国芯片限制下的创新突破:通过开源生态协作、算法优化及资源整合,将黑市芯片与量化交易公司的算力积累转化为技术优势。
这种模式不仅揭示美国技术封锁的意外反效果,更预示中国可能通过开源主导权重构全球AI竞争格局,使低成本创新成为颠覆行业的新路径。其实,硬AI注意到,不仅是纽约时报,这两天海外主流财经媒体“不约而同”的对Deepseek进行了关注。让我们感受一下画风。
英国金融时报:
经济学人:
连线:
CNBC还做了一个40分钟的深度视频,紧张兮兮的讨论美国AI是不是受到了威胁。
第四个原因,“英伟达反身性”就有点阴谋论了。TMT Breakout在与网友的讨论中,隐隐将英伟达周五下跌的原因指向DeepSeek的爆火。
恩……上面这段话诸位是不是看不太懂?没关系,我们把它交给DeepSeek-R1,马上解释的明明白白:
DeepSeek R1的突然爆火(可能因其技术突破或市场关注)与英伟达股价下跌之间存在某种关联。
X平台上的讨论情绪和英伟达股价下跌共同影响了市场参与者的行为,尤其是投机性交易者,他们试图通过做空英伟达股票来从中获利。
这种关联性在diffley/wigg等交易员或分析师开始公开讨论之前就已经被一些自营交易员捕捉到。
那么,R1爆火和英伟达下跌之间有什么关联呢?R1的答案:
R1的成功可能削弱了市场对英伟达AI芯片需求的预期,导致交易员做空英伟达股票,进而引发股价下跌。
比小编解释的还透彻,这细致入微,这推理能力,真是杠杠的。
而且……恩……大佬也是这么解释的:
“中国的#DeepSeek可能代表对美国股市的最大威胁,因为该公司似乎以极低的成本构建了一个突破性的人工智能模型,并且无需使用尖端芯片。这让人质疑投入该行业的数千亿美元资本支出的实际效用。”
不过,对于这个逻辑,华尔街大厂是不认的,Meta今年原定的500亿资本开支,小扎一句话就升到600亿至650亿。
看来,英伟达的芯片还是得继续买买买啊。
如今,人工智能领域出现突破是如此的普遍,以至于很难区分真正重要与无意中出现的突破。但最近的一次事态发展值得特别关注:来自中国的全新系列大语言模型DeepSeek-V3的出现。这件事对中美贸易的影响与在科技领域的影响一样大。
笔者已经对DeepSeek进行了好几天的测试,这是笔者过去几年中测试过的数十个大语言模型中最好的之一。它快速、容易上手,且有一个免费的版本。虽然在应对复杂或晦涩的问题上无法与美国最好的大语言模型相提并论,但笔者会把它归入一流的一档。其他人,包括测试人员也持同样的看法。
Deepseek-V3与多个国内外大模型的测试数据对比。 “Deepseek”公众号
DeepSeek还有几个值得注意的地方。首先,它来自一家对冲基金,而不是一家科技公司(不过,这样的分类方式可能也需要更新了)。其次,据报道,它的训练成本非常低,估计只有约550万美元,还不包括非计算成本(non-compute costs),这类统计通常都会排除那部分成本。
也许最引人注意的是,DeepSeek并没有使用质量最高级的半导体芯片。美国拜登政府一直在努力限制向中国出口这类芯片,希望减缓中国在人工智能和相关军事技术应用方面的进步。由于无法获得最新的尖端芯片,DeepSeek不得不寻找其他更便宜的方法来训练其模型。
笔者过去曾支持这类贸易限制措施,理由是人工智能技术事关国家安全。但笔者现在认为,这项禁令设置的目标过高以至于难以实现。禁令也许可以让中国在人工智能领域的进步推迟数年,但也间接导致了中国的一项重要创新——即DeepSeek的诞生。
现在全世界都知道了,只需花费相对较少的资金就足以训练出质量相当高的人工智能系统。对于俄罗斯、伊朗、巴基斯坦和其它国家来说,这可能会让发展类似的人工智能系统成为现实的愿景。可以想象,来自外国的亿万富翁也有能力发起类似的项目,虽然网罗技术人才会是一个制约因素。无论中国的人工智能系统及其潜在用途会带来哪些“风险”,其它国家在DeepSeek启发下发展的分支项目可能会更加令美国人担忧。
无论如何,各国几乎肯定能找到更便宜的构建人工智能系统的方法。但这里涉及一个权衡:美国的政策成功地拖延了中国将高质量芯片用于人工智能系统的能力,这相应地给美国带来了国家安全利益,但同时也加速了不依赖高质量芯片却有效的人工智能系统的发展。
这样的权衡最终是否会证明对美国有利,还需要时间观察。但这种权衡不仅仅体现在狭义的层面,尽管目前围绕DeepSeek的动机、定价策略、未来规划以及“与中国政府的关系”依然有许多尚未解答或无法回答的疑问,但在更广泛的层面,这种权衡也面临着不确定性。
借用奥地利经济学家路德维希·米塞斯(Ludwig Mises)的一句话:“政府干预会产生重要的、意想不到的次生后果。”要看一项政策是否奏效,不仅要考虑其直接影响,也要看它的二阶甚至三阶影响。
美国芯片禁令产生的一个次生效应是,它可能会鼓励一些中国使用者通过其它国家的第三方获得高质量芯片,或者租用非中国的、使用了高质量芯片的人工智能系统。在这种情况下,中国企业根本不需要购买芯片,至少在某些应用上不需要。美国的对策是更进一步地施加行业限制——但它真的能对全球半导体市场进行微观管理吗?笔者越来越表示怀疑。
美国当选总统特朗普的政府在考虑升级对华贸易措施时,最好仔细研究一番其前任政策带来的意外后果。可以肯定的是,一部分(而非全部)非人工智能贸易限制措施自有其国家安全层面的理由。但任何政策带来的直接影响很少是故事的全部结局。
例如,如果联邦政府决定限制一款在美国销售的中国商品或者服务,或选择对其征税,中国可以尝试通过第三方更换名称,销售同一款商品,而许多亚洲国家愿意助其一臂之力。擅长钻规则漏洞的企业家往往比政府官僚行动更加迅速。
抽象地说,关于“国家安全”的观点自有其说服力。但在现实中,以保护国家安全为目标的政策很难设计得周全。重要的是思考如何让实践更好地符合理论。
一夜间,DeepSeek在美国刷屏,股民们焦虑“这是在做空英伟达吗?”
R1模型发布一周之后,来自中国的神秘AI公司DeepSeek刷屏美国各大主流媒体和社交网站。以至于AI投资者“modest proposal”一脸问号地发推:
为何DeepSeek今天突然成为主流焦点,导火索是什么?
一石激起千层浪,各位网友纷纷表示“是啊是啊,确实蹊跷”,大家七嘴八舌,好不热闹。
有人猜测,可能是因为:1月20日DeepSeek发布了可以媲美OpenAI O1的R1模型。但proposal老哥很执着的追问,这是周一的事了,但为什么偏偏是今天火了?
拥有20年投资经验的大V TMT Breakout总结了可能的四个原因:
1、X平台算法导致;
2、Andreesen发推称赞;
3、纽约时报发了文章;
4、因为反身性,英伟达盘前下跌。
这里提到的Andreesen,显然就是指华尔街顶级风投A16Z创始人Marc Andreesen,他说了什么呢?
DeepSeek R1是我见过的最令人惊叹,最令人印象深刻的突破之一,并且是开源的,是对全世界的大礼。
好家伙,大佬对DeepSeek真是毫不吝惜溢美之词。Andreesen投过OpenAI、Databricks、Shield AI,无一不是行业翘楚。聊天机器人一个Character.ai也是他投出来的。
可以说,对于AI的最前沿发展,Andreesen算得上是权威了。
现在权威大佬给DeepSeek“盖戳认证”,这分量还真不轻。
不过,DeepSeek当得起这份“盛赞”。上个月发布的V3模型,仅用550万元2000张卡做的,和OpenAI几亿烧出来的一样好。
本周一发行的R1推理模型,更是技惊四座,赢得赞誉无数。
1月24日,在专业大模型排名 Arena 上,DeepSeek-R1 基准测试已经升至全类别大模型第三,其中在风格控制类模型(StyleCtrl)分类中与 OpenAI o1 并列第一。而其竞技场得分达到1357分,略超 OpenAI o1 的1352分。
至于纽约时报对DeepSeek的报道,我们也看了下,对DeepSeek的成功,纽约时报是既羡慕又警惕:
在我们的要求下,DeepSeek最新的R1模型很贴心地对文章内容进行了总结:
文章认为DeepSeek大模型以极低成本(600万美元)和少量芯片(2000块)实现了与OpenAI等巨头相媲美的性能,挑战了"唯有科技巨头才能研发尖端AI"的行业共识。
其成功源于中国工程师在美国芯片限制下的创新突破:通过开源生态协作、算法优化及资源整合,将黑市芯片与量化交易公司的算力积累转化为技术优势。
这种模式不仅揭示美国技术封锁的意外反效果,更预示中国可能通过开源主导权重构全球AI竞争格局,使低成本创新成为颠覆行业的新路径。其实,硬AI注意到,不仅是纽约时报,这两天海外主流财经媒体“不约而同”的对Deepseek进行了关注。让我们感受一下画风。
英国金融时报:
经济学人:
连线:
CNBC还做了一个40分钟的深度视频,紧张兮兮的讨论美国AI是不是受到了威胁。
第四个原因,“英伟达反身性”就有点阴谋论了。TMT Breakout在与网友的讨论中,隐隐将英伟达周五下跌的原因指向DeepSeek的爆火。
恩……上面这段话诸位是不是看不太懂?没关系,我们把它交给DeepSeek-R1,马上解释的明明白白:
DeepSeek R1的突然爆火(可能因其技术突破或市场关注)与英伟达股价下跌之间存在某种关联。
X平台上的讨论情绪和英伟达股价下跌共同影响了市场参与者的行为,尤其是投机性交易者,他们试图通过做空英伟达股票来从中获利。
这种关联性在diffley/wigg等交易员或分析师开始公开讨论之前就已经被一些自营交易员捕捉到。
那么,R1爆火和英伟达下跌之间有什么关联呢?R1的答案:
R1的成功可能削弱了市场对英伟达AI芯片需求的预期,导致交易员做空英伟达股票,进而引发股价下跌。
比小编解释的还透彻,这细致入微,这推理能力,真是杠杠的。
而且……恩……大佬也是这么解释的:
“中国的#DeepSeek可能代表对美国股市的最大威胁,因为该公司似乎以极低的成本构建了一个突破性的人工智能模型,并且无需使用尖端芯片。这让人质疑投入该行业的数千亿美元资本支出的实际效用。”
不过,对于这个逻辑,华尔街大厂是不认的,Meta今年原定的500亿资本开支,小扎一句话就升到600亿至650亿。
看来,英伟达的芯片还是得继续买买买啊。
Advertisements
相关新闻