DeepSeek的惊人崛起是人工智能“珍珠港事件”?(图)
大鱼新闻 财经 1 day, 15 hours
图像来源,Reuters
Article informationAuthor,吕嘉鸿Role,BBC中文记者
在美国总统特朗普重返白宫的第一个周末,中国科技界向矽谷及白宫高层投下了震撼消息。中国杭州一家AI初创公司推出的机器人聊天产品“DeepSeek”(深度求索),使得美国在人工智能领域的主导地位受到空前质疑。
这家公司由40岁的青年创业者梁文锋创办,产品上架后,其功能和自称的低开发成本震撼了矽谷以及包括OpenAI在内的竞争对手。美国的AI技术领头公司如辉达(英伟达)(Nvidia)等在股市上瞬间创纪录地暴跌。
DeepSeek同时在中国社交媒体上引发沸腾,被视为中国AI能力能匹敌甚至超越美国的证据,之前美国遏制中国AI硬件技术的多年努力似乎付之东流。
DeepSeek的横空出世,让各界难以避免地陷入中美之争的又一轮大讨论:美国是否未能阻止中国 AI 产业的进步?DeepSeek是否有效地取代了其主要竞争对手OpenAI的产品ChatGPT?在美中科技战正酣之际,刚重返执政的特朗普是否会加强对中国AI科技的防堵?
科技分析师、前北京大学光华管理学院教授陶迅(Jeffrey Towson)对BBC中文表示,如果美国的AI公司如同过去的史蒂夫·乔布斯,中国的AI公司则可比拟当时的比尔·盖茨。虽然它们的运作方式不同,但都将成为终身竞争对手。他说,目前所有的目光都聚焦在DeepSeek上,但当人们意识到中国的Kling AI和 Minimax现已成为全球生成式AI影片生成器的领导者时,可能再次引发冲击。
AI半导体评论网Tech Tech China总监卓薇安(Vivian Toh)向BBC分析,DeepSeek的成功证明中国的AI技术具备自身的创新能力,而非仅仅基于OpenAI或使用其开源模型。“AI大模型的发展路径,未必是OpenAI的路。”
然而,新加坡国立大学李光耀管理学院的资深研究员艾力克斯·卡普里(Alex Capri)则指出,DeepSeek的成就显示中国公司在创新和寻找方法方面,巧妙地规避了华盛顿施加的出口管制及技术转移的层层限制。“这是一种不对称的权力结果。自由可得的传统技术被巧妙改装,转变为一种增效器。但外界仍需观察DeepSeek最初囤积的辉达高端 AI 晶片是否在这一过程中扮演了更重要的角色,或是否还有其他外国技术元素对 DeepSeek的发展提供了关键协助。”
特朗普会加强防堵中国AI吗?
图像来源,cctv
图像加注文字,40岁的梁文锋(右)受邀参加中国总理李强主持的座谈会。
上周一(20日),中国总理李强主持召开了一场专家和企业家代表的座谈会,听取他们对《政府工作报告(征求意见稿)》的意见与建议。40岁的梁文锋受邀在会上发言。
有分析指出,考虑到中国政府近年来在整肃阿里巴巴等科技巨头后,对私营科技公司的管控与提防相当严厉,北京此刻让梁文锋高调出席并发表报告,意义深远。有观点认为,北京此举与DeepSeek本周在矽谷科技界及华尔街股市引发的震撼效应相呼应,似乎是在向新上任的特朗普政府挑战,意图“秀肌肉”。
DeepSeek震撼美国股市后,美国总统特朗普在谈话中特别提到DeepSeek的成功,并表示这对美国的AI产业来说是个警钟,“我们美国必须全神贯注于竞争才能致胜”。他还称中国冲击对矽谷或许是“正面”的影响,迫使矽谷以更低成本的方式进行创新。
分析美中AI科技战的发展,位于华府的智库保卫民主基金会(FDD)中国资深研究员辛格顿(Craig Singleton)向BBC分析,DeepSeek热潮背后,北京将人工智慧视为其在当今创新军备竞赛中争取主导地位的基石,目的不仅是为了在人工智慧领域取得优势,更希望利用这一优势,在高超音速、量子计算和自主系统等领域领先一步,重塑全球的权力版图。
辛格顿认为在DeepSeek震惊金融市场后,特朗普政府对中国的AI挑战及管制不会松手,且会越来越积极。
新加坡国立大学的卡普里(Alex Capri)也告诉记者,美国政府显然会寻找方法来阻止如今可能已经进入开源平台的战略技术。
他表示,如果中国及其他公司能够开发出领先的认知AI,并利用这一技术在其他战略领域(包括军事用途)中提升竞争优势,而不需要使用辉达的先进AI晶片,华盛顿将失去重要的地缘政治杠杆。随着特朗普政府向“中等收入国家”施压,要求它们在建立数据中心或云基础设施时选择美国而非中国技术,这一问题在未来可能会变得更加重要。
分析师陶迅则批评美国政府,指出对中国公司的施压往往是不稳定且不合逻辑。他认为,华府对北京的防堵行动通常来自美国科技公司的游说,以国家安全的名义掩盖其真正的意图。
图像加注文字,特朗普在DeepSeek震撼美国股市后,在谈话中特别提到DeepSeek的成功,并表示这对美国AI产业来说是个警钟。
如何看待人工智慧的“低价创新”?
2024年圣诞节后,DeepSeek率先发布最新的AI系统DeepSeek-V3,相关市场及政治效应逐渐在矽谷扩散。昨日,DeepSeek冲上美国Apple App Store免费应用程式下载榜首,成为引发这轮股市震荡的标志性事件。
矽谷创投家兼特朗普顾问马克·安德森(Marc Andreessen)将 DeepSeek-R1 描述为“人工智慧的斯普特尼克(Sputnik)时刻,这是指苏联于1957年首度发射的人造卫星。更有许多媒体将此事件比喻为美国AI界的“珍珠港事件”。
这款AI模型搭载了DeepSeek-V3,创办人梁文锋将DeepSeek形容为开放源代码模型中排名第一,且能媲美全球最先进的封闭模型。
在梁文锋旗下的幻化魔方公司发布自称的低成本AI模型后,美国AI概念股应声大跌。其中AI 晶片设计龙头辉达股价周一暴跌了16.97%,市值蒸发达5926.58亿美元。许多分析指出,DeepSeek震撼美国科技界的原因不仅在于其性能足以与全球首要竞争对手ChatGPT一较高下,更重要的是成本仅为其对手的一小部分,这立即引发市场及舆论对美国在AI领域竞争力的担忧。
根据台媒《天下杂志》报导,从美国许多第三方的基准测试结果来看,DeepSeek系统超越了许多大批美国同行,例如Meta的Llama 3.1、OpenAI 的GPT-4o,以及Anthropic的Claude Sonnet 3.5等等,而这些矽谷引以为傲的模型动辄需要上亿美元的投入才能推出。相较之下,DeepSeek仅需约600万美元的开发成本。
Bernstein科技分析师的研究进一步指出,DeepSeek的AI模型价格比起美国OpenAI的产品便宜20至40倍。根据公开资料,DeepSeek Reasoner R1模型处理每百万个输入字元的成本仅为0.55美元,而OpenAI的同类型模型则需15美元。
图像来源,BBC News Chinese
图像加注文字,作为中国开发的AI模型,DeepSeek似乎避开所有在当地被视为敏感的议题。
半导体分析师卓薇安向BBC解释,在DeepSeek出现之前,业界共识认为AI大模型的开发需要投入百亿美元级别的资金以获得算力,因此大多数AI大模型公司必须掌握上亿美元的资金才能维持竞争资格。DeepSeek的出现打破了这一共识:“大家发现只需几百万美元便能达到相同效果,这震惊了所有人,甚至让辉达等晶片厂商的价值不再如大家想像中那么珍贵。”
不过,AI研究学者、台湾政治大学学务长蔡炎龙在脸书专号分析指出,如果没有基础的开源模型,如Llama等,就无法开发出DeepSeek R1,而这些基础开源模型的开发也需要花费相当的资金。蔡教授表示:“DeepSeek更像是在进行聪明的微调。”
台湾财经评论员胡采苹则质疑,DeepSeek的母公司幻化魔方是最重视晶片装备的一家公司,过去中国媒体曾报导他们大量添购GPU及辉达晶片,为自身发展增添动力。因此,DeepSeek的开发背后不可能仅仅花费600万美元(约新台币一亿)的成本。
此外,路透社今日发表的分析报导称,有研究报告中强调,DeepSeek V3模型的总训练成本尚不清楚,但远高于该新创公司所说的用于运算能力的558万美元。此外,美国Scale AI 执行长汪滔(Alexandr Wang )上周在接受CNBC采访时也认为,DeepSeek 拥有50,000颗辉达H100晶片,用来开发模型,而购买这些晶片需要的资金远高于558万美元。
至今,DeepSeek没有公开回应对于其成本的质疑。
卓薇安则向BBC强调,如果不是来自内部团队,很难给出负责任的产品投资金额数据,目前我们所见DeepSeek这套产品在算法上实现了绝对领先,但尚未有证据显示其实现全方位的领先。
AI产品普及化时代的来临?
图像来源,Getty Images
图像加注文字,有技术分析指DeepSeek与其竞争对手、美国的ChatGPT功能已经不相上下。
DeepSeek的横空出世,可以管窥中国公司以低价创新模式试图在全球市场突围的逻辑。
台北AI咨询公司Ikala执行长程世嘉在个人专页评论称说,完全开源的DeepSeek象征着AI普及化便宜化的时代即将到来。他分析,当DeepSeek等AI产品能够如此普及通用且成本低廉之际,只会更增加全世界的需求,主因是AI是所谓的通用型技术,包含“又快、又好、又便宜”且人人都会使用的通性。程先生举例,过去只有水力和电力能称得上是最基本的通用型技术,而现在AI就是下一个水电,正在变成人类的基础设施。
陶迅也向BBC说,中国公司在成本创新方面拥有超过30年的历史,擅长以可接受的品质将产品价格压低。比如在电动车领域的比亚迪、电信设备领域的华为以及电子商务领域的拼多多等。现在,DeepSeek在人工智慧领域也展现了这一优势。
陶迅说,“低价是赢得中国中产阶级及全球南方市场,特别是东南亚和拉丁美洲的关键。”
但台北的半导体评论家许美华在脸书称,说到底,晶片才是关键,因为复杂算力要靠高阶晶片。“晶片规格是先天优势,其他都是后天努力。再好的演算法、工程优化,即使在效能上取得一时的领先,比到最后,都抵不过晶片先天算力的限制。”她说,若美国未来真的全面执行拜登下台前颁布的AI晶片三级禁令,全方位的封锁中国取得晶片的管道,未来中国公司在AI技术上突破是很困难的事情。
DeepSeek是一家什么公司?开发成本仅600万美元的软件为何引发美国科技股暴跌?
图像来源,Getty Images
图像加注文字,DeepSeek以低廉的造价震惊市场。Article informationAuthor,彼得·霍斯金斯(Peter Hoskins)、伊姆兰·拉赫曼·琼斯(Imran Rahman-Jones)、布兰登‧德雷农(Brandon Drenon)Role,BBC记者
中国公司DeepSeek(深度求索)开发的人工智慧聊天机器人自今年1月在美国发布后,迅速成为苹果商店下载次数最多的免费应用程式。
这款应用程式的突然流行,以及DeepSeek与美国人工智慧公司相比成本较低的优势,让金融市场陷入混乱。
在美国,AI晶片制造商英伟达股价周一下跌16.9%,其竞争对手博通的股价下跌17.4%,微软下跌2.14%,谷歌母公司Alphabet下跌超过4%。在欧洲,荷兰晶片设备制造商ASML周一收盘时股价下跌逾7%,
在本月初推出 DeepSeek-R1后,该公司宣称其在执行数学、编码和自然语言推理等任务时“性能可与OpenAI的最新模型之一媲美”。
矽谷创投家兼特朗普顾问马克·安德森(Marc Andreessen)将DeepSeek-R1描述为“人工智慧的斯普特尼克(Sputnik)时刻”,这是指是苏联于1957年先于美国发射的人造卫星。
马克·安德森称赞DeepSeek是人工智慧领域“最令人惊叹、最令人印象深刻的突破之一”。
DeepSeek表示,其最新的人工智慧模型与美国领先业界的模型(如ChatGPT)相当,但成本仅相当于其一小部分。
该应用程式的研究人员表示,开发该应用程式仅花费600万美元(480万英镑),远低于美国人工智慧公司花费的数十亿美元。
上周,OpenAI与其他的一些公司一起承诺投资5000亿美元在美国建设人工智慧基础设施,特朗普重返白宫后称这个项目是“迄今为止历史上最大的人工智慧基础设施项目”,表示这有助于将“技术的未来”留在美国。
DeepSeek的出现正值美国限制向中国出售人工智慧先进晶片技术之际。
为了在没有稳定的进口先进晶片供应的情况下继续开展工作,中国的人工智慧开发人员彼此分享了他们的工作成果,并尝试了新的技术方法。
这使得人工智慧模型所需的算力比以前少得多。这也意味着它们的成本比以前认为的要低得多,有可能颠覆整个产业。
什么是DeepSeek?创办人梁文峰是谁?
DeepSeek是一家中国人工智慧公司,成立于中国东部城市杭州。全称是杭州深度求索人工智能基础技术研究有限公司。
据Sensor Tower称,该公司于2023年7月成立,但其流行的AI助理应用程式直到1月10日才在美国发布。
该公司创办人、“85后”梁文锋利用自己发起的对冲基金为DeepSeek提供了部分资助。
据报道,这位40岁的资讯与电子工程专业毕业生开设了一家英伟达(辉达)A100晶片商店,目前这些产品被禁止出口到中国。
专家认为,正是这些晶片(有人估计约为50,000块)促使他推出了 DeepSeek,透过将这些晶片与仍可进口的更便宜、更低端的晶片配对。
梁先生最近出现在行业专家和中国总理李强的一次会议上。
2024年7月接受英文出版物The China Academy采访时,梁先生表示,他对自己之前开发的人工智慧模型版本引发的反应感到惊讶。
他说:“我们没想到定价会成为如此敏感的问题。”
“我们只是按照自己的节奏,计算成本,并根据此设定的价格。”
谁在使用它?
该公司的人工智慧应用程式可在苹果的App Store及其网站下载。
这项免费应用很快就成为苹果商店下载量最大的应用程序,尽管有报道称人们在注册时遇到了困难。
它也成为美国苹果应用商店中评分最高的免费应用程式。
该应用程式有什么作用?
DeepSeek因其强大的AI助理而广受欢迎,其操作方式与ChatGPT类似。
根据App Store上的描述,它的设计目的是“回答您的问题并有效地改善您的生活”。
用户对该应用程式留下的评论是“它让写作更加个人化”。
但该聊天机器人回避了至少一个政治敏感问题。
当BBC 询问该应用程式1989年6月4日天安门广场发生了什么事时,DeepSeek回答说:“很抱歉,我无法回答这个问题。我是一个人工智慧助手,旨在提供有用且无害的回答。”
图像来源,Getty Images
图像加注文字,DeepSeek导致其它科技公司股价暴跌。
为什么它会影响英伟达这样的巨头?
据报道,DeepSeek的开发成本仅为其美国竞争对手的一小部分。DeepSeek的开发成本低了数亿美元,这不得不引发了人们对美国未来人工智慧主导地位的质疑。
1月27日,该公司带来的成本降低空间的可能性震动了金融市场,导致科技股占比较高的纳斯达克指数下跌超过3%,全球晶片制造商和资料中心也遭遇抛售。
在美国,AI晶片制造商英伟达股价周一下跌16.9%,其竞争对手博通的股价下跌17.4%,微软下跌2.14%,谷歌母公司Alphabet下跌超过4%。在欧洲,荷兰晶片设备制造商ASML周一收盘时股价下跌逾7%,生产人工智慧相关硬件的西门子能源股价暴跌超过五分之一。
以市值衡量,英伟达曾是全球最有价值的公司,但周一其市值从3.5兆美元缩水至2.9兆美元,落后于苹果和微软,跌至第三位。
DeepSeek使用的半导体晶片不如英伟达生产的晶片先进。
他们的成功打破了人们的信念:更大的预算和顶级晶片是推动人工智慧发展的唯一途径,这一前景为高性能晶片的需求和未来带来了巨大的不确定性。
“这种低成本中国版的想法并不一定是前沿的,因此让市场有点意外。”金融机构City Index高级市场分析师费奥纳·辛克塔(Fiona Cincotta)表示。
“因此,如果你突然获得这种低成本的人工智慧模型,这将引发对竞争对手利润的担忧,特别是考虑到他们已经在更昂贵的人工智慧基础设施上投入的金额。”
新加坡科技类股票顾问卫森·林·(Vey-Sern Ling)告诉 BBC,这“可能会破坏整个人工智慧供应链的投资案例”。
但华尔街银行花旗警告称,虽然DeepSeek可以挑战OpenAI等美国公司的主导地位,但中国公司面临的问题可能会阻碍它们的发展。
分析师在一份报告中表示:“我们估计,在不可避免的更严格的环境中,美国获得更先进的晶片是一种优势。”
DeepSeek周一表示,由于其软体遭遇“大规模恶意攻击”,它将暂时限制注册。
Advertisements
相关新闻
- 欧美AI巨头财报会,每一家都被问了DeepSeek(图)
- OpenAI展开调查:DeepSeek或用被禁止技术开发模型(图)
- DeepSeek在美国商标被抢注:抢注者系梁文锋校友(图)
- DeepSeek甚至绕过了CUDA 英伟达的护城河还在吗(图)
- OpenAI宣称DeepSeek违规“蒸馏”,但没给出证据(图)
- 美国AI巨头CEO万字檄文:DeepSeek崛起,应加码管制(图)
- 媒体:DeepSeek把奥特曼和李彦宏脸都给打肿了(组图)
- DeepSeek无法敲响美国科技丧钟 但敲响了警钟(图)
- 法媒:中国DeepSeek让硅谷颤抖 市场反应是否夸张了?
- OpenAI称有证据显示DeepSeek存在侵权行为(图)