大鱼新闻 | 生活 | DeepSeek崛起之路:“炒股神器”到人工智能明星(图)

DeepSeek崛起之路:“炒股神器”到人工智能明星(图)

6Park 生活 5 hours, 42 minutes

DeepSeek起源于金融，并非为发展技术本身而做技术。 Lam Yik/Bloomberg两年前，当百度和阿里巴巴等知名中国科技公司通过发布夺人眼球的公告和新聊天机器人来追赶硅谷在人工智能领域的进展时，DeepSeek采取了不同的做法。它专注于研究。

这个策略奏效了。

这家中国初创公司称，它创建了一个功能强大的人工智能模型，其构建成本大大低于资金雄厚的美国竞争对手的产品，这一消息震惊了整个科技界。

在中美两国争夺人工智能主导权的竞争中，DeepSeek似乎横空出世。事实上，它近年来在中国科技界一飞冲天，走的完全不是传统路数。

DeepSeek的研究使命与OpenAI等公司相似，OpenAI在2022年秋季为美国在人工智能领域做出了标志性的贡献。不过，它们的相似之处大多仅止于此。

DeepSeek起源于金融，并非为发展技术本身而做技术。。它的母公司是一家名为幻方的中国对冲基金，起初并不是一家像Open AI那样致力于保护人类免受人工智能侵害的实验室，而是一家利用人工智能在中国股市下注的企业。

中国的散户投资者以冲动进出股市而闻名，幻方正是抓住了这一市场的机遇，得以蓬勃发展。2021年，幻方发现自己受到了中国监管机构打击投机的压力，政府认为这有悖于保持市场平稳的努力。

因此，幻方开始寻求一个新的机会，它认为这个机会更符合中国政府的优先事项：先进的人工智能。

“我们主要做的科技方向——只是大家习惯把我们局限在投资领域，AGI有大得多的用处和大得多的价值，”2023年，幻方首席执行官陆政哲对中国官方媒体说。“我们独立于投资新成立了一个团队，相当于二次创业。”

DeepSeek应运而生。与其他许多中国初创企业一样，它以不同的商业模式进入了一个成熟的市场。

据信，DeepSeek的最新人工智能模型几乎与美国竞争对手一样强大，但效率却高得多。它的成功表明，硅谷在人工智能领域的领先优势已经缩小。尽管华盛顿努力限制中国获得人工智能所需的先进芯片，但DeepSeek的突破还是让人怀疑这些控制措施是否长期有效——尽管DeepSeek的创始人承认芯片限制是一个问题。

DeepSeek在北京的办公室。 Peter Catterall/Agence France-Presse — Getty Images

DeepSeek并没有依靠生产面向消费者的人工智能产品来获取收入，直到本月才发布了第一个聊天机器人，任何人都可以通过简单的命令生成文字和照片。实际上，该公司利用幻方从股票交易中赚到的钱来资助雄心勃勃的研究。这种做法使它有别于美国的竞争对手，因为它们从根本上都是消费技术公司。

这种非常规方法也让DeepSeek得以避开中国政府对公众使用的人工智能的严格监管。由于该公司专注于研究，并向使用其模型的企业销售产品，而在本月发布聊天机器人之前，并不面向消费者应用，因此其早期工作并未引发同样的政府限制。

DeepSeek的首席执行官梁文锋是一位戴眼镜的清瘦工程师，曾就读位于杭州的浙江大学。他在接受中国媒体的几次采访中反复表示，要赶上美国的创新步伐，中国公司必须把研究放在利润之前。DeepSeek和幻方都没有回应置评请求。

梁文锋在接受中国科技媒体36氪的一次广为流传的采访时说，中国科技公司“缺的不是资本，而是缺乏信心以及不知道怎么组织高密度的人才”。

根据采访和公开报道，与梁文锋共事过的人都认为他是一位有能力、有深厚技术背景的管理者。

曾参与DeepSeek早期模型开发的计算机工程师王子涵（音）说：“他绝对是个INTP，”他指的是迈尔斯·布里格斯测试中的一种内省型人格类型，这是一种在中国年轻人中很流行的人格测试。“INTP是很好的研究者，他们喜欢探索，”王子涵说。“他不是那种想控制一切的人。”

他说，梁文锋不太在意项目时间表等细节，偶尔会向整个研究团队提出一些发人深省的研究问题。但最主要的是，梁文锋似乎以推动技术进步为动力，并不注重利润。

许多中国公司倾向于招聘程序员，梁文锋与他们不同，他出了名地会聘用计算机领域以外的人才。DeepSeek的员工中有来自中国顶尖大学的诗人和人文学科专业的学生，他们训练模型编写中国古典诗词，并解答中国难度很大的高考题。

“团队中的大多数人都毕业于中国的顶尖大学，”旧金山巴塞顿公司的首席软件工程师张一能（音）说，他负责SGLang项目，该项目不是DeepSeek的一部分，而是帮助人们在DeepSeek系统的基础上进行构建。“他们非常聪明，也非常年轻。”

多年来，中国科技公司一直是计算机视觉领域人工智能应用，如面部识别的先驱。但是，OpenAI发布的ChatGPT引起了人们的反思。当没有一家中国公司立即发布可与之媲美的产品时，许多人得出结论：美国公司在先进的人工智能领域处于领先地位。

DeepSeek使用2000枚英伟达专用芯片训练其人工智能聊天机器人，远远少于美国领先公司使用的1.6万枚芯片。 Stella Kalinina for The New York Times

在中国，计算机科学家们决心证明自己能够与之竞争。2023年，中国的许多公司都发布了自己的大语言模型，该技术是ChatGPT等聊天机器人的基础。

但是，打造先进的模型需要使用大量芯片，这将花费数亿美元。

幻方也在投入大笔资金。到2021年，它已成为能够储备10000多枚英伟达高级A100芯片的少数中国公司之一。

然而，DeepSeek的研究为它带来了意外的优势。去年，它大幅降低了向使用其模型开发应用程序的开发者收取的费用，从而引发了一场与大型竞争对手的价格战。

曾在DeepSeek工作的工程师王子涵说，公司很少讨论他们正在开发的技术的商业应用问题。相反，他说，公司的重点是打造一个人工智能系统，供不同的人用于不同的目的。

“我在那里工作期间，我们并没有过多地讨论如何赚钱，”他说。“他们只是专注于打造一个优秀的基础模型。”

DeepSeek广受欢迎的一个重要原因是，它公开了开发者的工作。这种被称为开放源代码的信息共享一直是计算机软件、互联网和人工智能发展的基石。

在美国，人工智能研究人员和企业家长期以来一直在关注DeepSeek的技术进展。去年，该公司发布了可自行生成计算机程序的系统，引起了广泛关注。

DeepSeek新的知名度可能带来新的挑战。就在上个月发布新聊天机器人R1的同一天，梁文锋出席了与中国总理李强的座谈会。

DeepSeek的突然走红将其推向了中国共产党激励创新的努力的中心，这可能会难以驾驭，联邦资助的智库兰德公司技术分析高级顾问吉米·古德里奇说。“这对DeepSeek来说是一个很严重的两难局面，”他说。“我相信中国政府的五年计划中肯定没有他们。”

“当党和世界都注视着他们，他们还能保持这种混乱而自由自在的愿景吗？”