下午察:中国超英赶美问鼎全球AI霸主地位

中国人工智能(AI)初创公司深度求索(DeepSeek)过去一个月横空出世,只用了600万美元(810万新元)及低功能晶片,就实现ChatGPT创始者美国AI龙头公司OpenAI投入不下10亿美元及采用高端晶才做出的顶尖AI大模型成果,震撼全球科技圈。

这也引发舆论质疑美国在AI领域的领先地位不稳,过去数年通过“小院高墙”策略限制AI晶片输华效果甚微。

深度求索1月20日在美国总统特朗普就职当天,推出新一代开源大模型DeepSeek-R1(简称R1),是一个月来二度推出以极低成本训练出的廉价AI大模型。R1仅用三十分之一成本,性能竟比肩OpenAI上月初新发布的GPT-o1大模型正式版,被认为是大模型行业最大黑马,引发一些业界人士喊出“DeepSeek接班OpenAI”的口号。

深度求索还被不少外国网民称为“神秘的东方力量”,关注中国是否能在对美科技战中突围,在AI大模型赛道上实现超英赶美,问鼎第一把交椅。

深度求索以小博大

被称为“AI界拼多多”的深度求索,去年12月才推出DeepSeek V3模型崭露头角。不到一个月,深度求索又震动全球AI圈。有别于上次,新问世的R1不仅继续维持低成本,技术上也实现模型具备推理思考能力的重大突破。

在美国大模型排名榜Chatbot Arena上,R1的基准测试排名已升至全类别大模型第三,在风格控制类模型分类中与GPT-o1并列第一。

R1很快吸引国际科技大佬目光。美国AI晶片巨头英伟达高级AI研究科学家范麟熙上星期一通过社交平台X发文,表示看好深度求索前景,指一家非美国公司正在延续OpenAI最初使命,即通过真正开放的前沿研究赋能全人类,认为这是“历史时刻”。

深度求索来势汹汹在美国硅谷也引发不安。

彭博社引述美国科技巨头谷歌母公司Alphabet Inc总裁兼首席投资官波拉特1月21日坦言,美国无法保证在开发AI的竞赛中一直领先中国。

美国微软首席执行官纳德拉22日在达沃斯世界经济论坛上说,深度求索新模型令人印象深刻,呼吁非常严肃看待中国AI发展。

美国匿名平台teamblind24日流传一条引述脸书母公司Meta员工的贴文,称目前Meta内部因深度求索模型已进入“恐慌模式”。

中国国产游戏大作《黑神话:悟空》制作人、游戏科学创始人冯骥,26日形容深度求索的成功是“震撼的突破”“国运等级的成果”。他希望深度求索R1会让人对当前最先进的AI祛魅,让AI逐渐变成人们生活中的水和电。

中国官媒《经济日报》26日发文指出,大模型创新不一定要依赖最先进的硬件,“瘦身”反而促进AI技术的创新和突破。

深度求索工程师透露,他们的AI系统只需约2000块英伟达生产的二流H800计算机晶片,美国大公司则需多达1.6万块一流晶片。

深度求索目前在太平洋两岸爆红。苹果应用商店免费榜27日显示,深度求索在美区和中国区双双夺魁,超越领头羊ChatGPT。访问量激增还导致深度求索26日出现短时闪崩现象。

深度求索的效应27日也传导到股市,全球各地受到不同程度冲击。日经指数受科技股拖累下挫1%,向英伟达供货的日本半导体测试设备巨头Advantest股价重挫8.5%。荷兰光刻机巨头阿斯麦(ASML)早盘也重挫多达9.4%。

中国市场反应同样喜忧参半。沪深300指数AI股指下跌2.2%,大数据股则上涨4%。

中国AI领域群雄逐鹿

自ChatGPT2022年问世掀起AI革命浪潮以来,许多专家和投资者一度认为,如果AI企业不投入数亿美元购买AI专用芯片,就难以缩小与行业领军者的差距。

深度求索的另辟蹊径打破这种迷思,其大模型表现引发西方舆论哗然,指美国的出口管制迫使中国研究人员,使用网上免费的各种工具来发挥创造力。

中国AI领域目前仍是群雄逐鹿的格局。阿里巴巴、百度、腾讯等科技领军企业都投入大量资金和资源,为旗下AI项目争夺硬件和客户。与国际知名AI专家李开复前年5月组建的起步公司零一万物(01.AI)一样,深度求索以开源生态系统先快速招募最大数量的用户,而后才制定盈利策略。

通过推出更实惠的模型,深度求索已把中国AI开发商成本降低,在过去一年半大型企业开打价格战期间脱颖而出。

中国央视《新闻联播》画面显示,深度求索创始人梁文锋(40岁)20日参加中国总理李强主持召开的座谈会,对《政府工作报告》发表意见,显示北京高层对这家初创企业的重视。

深度求索创始人梁文锋(40岁,前排右)1月20日参加中国总理李强主持召开的座谈会,对《政府工作报告》发表意见。(中国央视《新闻联播》)

据报道,梁文锋来自广东湛江,浙江大学硕士毕业后留在杭州创业,2015年创立对冲基金“幻方量化”,一度成为中国首家突破千亿元人民币(185亿新元)的私募量化大厂。2023年全球AI热潮爆发,梁文锋宣布转变赛道,同年7月成立深度求索。

梁文锋掌舵的深度求索并不采取跟随策略,而是坚持在模型结构层面做突破性的创新。行业人士指出,深度求索人才密度极高,其139名研发人员大多由中国本土培养,许多是清华北大应届生、在读生。面试过的应届生评价,深度求索“只招1%的天才,去做99%中国公司做不到的事情”。

梁文锋去年7月在中国自媒体“暗涌Waves”的采访中说,中国的AI不可能永远跟随,需要有人站到技术的前沿。

美国AI霸主之位不稳?

中美科技战僵持不下,北京日益成熟的科技技术持续引发华盛顿担忧。拜登政府上周临去前对用于AI的先进晶片宣布新出口措施,进一步限制中国获得相关产品。

美国总统特朗普重返白宫隔天,选在AI领域宣布首个投资重头戏:由日本软银集团、OpenAI和美国科技巨头甲骨文三家企业投资5000亿美元,打造名为“星际之门”(Stargate)的项目,用在美国建设支持AI发展的基础设施,被舆论拿来与1980年代时任美国总统里根推出与前苏联争夺太空的“星球大战”计划相提并论。

美国总统特朗普(左)1月21日在白宫宣布“星际之门”(Stargate)项目,甲骨文公司董事长埃里森(Larry Ellison)在旁聆听。(法新社)

据报道,星际之门首期10座数据中心建在得克萨斯州,目标是将美国建立成“算力帝国”。特朗普还宣布能源紧急状态,为星际之门供能。

特朗普23日再颁布与AI有关的行政命令,要使美国成为AI世界之都,并点名中国是AI竞争者。

一些美国专家认为,AI竞争已进入“拼基建”阶段,美国相较中国的硬件优势,将因特朗普政府此次宣布的AI基建布局再次拉大。但也有迹象显示,中国正通过开源技术,在关键AI技术指标上赶超美国企业。

Meta在2023年免费分享名为LLama的AI模型、与世界各地企业和研究人员共享基础代码后,AI开源生态系统开始蓬勃发展。但有不少高管和专家认为,美国大公司不应开源其技术,以防被用来传播虚假信息或造成其他严重危害。

有专家则警告,如果监管机构扼杀开源技术在美国的进步,中国将获得显著优势。如果最好的开源技术来自中国,美国开发人员将基于这些技术构建他们的系统,长远可能会让中国成为研发AI的中心,对美国可能是巨大的危险。

尽管深度求索目前看似成功以小博大,但这个AI模型并非完美无瑕。与所有其他中国AI模型一样,深度求索对北京官方认为敏感的话题进行自我审查。其云基础设施也可能因突如其来的访问流量暴增而备受考验。

中美在特朗普2.0时代的AI博弈已经落子,华盛顿能否应对来自北京的不对称竞争,还有待观察深度求索以小博大的模式,能否持续根本颠覆AI模型领域。最终鹿死谁手,还很难说。

您查看的内容可能不完整,部分内容和推荐被拦截!请对本站关闭广告拦截和阅读模式,或使用自带浏览器后恢复正常。