OpenAI首席研讨官:DeepSeek自力发觉了o1的一些中心
发布时间:2025-01-30 08:31
呆板之心报道编纂:张倩本钱打上去了,需要更多才对?春节这多少天,海内外 AI 圈都被 DeepSeek 刷了屏。英伟达的股市震动更是让全天下看得呆若木鸡。简略来说,DeepSeek 近来宣布的两个模子 —— DeepSeek-V3 跟 DeepSeek-R1 以很低的本钱取得了比肩 OpenAI 同类模子的机能。这激发了市场对 AI 硬件需要的担心,投资者担忧将来对英伟达高端芯片的需要可能会增加。与此同时,对于 DeepSeek 技巧翻新的探讨也十分多。良多人以为,DeepSeek 在硬件受限的前提下被逼走出了一条差别于 OpenAI 等狂堆算力的途径,用一系列技巧翻新来增加模子对算力的需要,同时取得机能晋升。这些成绩失掉了包含 Sam Altman 在内的 AI 领武士物的确定。随后,OpenAI 首席研讨官 Mark Chen 也发了帖。他表现,DeepSeek 确切自力发明了一些 OpenAI o1 也在用的中心理念,不外,这并不代表 OpenAI 在算力上的高投入是分歧理的。帖子原文如下: 祝贺 Deepseek 开辟出了 o1 级其余推理模子!他们的研讨论文标明,他们自力发明了一些咱们在通往 o1 的路上发明的中心理念。不外,我以为外界的反映有些适度夸张,特殊是在本钱方面的说法。领有两个范式(预练习跟推理)象征着咱们能够在两个维度而不是一个维度(低本钱)上优化某项才能。但这也象征着咱们有两个能够扩大的维度,咱们盘算在这两个维度上都踊跃投入算力!跟着蒸馏研讨的日益成熟,咱们也发明下降本钱跟晋升才能愈发解耦。可能以更低本钱(特殊是在更高耽误的情形下)供给效劳,并不料味着就能发生更好的才能。咱们将持续晋升以更低本钱供给模子效劳的才能,但咱们对咱们的研讨道路图坚持悲观,并将持续专一于履行它。咱们很愉快能在本季度跟往年为各人带来更好的模子!短短多少段话,Mark Chen 表白了好多少层观念,咱们让 DeepSeek-R1 来解读一下每段话的话中有话: 总之,跟 Sam Altman 一样,Mark Chen 的谈话也是在重塑外界对 OpenAI 的信念,并预报往年会带来更好的模子。别的,OpenAI研讨迷信家Noam Brown也在尽力弱化外界对OpenAI跟DeepSeek的对照,但各人仿佛并不买单。别的,Mark Chen 提到的「外界的反映有些适度夸张,特殊是在本钱方面的说法」这一点近来也被良多人探讨,尤其是「DeepSeek-v3 练习本钱仅为 558 万美元」这一说法。实在,DeepSeek-v3 的技巧讲演原文是这么写的:「上述本钱仅包含 DeepSeek-V3 的正式练习,不包含与架构、算法、数据相干的后期研讨、融化试验的本钱」。图灵奖得主、Meta AI 首席迷信家 Yann LeCun 也以为市场对 DeepSeek 的本钱反映并分歧理。不外,他是从推理的角度来看的。他指出,人们经常认为巨额投资重要用于练习更强盛的模子,但现实上年夜局部钱都花在了让这些 AI 效劳可能稳固地效劳数十亿用户身上。并且跟着 AI 才能的加强,保持效劳运转的本钱会变得更高,要害是要看用户能否乐意为这些加强的功效付费。 不少网友对 LeCun 的见解表现赞成,以为练习、推理本钱更低的 AI 象征着这项技巧能更快遍及,从而发明更年夜的市场。从这个角度来看,DeepSeek 在下降推理本钱方面的尽力仿佛比下降练习本钱的奉献更值得被存眷。针对可能行将到来的推理需要的激增,OpenAI、Meta 等都在做响应筹备,比方旨在为 OpenAI 建立强盛基本设备的「星际之门」名目(打算投资 5000 亿美元,但资金能否到位始终存疑)、Meta 新一年 600 亿美元的 AI 投资……看来,2025 年,AI 市场的竞争仍然剧烈,DeepSeek 将在新一年走出多远另有待察看。