从堆参数到造飞轮:DeepSeek正在颠覆OpenAI的生存逻辑|deepseek|openai|马斯克|雷涛|算法

文章ID:91时间:2025-04-18人气:

飞轮 deepseek openai 马斯克 雷涛 算法

用微信扫码二维码

从堆参数到造飞轮DeepSeek正在颠覆O

分享至好友和朋友圈

出品 | 网易科技《态度》栏目

当全球AI竞赛聚焦于千亿参数堆砌与算力军备战时,却以“技术平权”的姿态撕开了行业裂缝。

其推出的DeepSeek-R1模型不仅将企业级市场的深度推理能力直接赋予C端用户,更将行业长期信奉的“预训练霸权”推向瓦解边缘。

然而在技术祛魅的浪潮下,一些争议也随之涌现:当DeepSeek-R1-Zero通过强化学习自主生产数据,传统数据标注行业是否面临消亡?高调推出的grok 3在数学推理测试中“翻车”,是否暴露了AI评测体系的深层缺陷?······

带着这些疑问,网易科技《Future Talk》邀请到了两位专家一起探讨,他们分别是星尘数据CEO章磊、天云数据CEO。(注:由于部分原因,星尘数据产品负责人张毅倜代CEO章磊参与直播讨论)

星尘数据成立于2017年,是国内首家专注于AI数据自动处理技术的标杆企业。公司以技术创新为核心驱动,自主研发全球首款AI数据全生命周期引擎MorningStar,覆盖数据采集、标注到模型迭代的全链路管理,显著提升企业数据生产效率50%以上,助力解决“数据债”难题。(类似于软件开发过程中的“技术债”,“数据债”是指在机器学习的各个环节中,由于低估了数据的重要性,在推进项目的过程中忽视了数据质量的把控,从而欠下的各种“债务”。)

而天云数据是一家国有参股企业,首批国家级专精特新小巨人企业,北京市科学技术奖厂商。是国内能够同时提供数据基础设施和数字原生全产业服务链的数据科学公司。秉承“数据+智能”的理念致力于大数据(AI-Native 数据库)和人工智能软件的研发与创新,赋能产业数智化转型。在数据供给侧和数据消费侧均获得多项权威认可。

DeepSeek搅局者还是革命者?

天云数据CEO雷涛认为,DeepSeek实现了大模型的祛魅,开启了中美后训练时代的大门。

在他看来,曾经被广泛依赖的技术大模型预训练模式,如今已不再是唯一的 “金科玉律”。

进入后训练阶段,模型更多地承担起将通用世界知识向领域知识转化的重任。以DeepSeek-R1系列为例,它以强化学习为主导,并将长思维链CoT(Chain of Thought)这一原本为等模型厂商的闭源recipe直接开放给community。这一举措,在模型交付层面,将国产和北美大厂的模型推理能力差距瞬间拉平,无疑是对传统市场格局的一次大胆挑战。

星尘数据产品负责人张毅倜进一步补充道:“DeepSeek将数据从量的问题转化成一个质的问题,将会对数据行业产生重大影响。"

他分析称,以往行业多聚焦于传统的Ground Truth单模态数据训练,而DeepSeek的出现,将彻底改变未来数据生产方式。今后,我们完全可以借助强化学习生成的模型,实现数据增强。这一转变,将使整个数据行业从低附加值领域,迈向技术附加值高的新台阶。(Ground Truth即用于训练、验证和测试AI模型的经过验证的真实数据。)

数据枯竭之争:真相与出路

随着AI模型朝着高质量方向迅猛发展,不少人断言当下数据已陷入 “枯竭” 困境。对此,张毅倜认为这是一个伪概念。

他解释说,当前所谓枯竭的数据,主要集中在互联网图文类数据。而实际上,大量数据正以多模态或非结构化形式,隐匿于人类日常生活的各个角落。

“我们目前看到的数据,仅仅是冰山一角。”张毅倜补充道。

那么,如何将这些未被充分挖掘的数据转化为高质量数据呢?张毅倜给出了几种途径:其一,由专业团队人工手动生成,这类数据堪称高质量的专家数据;其二,受DeepSeek-R1-Zero启发,通过大规模强化学习训练模型,进而利用该模型生产数据;其三,借助专业的AI数据平台如MorningStar进行训练,在训练过程中挖掘出高质量数据。

雷涛则从另一角度解读数据质量问题,他认为数据质量的高低并非由主观认知简单判定,而是取决于所采用的AI算法。他表示,如今已有大量数据由AI生成,但这并不意味着这些数据就是 “假数据”。

“所谓高质量与低质量数据,其评价标准与方式,归根结底在于AI算法。” 雷涛进一步阐释,“这就是当下热议的数据概念。AI模型使用的数据由其自身生成,数据飞轮正是构建模型持续迭代生长的关键方法。”

Grok 3:技术秀肌肉还是战略拼图?

在谈及Grok 3时,张毅倜认为它不过是马斯克AI体系中的一次技术溢出。

他指出,毕竟在马斯克的宏大战略版图中,AI占据着核心地位,宛如大脑之于人体。“Grok 3更多是马斯克在各个领域展示技术实力的一种体现。他真正的目标,是将机器人、火箭、地下隧道以及特斯拉等现实世界业务与虚拟世界紧密打通,这或许也是他构建AI超算中心的最大初衷。”张毅倜进一步分析道。

对于马斯克宣称其模型在数学推理方面优于国内模型,却在 “9.9与9.11哪个大” 这类简单问题上 “翻车” 的现象,张毅倜指出,目前所有模型评测大多基于开源数据集,而这些Benchmark最早由北美主导制定,在计算层面重视程度相对不足。此外,国外通常会制定两套Benchmark,一套面向普惠大众,一套用于推理测试。而推理模型的Benchmark在逻辑上,其实是在其自行公布的数据集测试中超越了OpenAI o1系列大模型。

雷涛则表示,不能仅依据几个Benchmark,便在传统认知赛道中评判模型优劣。我们更应关注多模型之间的通用性。为实现端到端的训练合成数据,如何运用AI手段进行数据生产,已然成为行业发展的必备逻辑。

行业走向:“通用模型+专业服务”还是“行业模型主导”?

雷涛认为,行业内存在大量个性化数据,许多行业知识无法单纯依靠transformer的排列组合进行推理。

DeepSeek的架构为我们带来启示,我们可以将行业深层领域的知识,通过验证激励机制融入强化学习,从而在大模型层面,而非传统机器学习层面,更有效地获取行业科学知识体系。

他表示:“领域知识的探索之路还很漫长,绝非简单的微调、过滤与蒸馏所能涵盖。”

张毅倜则认为行业模型的概念是模糊的,它没有一个明确的边界,很难去定义。

他表示,未来的模型由Personal Language Model和Lagre Language Model来划分。

(Personal Language Model是大模型结合私有化知识构建出的私有化小模型。)

而在实际业务场景应用中,专业模型才是未来趋势的主导。

(当Personal Language Model的训练模式用于企业私有化模型的生产,诞生的模型就是专业模型。)“一个企业往往需要多个专业模型,这些专业模型协同合作,组成一个‘专家团’,将极大提升企业生产效率,”张毅倜总结道。

网易科技态度见闻 2025-04-17 21:10:00

林丑丑的慢生快活 2025-04-15 23:24:04

DeepSeek搅局者还是革命者?

天云数据CEO雷涛认为,DeepSeek实现了大模型的祛魅,开启了中美后训练时代的大门。

星尘数据产品负责人张毅倜进一步补充道:“DeepSeek将数据从量的问题转化成一个质的问题,将会对数据行业产生重大影响。"

数据枯竭之争:真相与出路

他解释说,当前所谓枯竭的数据,主要集中在互联网图文类数据。而实际上,大量数据正以多模态或非结构化形式,隐匿于人类日常生活的各个角落。

“所谓高质量与低质量数据,其评价标准与方式,归根结底在于AI算法。” 雷涛进一步阐释,“这就是当下热议的数据概念。AI模型使用的数据由其自身生成,数据飞轮正是构建模型持续迭代生长的关键方法。”

Grok 3:技术秀肌肉还是战略拼图?

在谈及Grok 3时,张毅倜认为它不过是马斯克AI体系中的一次技术溢出。

雷涛则表示,不能仅依据几个Benchmark,便在传统认知赛道中评判模型优劣。我们更应关注多模型之间的通用性。为实现端到端的训练合成数据,如何运用AI手段进行数据生产,已然成为行业发展的必备逻辑。

行业走向:“通用模型+专业服务”还是“行业模型主导”?

DeepSeek的架构为我们带来启示,我们可以将行业深层领域的知识,通过验证激励机制融入强化学习,从而在大模型层面,而非传统机器学习层面,更有效地获取行业科学知识体系。

他表示,未来的模型由Personal Language Model和Lagre Language Model来划分。

而在实际业务场景应用中,专业模型才是未来趋势的主导。

内容声明:

1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违规信息,如您发现违规内容,请联系我们进行清除处理!
4、本文地址:https://www.717b.com/zuixinwz/91.html,复制请保留版权链接!


温馨小提示:在您的网站做上本站友情链接,访问一次即可自动收录并自动排在本站第一位!
随机文章:

中移动原董事长王建宙:5G建设初期难在哪?|运营商|中国移动|5g手机|中国电信|中国联通

中移动原董事长王建宙:5G建设初期难在哪?,王建宙,运营商,中国移动,5g手机,中国电信,中国联通

互联网资讯 2025-04-18 20:20:29

电气工程专家郑松:工业互联网的本质是数据|现代汽车|自动化

电气工程专家郑松:工业互联网的本质是数据,郑松,互联网,现代汽车,自动化

互联网资讯 2025-04-18 20:20:20

专访洪小文:创新的最后一公里是什么?|微软|互联网|云平台|比尔盖茨

专访洪小文:创新的最后一公里是什么?,洪小文,微软,互联网,云平台,比尔盖茨

互联网资讯 2025-04-18 20:20:18

江亿院士:建立新型电力系统建设是实现“双碳”的关键|储能|光伏|充电桩|风电

江亿院士:建立新型电力系统建设是实现“双碳”的关键,储能,光伏,充电桩,风电,电力

互联网资讯 2025-04-18 20:20:09

智见丨对话梅宏院士:数字化转型不是想不想,而是必须转|机器人|互联网

智见丨对话梅宏院士:数字化转型不是想不想,而是必须转,院士,机器人,互联网,梅宏

互联网资讯 2025-04-18 20:19:58

智见丨清华大学丁津泰教授:抵御量子计算威胁从抗量子密码开始|量子计算机|密码学|公钥

智见丨清华大学丁津泰教授:抵御量子计算威胁从抗量子密码开始,丁津泰,量子计算,量子计算机,密码学,教授,公钥

互联网资讯 2025-04-18 20:19:57

智见丨专访周鸿祎:头部公司才做大模型大部分人得专注场景|人工智能|微软|大数据|史蒂夫·乔布斯

智见丨专访周鸿祎:头部公司才做大模型大部分人得专注场景,周鸿祎,人工智能,微软,大数据,史蒂夫·乔布斯,深度学习

互联网资讯 2025-04-18 20:19:49

又一富豪上太空世界首富贝索斯圆了5岁的梦想|宇航员|布兰森|谢泼德|马斯克

又一富豪上太空世界首富贝索斯圆了5岁的梦想,贝索斯,宇航员,布兰森,谢泼德,马斯克

互联网资讯 2025-04-18 20:19:16

独家专访吴季:十年后,中国将成为航天强国|卫星|太空旅游|空间科学

独家专访吴季:十年后,中国将成为航天强国,吴季,航天,卫星,太空旅游,空间科学

互联网资讯 2025-04-18 20:19:15

神舟十四一飞冲天!中国航天,还有多少“神秘”任务?|载人飞船|货运飞船|航天员

神舟十四一飞冲天!中国航天,还有多少“神秘”任务?,神舟,载人飞船,货运飞船,航天员,航天

互联网资讯 2025-04-18 20:18:58

不降价,不学特斯拉,比亚迪销量还涨啦?|乘用车|新能源车|广汽

不降价,不学特斯拉,比亚迪销量还涨啦?,特斯拉,比亚迪,乘用车,新能源车,广汽

互联网资讯 2025-04-18 20:17:43

27岁的戴威为什么不能当老大?|后厂村|小黄车|滴滴|阿里|程维

27岁的戴威为什么不能当老大?,戴威,后厂村,小黄车,滴滴,阿里,程维

互联网资讯 2025-04-18 20:17:30

“战疫”实录:中国“最帅”买手海外抢口罩|医院|防护服|手套|头套

“战疫”实录:中国“最帅”买手海外抢口罩,医院,口罩,防护服,手套,头套

互联网资讯 2025-04-18 20:16:41

罗永浩不是李佳琦,幸好粉丝还在|薇娅|直播|直播间|直播带货

罗永浩不是李佳琦,幸好粉丝还在,罗永浩,李佳琦,薇娅,直播,直播间,直播带货

互联网资讯 2025-04-18 20:16:33

荣耀Magic5系列上手体验:顶级影像表现征服我的却不止这一点|magic|手机|长焦|相机

荣耀Magic5系列上手体验:顶级影像表现征服我的却不止这一点,magic,手机,长焦,相机

互联网资讯 2025-04-18 20:12:36

华为MateX3轻体验:老余兑现了「折叠屏比直板机轻薄」承诺|手机|智能手机

华为MateX3轻体验:老余兑现了「折叠屏比直板机轻薄」承诺,华为mate,直板机,手机,智能手机,华为

互联网资讯 2025-04-18 20:12:26

千元档iQOOZ7真机赏析:内置5000mAh电池,还有120W快充|手机|mah|iqoo|长续航|像素

千元档iQOOZ7真机赏析:内置5000mAh电池,还有120W快充,电池,手机,mah,iqoo,长续航,像素

互联网资讯 2025-04-18 20:12:20

iQOONeo8Pro体验:天玑9200+芯片加持,带来越级游戏体验|neo|iqoo

iQOONeo8Pro体验:天玑9200+芯片加持,带来越级游戏体验,芯片,天玑,neo,iqoo

互联网资讯 2025-04-18 20:12:10

iQOO11S体验:性能表现强悍,标准版也能有Pro级实力|iqoo|电竞|游戏|手游|亚运会|iqoo11s

iQOO11S体验:性能表现强悍,标准版也能有Pro级实力,iqoo,电竞,游戏,手游,亚运会,iqoo11s

互联网资讯 2025-04-18 20:08:19

荣耀MagicV2拍照体验:折叠屏也可以成为影像旗舰|手机|magic|像素|变焦|样张

荣耀MagicV2拍照体验:折叠屏也可以成为影像旗舰,手机,magic,像素,变焦,样张

互联网资讯 2025-04-18 20:07:54

荣耀GT评测:全性能旗舰来袭,带给年轻人的诚意之作|手机|智能手机|游戏|操控

荣耀GT评测:全性能旗舰来袭,带给年轻人的诚意之作,手机,智能手机,游戏,操控

互联网资讯 2025-04-18 20:05:13

何祚庥院士:杨振宁和翁帆是段千载难逢的良缘,可遇不可求|物理学家

何祚庥院士:杨振宁和翁帆是段千载难逢的良缘,可遇不可求,何祚庥,杨振宁,翁帆,院士,物理学家

最新资讯 2025-04-18 20:02:18

樊代明院士:医学创新很紧迫,当今医学面临极大挑战|内科|西医

樊代明院士:医学创新很紧迫,当今医学面临极大挑战,樊代明,中医,内科,医学,院士,西医

最新资讯 2025-04-18 20:01:39

“AI泡沫”恐慌蔓延?英伟达财报超预期股价反下跌|黄仁勋|财季

“AI泡沫”恐慌蔓延?英伟达财报超预期股价反下跌,英伟达,黄仁勋,股价,财季,芯片

最新资讯 2025-04-18 20:01:03

21万一辆,2026年量产,马斯克“载入史册”的无人出租车被waymo创始人泼冷水|特斯拉|自动驾驶|自动驾驶技术|莱万多夫斯基

21万一辆,2026年量产,马斯克“载入史册”的无人出租车被waymo创始人泼冷水,马斯克,特斯拉,自动驾驶,出租车,自动驾驶技术,莱万多夫斯基

最新资讯 2025-04-18 20:00:33

对话realme徐起:AI已成为消费者购机的主要考量因素|手机

对话realme徐起:AI已成为消费者购机的主要考量因素,realme,徐起,手机

最新资讯 2025-04-18 20:00:25

对话投资人硅谷李师傅:DeepSeek的出现是另一起斯普特尼克事件|马斯克|朱啸虎|deepseek

对话投资人硅谷李师傅:DeepSeek的出现是另一起斯普特尼克事件,斯普特尼克,硅谷,马斯克,朱啸虎,徐勇,deepseek

最新资讯 2025-04-18 19:58:35

DeepSeek之后,阶跃星辰要用生态突围|deepseek|模态|智能体

DeepSeek之后,阶跃星辰要用生态突围,deepseek,阶跃,模态,智能体

最新资讯 2025-04-18 19:58:19

英伟达最新财报回击“DeepSeek焦虑”|态度|deepseek|黄仁勋|财季

英伟达最新财报回击“DeepSeek焦虑”|态度,英伟达,deepseek,态度,黄仁勋,财季,芯片

最新资讯 2025-04-18 19:58:13

独家专访魔法原子总裁吴长征:2025具身智能生死年|机器人|人形|本体|灵巧手

独家专访魔法原子总裁吴长征:2025具身智能生死年,吴长征,机器人,原子,人形,本体,灵巧手

最新资讯 2025-04-18 19:58:07

李斌回应“好人论”:过去十年,我让二十多个VP走人了|蔚来|秦力洪|特斯拉|卖车|智能驾驶

李斌回应“好人论”:过去十年,我让二十多个VP走人了,李斌,蔚来,秦力洪,特斯拉,卖车,智能驾驶

最新资讯 2025-04-18 19:57:39

对话七维科技CEO殷元江:AI加速XR虚拟制作周期|机器人|英伟达|xr

对话七维科技CEO殷元江:AI加速XR虚拟制作周期,殷元江,机器人,英伟达,xr

最新资讯 2025-04-18 19:57:22

连夜包机!苹果急运600吨印度产iPhone回美,工厂周日加班生产|iphone|apple|富士康|特朗普

连夜包机!苹果急运600吨印度产iPhone回美,工厂周日加班生产,iphone,苹果,apple,富士康,工厂,特朗普

最新资讯 2025-04-18 19:56:07

OpenAI推降速换降价新服务!模型使用费直接腰斩|openai|人工智能|谷歌|人工智能公司|token

OpenAI推"降速换降价"新服务!模型使用费直接腰斩,openai,人工智能,谷歌,人工智能公司,token

最新资讯 2025-04-18 19:55:50

一个App轻松管理多个邮箱!鸿蒙版QQ邮箱已支持三方邮箱登录|qq|app|gmail

一个App轻松管理多个邮箱!鸿蒙版QQ邮箱已支持三方邮箱登录,qq,app,gmail,云盘

最新资讯 2025-04-18 19:53:42

日均调用量106倍狂飙豆包抢滩“Agent生态卡位战”|算法|文生|agent

日均调用量106倍狂飙豆包抢滩“Agent生态卡位战”,调用量,算法,文生,豆包,agent,卡位战

最新资讯 2025-04-18 19:53:38


TOP