日均调用量106倍狂飙豆包抢滩“Agent生态卡位战”|算法|文生|agent

文章ID:22时间:2025-04-18人气:

调用量 算法 文生 豆包 agent 卡位战

微信扫码二维码

日均调用量106倍狂飙抢滩<a href=agent生" loading="lazy">

分享至好友和朋友圈

出品 | 网易科技《态度》栏目

当DeepSeek以开源策略席卷开发者社区时,火山引擎用闭源的方式展示了另一种可能性。

“截至2025年3月底,大模型日均tokens已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。”

4月17日,在火山引擎FORCE LINK AI创新巡展上,火山引擎总裁谭待亮出一组数据,为闭源大模型的生存战注入强心剂。

如今,豆包大模型已成为众多企业AI转型的核心利器。就在巡展当日,

面向企业市场,全新的豆包1.5·深度思考模型正式登场,同时升级图模型3.0及视觉理解模型,还推出了OS 解决方案和AI云原生推理套件。

这一系列动作表明,在模型性能竞赛转向 “Agent生态卡位战” 的当下,火山引擎已精准锚定新的发展方向。

加量不加价,豆包深度思考模型开放API

官方技术报告显示,豆包深度思考模型采用MoE架构,总参数200B,激活参数仅20B,以较小参数实现了媲美顶尖模型的效果。得益于高效和高性能推理系统,豆包模型的API服务在保证高并发的同时,将延迟降至20毫秒,目前已通过火山引擎开放供用户体验。

在数学推理、编程竞赛、科学推理等专业领域,豆包模型的性能与openai o3-mini-high、Gemini 2.5 Pro等模型不相上下。

在通用任务上,豆包深度思考模型的人类评估表现比DeepSeek R1高出8%,

单位推理成本更是降低了50%,完美实现了性能与效率的平衡。

相较于仅限文字理解的 DeepSeek,豆包深度思考模型的多模态能力优势显著。

谭待介绍,升级后的豆包・视觉理解模型具备强大的视觉理解能力,使模型不仅 “会看会想”,还能进行立体思考。从识别菜单内容,根据用户口味和过敏食物提供点餐推荐,到分析航拍图上的颜色、形状等信息并结合地貌进行深度研判,豆包的多模态应用场景丰富且实用。

豆包・文生图模型3.0同样表现亮眼,其文字排版和图像生成能力进一步增强,支持2K高清图片生成,在影视、海报、绘画等领域应用广泛。在最新的文生图领域权威榜单Artificial Analysis竞技场中,豆包・文生图3.0模型已跻身全球第一梯队。

豆包这一次放的大招,可谓威力十足。目前豆包已经在appStore内免费APP排行榜成功登顶,超越位居第三的DeepSeek和第九的腾讯元宝。

迎接Agent元年,“应用Agent”+“OS Agent”双管发力

强大的模型性能为AI Agent的发展奠定了坚实基础。

谭待指出:“

AI Agent应用主要分为应用型Agent和OS Agent两个方向。

应用型Agent专注于特定领域任务,如客服Agent、数据Agent、代码Agent 等;OS Agent则具备跨场景通用性和灵活性,可操作浏览器、电脑、手机等设备,完成复杂任务。”

在应用型Agent领域,面向专业开发者的代码Agent——Trae重磅推出。相较于传统AI插件产品,Trae将AI与IDE深度融合,带来更智能的开发体验。

在OS Agent方面,火山引擎正式发布OS Agent解决方案,整合豆包UI-TARS模型,以及veFaaS函数服务、云服务器、云手机等产品,实现对代码、浏览器、电脑、手机及其他Agent的高效操作。

针对Agent带来的大量推理消耗问题,火山引擎推出ServingKit推理套件,可在2分钟内完成671B DeepSeek R1的下载和预热,13秒完成推理引擎加载。

同时,通过优化火山引擎EIC,将KV cache命中率提高10倍,在100% cache命中场景下,TPS吞吐量提升至5倍以上;对算子、AI网关、VKE编排调度的升级,也大幅降低了GPU消耗。

对于GPU的折旧问题,谭待认为:“

如果把软件层面的工作做好,硬件的生命周期是可以拉长的。

而且不同的场景对模型的延迟、吞吐要求是不一样的。

更重要的是在软件层面和运营层面做好相关工作,这样就能使硬件的生命周期和投资回报率(ROI)都达到最佳状态。

模型好坏比开源闭源更关键,对豆包充满信心

“模型好坏,与开源闭源无关。火山引擎在适配DeepSeek方面表现出色,对豆包充满信心。”

火山引擎总裁谭待在采访中直言。

面对豆包大模型日均tokens调用量百倍的增长,谭待表示,技术发展短期易被高估、长期易被低估,tokens增长量取决于模型突破,如视觉推理、Agent等方面的进展,对未来模型调用量百倍增长持谨慎乐观态度。

2025年被称为Agent元年,但谭待认为:

“能写诗的不是Agent,能跑通供应链的才是。”

这一观点凸显了火山引擎的务实布局。

谭待指出,

“我们希望AI能够解决更复杂,更完整的问题,不再仅仅是对信息的感知、处理和生成,而是能端到端的处理任务。AI能做到这些,才能称之为一个合格的Agent。”

他认为,实现这一目标需完成三大技术突破:首先最核心的是要有更强的模型。要做好Agent,模型需要有能力做好思考、计划和反思,而且要一定得支持多模态。其次,开发OS Agent架构体系,实现数字与物理世界的双向交互。最后,通过AI云原生技术实现推理成本与延迟的指数级下降,支撑大规模应用落地。

目前,火山引擎已支持MCP协议,统一协议有助于降低开发成本、加速行业发展。未来,火山引擎不仅会推出数据智能体Data Agent等垂直类Agent产品,还将为通用Agent开发提供工具和方案。在谭待看来,判断真正的Agent,关键要看其能否完成复杂任务、是否运用深度思考模型。

当闭源模型凭借成本优势挑战开源阵营,当开源生态反哺商业创新,这场大模型竞争早已超越技术层面,演变为组织能力与生态运营的全方位较量。

可以预见的是,在Agent战场中,唯有那些将技术深度融入行业各个环节的参与者,才能最终脱颖而出。

“截至2025年3月底,大模型日均tokens已超过12.7万亿,是2024年12月的3倍,是一年前刚刚发布时的106倍。”

面向企业市场,全新的豆包1.5·深度思考模型正式登场,同时升级图模型3.0及视觉理解模型,还推出了OS 解决方案和AI云原生推理套件。

加量不加价,豆包深度思考模型开放API

在数学推理、编程竞赛、科学推理等专业领域,豆包模型的性能与OpenAI o3-mini-high、Gemini 2.5 Pro等模型不相上下。

在通用任务上,豆包深度思考模型的人类评估表现比DeepSeek R1高出8%,

迎接Agent元年,“应用Agent”+“OS Agent”双管发力

AI Agent应用主要分为应用型Agent和OS Agent两个方向。

如果把软件层面的工作做好,硬件的生命周期是可以拉长的。

更重要的是在软件层面和运营层面做好相关工作,这样就能使硬件的生命周期和投资回报率(ROI)都达到最佳状态。

模型好坏比开源闭源更关键,对豆包充满信心

“模型好坏,与开源闭源无关。火山引擎在适配DeepSeek方面表现出色,对豆包充满信心。”

“能写诗的不是Agent,能跑通供应链的才是。”

“我们希望AI能够解决更复杂,更完整的问题,不再仅仅是对信息的感知、处理和生成,而是能端到端的处理任务。AI能做到这些,才能称之为一个合格的Agent。”

内容声明:

1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违规信息,如您发现违规内容,请联系我们进行清除处理!
4、本文地址:https://www.717b.com/jxwxwz/22.html,复制请保留版权链接!


温馨小提示:在您的网站做上本站友情链接,访问一次即可自动收录并自动排在本站第一位!
随机文章:

崔宝秋:5G手机将迎来革命我们已在探索6G|小米|iot|杀手级

崔宝秋:5G手机将迎来革命我们已在探索6G,崔宝秋,小米,iot,手机,杀手级

互联网资讯 2025-04-18 20:20:37

邬贺铨院士:网络安全不分国界,网络安全是人才的竞争|互联网|大数据

邬贺铨院士:网络安全不分国界,网络安全是人才的竞争,邬贺铨,网络安全,互联网,大数据,院士

互联网资讯 2025-04-18 20:20:12

智见丨HTC全球副总裁黄昭颖:希望更多大厂进入元宇宙|htc|vr|vr眼镜

智见丨HTC全球副总裁黄昭颖:希望更多大厂进入元宇宙,元宇宙,黄昭颖,htc,vr,vr眼镜

互联网资讯 2025-04-18 20:19:52

智见丨衣宝廉院士:燃料电池车是氢能应用的突破口|氢燃料|电动汽车

智见丨衣宝廉院士:燃料电池车是氢能应用的突破口,衣宝廉,燃料,氢能,氢燃料,电动汽车,电池

互联网资讯 2025-04-18 20:19:38

独家专访九天微星创始人谢涛:做卫星界的华为|马斯克

独家专访九天微星创始人谢涛:做卫星界的华为,谢涛,卫星,微星,九天,马斯克,卫星界

互联网资讯 2025-04-18 20:19:18

新能源汽车的锂矿“围城”|电池|碳酸锂|锂电|锂电池|储能

新能源汽车的锂矿“围城”,电池,碳酸锂,新能源汽车,锂电,锂电池,储能

互联网资讯 2025-04-18 20:17:44

饕餮贝壳:能否吞卷江湖?|左晖|链家|张海明|姚劲波|安居客

"饕餮"贝壳:能否吞卷江湖?,左晖,链家,张海明,姚劲波,安居客

互联网资讯 2025-04-18 20:17:03

泪崩!武汉战疫最美逆行者!这座城,我们一起守!|防护服|医院|护士|口罩

泪崩!武汉战疫最美逆行者!这座城,我们一起守!,武汉,防护服,医院,护士,逆行者,口罩

互联网资讯 2025-04-18 20:16:45

努比亚Z50体验:二代新8系旗舰卖到2999元惊喜不止是便宜|手机|相机|曲面屏|样张

努比亚Z50体验:二代新8系旗舰卖到2999元惊喜不止是便宜,努比亚,手机,相机,曲面屏,样张

互联网资讯 2025-04-18 20:12:51

vivoXFlip菱紫图赏:菱格立体皮革设计竖向折叠屏|flip

vivoXFlip菱紫图赏:菱格立体皮革设计竖向折叠屏,vivo,菱格,flip

互联网资讯 2025-04-18 20:12:17

小米13Ultra轻体验:一台像极了徕卡相机的影像旗舰|索尼|镜头|小米13ultra|雷军

小米13Ultra轻体验:一台像极了徕卡相机的影像旗舰,徕卡,相机,小米,索尼,镜头,小米13ultra,雷军

互联网资讯 2025-04-18 20:12:15

红魔9Pro+氚锋透明版图赏:高辨识度硬朗设计极客范儿|手机|三星

红魔9Pro+氚锋透明版图赏:高辨识度硬朗设计极客范儿,手机,红魔,三星,辨识度,透明版

互联网资讯 2025-04-18 20:07:14

戴森吹风直发器AirstraitHT01体验:三种模式造型,简单安全无热损伤|马达|吹风机

戴森吹风直发器AirstraitHT01体验:三种模式造型,简单安全无热损伤,戴森,马达,吹风机,直发器

互联网资讯 2025-04-18 20:07:02

三星GalaxyS24系列上手:全系三代骁龙8AI是最大亮点|长焦|摄像头|手机|像素|焦镜头

三星GalaxyS24系列上手:全系三代骁龙8AI是最大亮点,三星,长焦,摄像头,手机,像素,焦镜头

互联网资讯 2025-04-18 20:06:53

森海塞尔MOMENTUMTrueWireless4体验:听觉和易用性均有提升|声海|耳机|耳塞|momentum

森海塞尔MOMENTUMTrueWireless4体验:听觉和易用性均有提升,声海,耳机,wireless,耳塞,momentum

互联网资讯 2025-04-18 20:06:45

OPPOK12轻体验:平价小钢炮性能升级兼顾耐用性|oppo|手机|续航|像素|柔性屏

OPPOK12轻体验:平价小钢炮性能升级兼顾耐用性,oppo,手机,耐用性,续航,像素,柔性屏

互联网资讯 2025-04-18 20:06:27

朱邦芬院士:盲从领导、迷信权威,阻碍中国出现杨振宁这样的大师|黄昆|费米

朱邦芬院士:盲从领导、迷信权威,阻碍中国出现杨振宁这样的大师,杨振宁,朱邦芬,黄昆,院士,教授,费米

互联网资讯 2025-04-18 20:05:03

有他把关,你才能安稳搭乘今天呼啸来去的高铁|铁道部|沈志云|铁路|轮轨

有他把关,你才能安稳搭乘今天呼啸来去的高铁,高铁,铁道部,沈志云,铁路,轮轨

互联网资讯 2025-04-18 20:04:32

王恩哥院士:除了努力,人生别无捷径|中科院|北京大学

王恩哥院士:除了努力,人生别无捷径,王恩哥,院士,中科院,教授,北京大学

互联网资讯 2025-04-18 20:03:55

刘良院士:初步研究发现中药活性化合物能抑制新冠病毒|中西医

刘良院士:初步研究发现中药活性化合物能抑制新冠病毒,刘良,中医药,中医,中药,中西医

互联网资讯 2025-04-18 20:03:34

韩济生院士:中西医结合,针刺可以治疗儿童孤独症|针灸

韩济生院士:中西医结合,针刺可以治疗儿童孤独症,孤独症,治疗,韩济生,中西医,针刺,针灸

互联网资讯 2025-04-18 20:02:36

阿里财报:核心业务回暖,半年员工数降超2万人|阿里巴巴|阿里云|gmv

阿里财报:核心业务回暖,半年员工数降超2万人,阿里巴巴,阿里云,gmv

最新资讯 2025-04-18 20:01:20

苹果首款AI手机iPhone16来了但大规模换机潮要等下代?|iphone|apple|相机|新iphone

苹果首款AI手机iPhone16来了但大规模换机潮要等下代?,iphone,手机,apple,苹果,相机,新iphone

最新资讯 2025-04-18 20:00:55

黄仁勋对话孙正义:孙正义首次透露曾三次尝试买下英伟达(附对话全文)|安本正义|软银|比尔盖茨

黄仁勋对话孙正义:孙正义首次透露曾三次尝试买下英伟达(附对话全文),黄仁勋,安本正义,英伟达,软银,比尔盖茨

最新资讯 2025-04-18 20:00:05

对话WeShop吴海波:让模型的边界逼近行业中最好的商拍状态|weshop

对话WeShop吴海波:让模型的边界逼近行业中最好的商拍状态,吴海波,weshop,商拍

最新资讯 2025-04-18 19:59:37

定格AI浪潮下的宝安:御产业之风,向未来启航|宝安区|深圳|深圳市|人工智能|前海

定格AI浪潮下的宝安:御产业之风,向未来启航,宝安,宝安区,深圳,深圳市,人工智能,前海

最新资讯 2025-04-18 19:59:28

俞敏洪“拜师”胖东来?东方甄选在憋大招|新东方|物美集团

俞敏洪“拜师”胖东来?东方甄选在憋大招,俞敏洪,胖东来,新东方,物美集团,物美

最新资讯 2025-04-18 19:58:05

AIGC创新社沙龙|国海证券姚蕾:AI正在重塑传媒行业内容生产方式|aigc创新社|分析师

AIGC创新社沙龙|国海证券姚蕾:AI正在重塑传媒行业内容生产方式,姚蕾,aigc创新社,传媒行业,国海证券,ai,分析师

最新资讯 2025-04-18 19:55:15

传三星HBM4的逻辑BaseDie测试良率已超40%|海力士|dram|知名企业|三星hbm4

传三星HBM4的逻辑BaseDie测试良率已超40%,良率,海力士,dram,知名企业,三星hbm4

最新资讯 2025-04-18 19:55:03

测试工程师新利器:主流AI软件测试产品及应用价值深度解读|用例|自动化

测试工程师新利器:主流AI软件测试产品及应用价值深度解读,工程师,用例,自动化

最新资讯 2025-04-18 19:53:45

Cybertruck卖不动,特斯拉被曝减产调人手|马斯克|特朗普|cybertruck

Cybertruck卖不动,特斯拉被曝减产调人手,特斯拉,马斯克,特朗普,cybertruck

最新资讯 2025-04-18 19:53:41

智界R7增程版发布售价29.98万元起|四驱系统|大电池

智界R7增程大电池版售价29.98万起

最新资讯 2025-04-18 19:53:40

最高罚175万!市场监管总局通报直播电商领域违规违法案例|广州|市场秩序

最高罚175万!市场监管总局通报直播电商领域违规违法案例,电商,直播,广州,市场秩序,市场监管总局,违规违法案例

最新资讯 2025-04-18 19:53:35

“窃听风云”:我们如何沦为电商的透明人?|淘宝|算法|app

“窃听风云”:我们如何沦为电商的透明人?,电商,淘宝,算法,app,透明人,窃听风云,微信公众号

最新资讯 2025-04-18 19:53:34

外卖江湖风云再起,到底谁动了谁的蛋糕?|美团|电商|闪购|饿了么|京东到家|知名企业|品质堂食餐饮商家

外卖江湖风云再起,到底谁动了谁的蛋糕?,外卖,美团,电商,闪购,蛋糕,饿了么,京东到家,知名企业,品质堂食餐饮商家

最新资讯 2025-04-18 19:53:33

市场监管总局:强化直播带货商品溯源管理|电商

市场监管总局:强化直播带货商品溯源管理,电商,直播带货,市场监管总局

最新资讯 2025-04-18 19:53:26


TOP