OpenAI重磅推出o3/o4-mini新模型!能看图思考|openai|人工智能|编程|智能体|python

文章ID:38时间:2025-04-18人气:

openai mini 人工智能 编程 智能体 python

用微信扫码二维码

OpenAI重磅推出o3o4mini新模

分享至好友和朋友圈

4月17日消息,北京时间今日凌晨,发布了两款突破性AI模型,它们能够通过图像进行推理,并可独立使用工具,专家称它们为能力的一次飞跃。

这两款新模型分别被称为o3与o4-,它们都是OpenAI “o系列” 推理模型的最新成员,并被称为迄今为止最智能、最强大的模型。这些系统能将图像直接整合到推理过程中,并在单一任务流程中执行网页搜索、代码运行、文件分析乃至图像生成等操作。

OpenAI总裁格雷格·布罗克曼(Greg Brockman)在发布会上表示:“有些模型会让人觉得像是迈入未来的质变,GPT-4就是其中之一。今天也将成为这样的历史时刻。这是首批让顶尖科学家都承认能产出确实优秀、实用新颖创意的模型。”

OpenAI新模型通过“图像思维”帮助解决视觉问题

这些新模型最显著的特征是“图像思维”能力。它们不仅是识别图像,还能在问题解决流程中操控并推理。

在发布会演示环节,研究人员展示了o3如何分析一份来自十年前实习项目的物理海报:它能独立解析其中复杂的图示,甚至识别出海报本身未呈现的最终结论。

OpenAI多模态推理研究员布兰登·麦肯锡(Brandon McKenzie)在演示中说道:“它相当于在几秒内为我阅读了至少10篇不同的论文。”他估计,这项任务如果由他本人完成,“光是重新熟悉当年的项目背景就要好几天,然后可能还得几天才能完成文献查阅。”

人工智能在推理过程中操控图像的能力,比如放大细节、旋转图像或裁剪冗余元素等,被行业分析师认为可能彻底改变从科研到教育等多个领域。

沃顿商学院研究人工智能、创新与创业公司的伊森·莫里克教授(Ethan Mollick)在社交平台上发文称:

我获得了o3的早期使用权限,这款模型令人印象深刻,能力非常强大。以下为一些有趣的示例:

1️⃣ 解构了我课堂上使用的商业案例

2️⃣ 生成纯代码构建的SVG矢量图

3️⃣ 创作双螺旋结构的约束性短篇故事

4️⃣ 创作硬科幻太空战斗场景

超越AI模型:o3与o4-mini如何通过先进工具集成作为完整AI系统运行

OpenAI的高管强调,这次发布的不仅仅是推理模型的升级版本,而是完整的人工智能系统,它们能够在解决问题时独立调用并串联多个工具。

布罗克曼特别强调了这些模型在工具调用方面的强大能力:“它们实际上是在思维链中调用这些工具,以尝试解决困难问题。例如,我们曾看到o3为了解并执行一个极其困难的任务,连续调用了大约600次工具。”

这种能力使模型能够执行复杂的、多步骤的工作流任务,而无需用户持续介入。比如,当被问到“加州未来的能源使用趋势”时,人工智能系统可以搜索公用事业数据、编写Python代码进行分析、生成可视化图表,并撰写出一份全面的报告——所有步骤都作为一个流畅、连贯的过程完成。

OpenAI超越竞争对手,在关键AI基准测试中表现优异

OpenAI宣称,o3在多个关键人工智能能力基准测试中确立全新行业标杆,包括Codeforces(竞赛平台)、SWE-bench(软件工程基准)和MMMU(多模态理解评估)。

据外部专家评估,在复杂现实任务中,o3的重大错误率较前代模型降低20%。

而轻量级模型o4-mini在保持强大推理能力的同时,更注重速度与成本效益。配备Python解释器时,其在2025年AIME数学竞赛中取得99.5%的惊人准确率。

OpenAI研究负责人马克·陈(Mark Chen)在发布会上说道:“我真的相信,凭借这套模型组合,o3和o4-mini,我们将会看到更多的突破。”

OpenAI发布新模型的时机也非常关键,该公司在两天前刚刚推出了GPT-4.1模型,该模型在编程任务中表现优异。接连不断的发布表明,OpenAI在竞争激烈的人工智能领域正在加速推进,并面临来自谷歌Gemini、Anthropic Claude以及埃隆·马斯克(Elon Musk)旗下xAI等日益激烈的竞争压力。

上个月,OpenAI完成了历史上最大规模的私募融资,筹集了400亿美元资金,估值达3000亿美元。另外,该公司还在考虑构建自己的社交网络,可能对标马斯克的X,并确保拥有独立的训练数据源。

OpenAI新模型如何通过代码导航能力重塑软件工程领域

新模型在软件工程领域的表现特别出色。布罗克曼在发布会上提到,o3在“检索OpenAI内部代码库时的表现比我还要出色,这真的很有用。”

作为此次发布的一部分,OpenAI还推出了Codex CLI,这是一款轻量级的编程,可以直接在用户的终端运行。这个开源工具让开发者能够利用这些模型的推理能力来完成编程任务,支持截图和草图输入。

OpenAI在公告中写道:“我们还分享了一个新的实验:Codex CLI,一个可以从终端运行的轻量级编程智能体。通过将截图或简略草图传递给模型,并结合对本地代码的访问,用户可以从命令行获得多模态推理的好处。”

为了鼓励采用,OpenAI启动了一项100万美元的扶持计划,支持使用Codex CLI和OpenAI的模型,每个项目将获得2.5万美元的API信用额度。

OpenAI首席执行官山姆·奥特曼(Sam Altman)发帖称:“由于o3和o4-mini在编程领域表现优异,OpenAI还推出了一个新产品——Codex CLI,旨在简化它们的使用。这是一款运行在你计算机上的编程智能体,完全开源,并已于今日发布;我们预计它将迅速改进。”

OpenAI强化安全协议内幕:如何防范AI滥用

OpenAI表示,已对新模型进行了广泛的安全测试,特别是针对它们拒绝有害请求的能力。该公司的安全措施包括完全重建安全训练数据,并开发了系统级的缓解措施来标记危险的提示。

OpenAI在公告中称:“我们对这两个模型进行了迄今为止最严格的安全测试。o3和o4-mini在生物学、网络安全和AI自我改进能力等领域的潜在风险,仍然低于OpenAI的高风险阈值。”

在发布会上,OpenAI两位研究人员展示了详细的基准测试结果,并指出新模型在训练计算量上超过了以往版本的10倍,才能实现这些强大的能力。

获取o3和o4-mini的时机与方式:部署时间表与商业策略

OpenAI的新模型目前已立即向chatgpt Plus、Pro和Team用户开放,Enterprise和Education客户将在下周获得访问权限。免费用户可以通过在提交查询前选择“Think”来体验o4-mini。

开发者可以通过OpenAI的Chat Completions API和Responses API试用这两个模型,尽管部分组织需要验证才能访问它们。

此次发布对OpenAI来说是一个重要的商业机会,因为这些模型似乎比前代更强大且更具成本效益。该公司举例称,在2025年AIME数学竞赛中,o3的性价比严格优于o1。同样,o4-mini在成本表现上也优于o3-mini。

业内分析人士认为,这些发布是人工智能能力融合的更广泛趋势的一部分,模型越来越多地将专业推理与自然对话能力和工具使用结合起来。

OpenAI在发布会中指出:“最新发布反映了我们的模型发展方向:我们正在将o系列的专门推理能力与GPT系列更多的自然对话能力和工具使用结合起来。”

不过,莫里克教授发帖称,o3是“非常强大的模型,但仍有明显短板”。

随着人工智能领域的竞争日益加剧,谷歌、Anthropic等公司推出越来越强大的模型,OpenAI在推理能力和实际工具使用上的双重关注表明,其战略是旨在通过提供智能和实用性来保持领先地位。

通过o3和o4-mini,OpenAI已经跨越了一个门槛——机器开始像人类一样感知图像,将视觉信息的处理作为思维过程的组成部分,而不仅仅是分析它们所看到的。这种从被动识别到主动视觉推理的转变,可能比任何基准分数都更具意义,代表着人工智能终于开始通过“思考的眼睛”来看待世界。(小小)

内容声明:

1、本站收录的内容来源于大数据收集,版权归原网站所有!
2、本站收录的内容若侵害到您的利益,请联系我们进行删除处理!
3、本站不接受违规信息,如您发现违规内容,请联系我们进行清除处理!
4、本文地址:https://www.717b.com/jxwxwz/38.html,复制请保留版权链接!


温馨小提示:在您的网站做上本站友情链接,访问一次即可自动收录并自动排在本站第一位!
随机文章:

夏普邹海明:4G带来C端变革,5G将带来B端变革|富士康|郭台铭

夏普邹海明:4G带来C端变革,5G将带来B端变革,夏普,邹海明,富士康,华为,郭台铭

互联网资讯 2025-04-18 20:21:07

崔宝秋:5G手机将迎来革命我们已在探索6G|小米|iot|杀手级

崔宝秋:5G手机将迎来革命我们已在探索6G,崔宝秋,小米,iot,手机,杀手级

互联网资讯 2025-04-18 20:20:37

云安全联盟大中华区主席李雨航:数据权属还处于模糊阶段|网络安全|云计算|信息安全

云安全联盟大中华区主席李雨航:数据权属还处于模糊阶段,李雨航,云安全,网络安全,云计算,信息安全

互联网资讯 2025-04-18 20:20:10

智见丨衣宝廉院士:燃料电池车是氢能应用的突破口|氢燃料|电动汽车

智见丨衣宝廉院士:燃料电池车是氢能应用的突破口,衣宝廉,燃料,氢能,氢燃料,电动汽车,电池

互联网资讯 2025-04-18 20:19:38

中国何时出现SpaceX?侯秀峰:不是时间问题|spacex|spacex公司|发射场|航天

中国何时出现SpaceX?侯秀峰:不是时间问题,侯秀峰,spacex,spacex公司,发射场,中国,航天

互联网资讯 2025-04-18 20:18:32

专访航天女教官王一:我和航天的双向奔赴|航天员|杨利伟|飞船|载人飞船|景海鹏

专访航天女教官王一:我和航天的双向奔赴,航天员,杨利伟,飞船,载人飞船,航天,景海鹏

互联网资讯 2025-04-18 20:18:24

梅花创投吴世春:虚拟数字人未来或将取代薇娅|风投|潮头|电商

梅花创投吴世春:虚拟数字人未来或将取代薇娅,吴世春,创投,风投,潮头,电商

互联网资讯 2025-04-18 20:18:12

格灵深瞳CEO赵勇:上市不是终点,懈怠是我最担心的事情|潮头|人工智能|沈南鹏

格灵深瞳CEO赵勇:上市不是终点,懈怠是我最担心的事情|潮头,赵勇,格灵,深瞳,潮头,人工智能,沈南鹏

互联网资讯 2025-04-18 20:18:07

瑞幸迷局|咖啡|星巴克|咖啡机|咖啡店

瑞幸迷局,瑞幸,咖啡,星巴克,咖啡机,咖啡店

互联网资讯 2025-04-18 20:17:18

量子竞逐:谁将主导新科技时代?|量子计算|潘建伟|量子计算机|卫星

量子竞逐:谁将主导新科技时代?,量子计算,潘建伟,量子计算机,卫星,量子

互联网资讯 2025-04-18 20:16:52

西装暴徒骁龙8Gen2加持iQOO11传奇版上手评测|手机|hdr|夜摄

西装暴徒骁龙8Gen2加持iQOO11传奇版上手评测,骁龙,手机,hdr,夜摄

互联网资讯 2025-04-18 20:12:52

三星S23Ultra体验:长焦能力提升明显定制芯片拉高综合体验|手机|ultra|像素

三星S23Ultra体验:长焦能力提升明显定制芯片拉高综合体验,三星,手机,ultra,像素

互联网资讯 2025-04-18 20:12:37

体验过OPPOFindX6Pro,我总结了四个字:「脱胎换骨」|oppo|手机|长焦|样张

体验过OPPOFindX6Pro,我总结了四个字:「脱胎换骨」,oppo,手机,长焦,样张

互联网资讯 2025-04-18 20:12:24

一文看懂WWDC23:VisionPro头显来了!还有5大系统更新|苹果

一文看懂WWDC23:VisionPro头显来了!还有5大系统更新,苹果,WWDC

互联网资讯 2025-04-18 20:12:00

红魔8SPro+游戏手机体验:165W快充为手机打上「开拓者」标签|透明版

红魔8SPro+游戏手机体验:165W快充为手机打上「开拓者」标签,手机,游戏,红魔,透明版

互联网资讯 2025-04-18 20:08:18

追觅H30洗地机体验:60℃热水正反转自清洁堪称懒人福音|吸尘器|滚刷|除菌

追觅H30洗地机体验:60℃热水正反转自清洁堪称懒人福音,洗地机,吸尘器,滚刷,除菌

互联网资讯 2025-04-18 20:07:28

2023年的小雪,是国产旗舰的立春|vivo|智能手机|联发科|国产手机

2023年的小雪,是国产旗舰的立春,vivo,智能手机,联发科,国产手机,手机

互联网资讯 2025-04-18 20:07:24

小米电视SPro体验:千级分区MiniLED面板高屏占比显示效果惊喜|色域|大屏幕

小米电视SPro体验:千级分区MiniLED面板高屏占比显示效果惊喜,小米电视,色域,大屏幕

互联网资讯 2025-04-18 20:07:09

iQOOPad2Pro轻体验:首发天玑9300+大电池全能平板|手写笔|pad|触控笔

iQOOPad2Pro轻体验:首发天玑9300+大电池全能平板,手写笔,天玑,pad,大电池,触控笔,平板

互联网资讯 2025-04-18 20:05:34

1997诺奖得主:诺奖可能是除生死之外最重要的事|科学|约翰·沃克|英国

1997诺奖得主:诺奖可能是除生死之外最重要的事,诺贝尔奖,科学,诺奖,约翰·沃克,英国

互联网资讯 2025-04-18 20:04:59

陈列平:我们的终极目标是要彻底治愈肿瘤|癌症|细胞|免疫

陈列平:我们的终极目标是要彻底治愈肿瘤,陈列平,肿瘤,癌症,细胞,免疫

互联网资讯 2025-04-18 20:04:13

容淳铭院士:安卓有教训,中国要有自己的区块链生态|区块链技术|互联网|云计算

容淳铭院士:安卓有教训,中国要有自己的区块链生态,区块链,容淳铭,区块链技术,互联网,云计算

互联网资讯 2025-04-18 20:03:44

何祚庥院士:李政道被派出国留学是奉命要为中国造原子弹|丁肇中

何祚庥院士:李政道被派出国留学是奉命要为中国造原子弹,何祚庥,李政道,杨振宁,丁肇中,院士

最新资讯 2025-04-18 20:02:15

黄天荫院士:缺少通识教育和基础训练,很难造就顶尖人才|医学|近视|近视眼

黄天荫院士:缺少通识教育和基础训练,很难造就顶尖人才,黄天荫,通识教育,基础训练,医学,近视,近视眼

最新资讯 2025-04-18 20:01:51

杨雄里院士:脑机接口让人拥有读心术?有可能,但必须规避风险|人工智能|马斯克|脑科学

杨雄里院士:脑机接口让人拥有读心术?有可能,但必须规避风险,杨雄里,人工智能,马斯克,脑科学,脑机接口,院士

最新资讯 2025-04-18 20:01:38

享界S9发布,余承东:坐迈巴赫睡不着睡在S9才是享受|北汽|奔驰s级|北汽新能源

享界S9发布,余承东:坐迈巴赫睡不着睡在S9才是享受,迈巴赫,余承东,北汽,奔驰s级,北汽新能源

最新资讯 2025-04-18 20:01:30

苹果首款AI手机iPhone16来了但大规模换机潮要等下代?|iphone|apple|相机|新iphone

苹果首款AI手机iPhone16来了但大规模换机潮要等下代?,iphone,手机,apple,苹果,相机,新iphone

最新资讯 2025-04-18 20:00:55

24年汽车交付目标冲刺13万台从小米最强Q3报看雷军押注的新未来|卢伟冰|智能手机|小米手机

24年汽车交付目标冲刺13万台从小米最强Q3报看雷军押注的新未来,雷军,小米,卢伟冰,智能手机,小米手机,汽车

最新资讯 2025-04-18 19:59:53

对话朱萧木:罗永浩秘密搞AI时,我为何卖起了“智商税”保健品?|锤子科技

对话朱萧木:罗永浩秘密搞AI时,我为何卖起了“智商税”保健品?,罗永浩,朱萧木,保健品,锤子科技,智商

最新资讯 2025-04-18 19:59:32

俞敏洪“拜师”胖东来?东方甄选在憋大招|新东方|物美集团

俞敏洪“拜师”胖东来?东方甄选在憋大招,俞敏洪,胖东来,新东方,物美集团,物美

最新资讯 2025-04-18 19:58:05

对话猫王妙播创始人曾德钧:做“懂你”的AI智慧音响|音箱

对话猫王妙播创始人曾德钧:做“懂你”的AI智慧音响,曾德钧,猫王,音响,音箱,妙播

最新资讯 2025-04-18 19:57:41

英特尔新任CEO陈立武首秀讲三件事:砍业务、拼AI,誓夺半导体战场|amd|英伟达

英特尔新任CEO陈立武首秀讲三件事:砍业务、拼AI,誓夺半导体战场,陈立武,英特尔,amd,英伟达

最新资讯 2025-04-18 19:57:27

AI圈冷处理,律师圈热讨论:Transformer专利会卡大模型厂商脖子吗?|谷歌|国家知识产权局|transformer|算法

AI圈冷处理,律师圈热讨论:Transformer专利会卡大模型厂商脖子吗?,专利,大模型,谷歌,国家知识产权局,transformer,算法

最新资讯 2025-04-18 19:57:18

网易智能工作室招贤纳士(2017年4月版)|人工智能|英语|翻译|兼职

网易智能工作室招贤纳士(2017年4月版),网易,人工智能,英语,翻译,兼职

最新资讯 2025-04-18 19:55:18

Cybertruck卖不动,特斯拉被曝减产调人手|马斯克|特朗普|cybertruck

Cybertruck卖不动,特斯拉被曝减产调人手,特斯拉,马斯克,特朗普,cybertruck

最新资讯 2025-04-18 19:53:41

日均调用量106倍狂飙豆包抢滩“Agent生态卡位战”|算法|文生|agent

日均调用量106倍狂飙豆包抢滩“Agent生态卡位战”,调用量,算法,文生,豆包,agent,卡位战

最新资讯 2025-04-18 19:53:38


TOP