当前位置: 首页> 投研观点> OpenAI系列追踪Day1:GPT-4.1推动文本推理升级,多模态仍待补强

OpenAI系列追踪Day1:GPT-4.1推动文本推理升级,多模态仍待补强

2025-04-16 13:33 海通国际 姚书桥,吴叡霖 查看PDF原文

(以下内容从海通国际《OpenAI系列追踪Day1:GPT-4.1推动文本推理升级,多模态仍待补强》研报附件原文摘录)  事件:

  2025年4月14日,OpenAI正式发布新一代语言模型GPT-4.1系列,包括GPT-4.1、GPT-4.1Mini和GPT-4.1Nano三个版本。

  点评:

  GPT-4.1拓展AI应用边界,向更长文本与更快响应迈进。GPT-4.1支持高达100万个token的上下文处理能力,是前代模型的8倍,能够实现跨章节、跨文档的持续对话与逻辑推理,适用于法律审阅、科研摘要与大型代码库管理等高复杂度任务。此外,模型的响应延迟大幅降低,在开发者实测中推理速度较GPT-4o提升近40%,可支持更广泛的实时场景部署。

  编程与指令处理能力大幅增强,助推开发者生态繁荣。在SWE-benchVerified测试中,GPT-4.1准确率达54.6%,较GPT-4o提升21.4个百分点,尤其擅长多语言代码生成与调试。Scale的MultiChallenge测试显示其在遵循复杂指令、结构化输出中的表现优于业内大多数模型。伴随工具调用与函数执行能力提升,GPT-4.1有望加速AI在低代码开发、自动运维、金融建模等场景的渗透。

  GPT-4.1系列分层产品化策略推动AI下沉:Mini、Nano定位边缘端。GPT-4.1Mini与Nano版本分别面向轻量化推理与边缘计算场景。其中Nano模型每百万tokens成本仅0.12美元,适配IoT、工业机器人、智能终端等部署环境。OpenAI借此构建“通用模型+分层部署”体系,有望提升模型普及率,进一步夯实其在AI平台生态中的主导地位。

  我们认为,OpenAI本周的产品更新至关重要,但从目前已发布的内容来看,其在多模态能力和推理硬件方面略显滞后。相较之下,Google推出的Gemini2.5在多模态处理能力上表现更为出色,已支持图像、视频、音频与代码的统一理解,且在多个基准测试(如MME、MathBench)中领先于GPT-4.0。与此同时,Google近期发布的TPUv7(Ironwood)进一步巩固了其在AI推理硬件领域的领先地位。另外,星际之门的计划和规模现在不确定性较大,OpenAI的算力目前仍依赖于Azure。若OpenAI本周不能拿出在多模态、推理效率或平台工具链方面的实质性更新,或在后续面临更激烈的竞争。

  风险提示:1)AI需求不及预期;2)地缘政治环境干扰供应链;3)AI数据中心建造放缓

提示:本文属于研究报告栏目,仅为机构或分析人士对市场的个人观点和看法,并非正式的新闻报道,本网不保证其真实性和客观性,一切有关该股的有效信息,以沪深交易所的公告为准,敬请投资者注意风险。

网友评论

×

  • 1.若本人/本机构拟认购/申购私募类资管产品、信托计划,则本人/本机构承诺符合以下条件之一:
  • (1)具有2年以上投资经历,且满足金融净资产不低于300万元,或家庭金融资产不低于500万元:或近3年本人年均收入不低于40万元;
  • (2)最近1年末净资产不低于1000万元的法人单位;
  • (3)金融管理部门视为合格投资者的其他情形。
  • 2.若本人/本机构拟认购/申购私募基金,则本人/本机构承诺符合以下条件之一:
  • (1)金融资产不低于300万元或者最近三年个人年均收入不低于50万元的个人;
  • (2)净资产不低于1000万元的单位。
  • 本人/本机构确认是为自己购买私募产品,不会以非法拆分转让为目的购买私募产品,且资金来源合法合规,不会使用贷款、发行债券等筹集的非自有资金进行投资。
特定对象认证

确 认

×

风险测评
温馨提示:本问卷旨在协助您选择符合您风险识别和承受能力的产品或服务,问卷结果并不能取代您的投资判断,也不会降低产品或服务的固有风险。
    下一题