投研观点-详情

OpenAI系列追踪Day1：GPT-4.1推动文本推理升级，多模态仍待补强

2025-04-16 13:33 海通国际姚书桥,吴叡霖查看PDF原文

（以下内容从海通国际《OpenAI系列追踪Day1：GPT-4.1推动文本推理升级，多模态仍待补强》研报附件原文摘录）　　事件：

　　2025年4月14日，OpenAI正式发布新一代语言模型GPT-4.1系列，包括GPT-4.1、GPT-4.1Mini和GPT-4.1Nano三个版本。

　　点评：

　　GPT-4.1拓展AI应用边界，向更长文本与更快响应迈进。GPT-4.1支持高达100万个token的上下文处理能力，是前代模型的8倍，能够实现跨章节、跨文档的持续对话与逻辑推理，适用于法律审阅、科研摘要与大型代码库管理等高复杂度任务。此外，模型的响应延迟大幅降低，在开发者实测中推理速度较GPT-4o提升近40%，可支持更广泛的实时场景部署。

　　编程与指令处理能力大幅增强，助推开发者生态繁荣。在SWE-benchVerified测试中，GPT-4.1准确率达54.6%，较GPT-4o提升21.4个百分点，尤其擅长多语言代码生成与调试。Scale的MultiChallenge测试显示其在遵循复杂指令、结构化输出中的表现优于业内大多数模型。伴随工具调用与函数执行能力提升，GPT-4.1有望加速AI在低代码开发、自动运维、金融建模等场景的渗透。

　　GPT-4.1系列分层产品化策略推动AI下沉：Mini、Nano定位边缘端。GPT-4.1Mini与Nano版本分别面向轻量化推理与边缘计算场景。其中Nano模型每百万tokens成本仅0.12美元，适配IoT、工业机器人、智能终端等部署环境。OpenAI借此构建“通用模型+分层部署”体系，有望提升模型普及率，进一步夯实其在AI平台生态中的主导地位。

　　我们认为，OpenAI本周的产品更新至关重要，但从目前已发布的内容来看，其在多模态能力和推理硬件方面略显滞后。相较之下，Google推出的Gemini2.5在多模态处理能力上表现更为出色，已支持图像、视频、音频与代码的统一理解，且在多个基准测试（如MME、MathBench）中领先于GPT-4.0。与此同时，Google近期发布的TPUv7（Ironwood）进一步巩固了其在AI推理硬件领域的领先地位。另外，星际之门的计划和规模现在不确定性较大，OpenAI的算力目前仍依赖于Azure。若OpenAI本周不能拿出在多模态、推理效率或平台工具链方面的实质性更新，或在后续面临更激烈的竞争。

　　风险提示：1）AI需求不及预期；2）地缘政治环境干扰供应链；3）AI数据中心建造放缓

提示：本文属于研究报告栏目，仅为机构或分析人士对市场的个人观点和看法，并非正式的新闻报道，本网不保证其真实性和客观性，一切有关该股的有效信息，以沪深交易所的公告为准，敬请投资者注意风险。

查看PDF原文

网友评论