OpenAI深夜发布GPT-4.1系列模型，虚竹团队通宵对接，已经可以体验

我是虚竹哥，目标是带十万人玩转ChatGPT。

小虚竹

5135人浏览 · 2025-04-16 08:15:00

小虚竹 · 2025-04-16 08:15:00 发布

文章目录

零、前言
一、操作
- 操作指导
二、主要特点和应用场景
三、编码
四、遵循指令
五、长上下文
六、图像理解
七、定价
八、感受

零、前言

在这里插入图片描述
4月15日凌晨，OpenAI正式在API中推出全新的GPT-4.1系列模型。此次发布包括三款新模型，分别是GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三个新成员。
这些模型在各项指标上全面优于GPT-4o和GPT-4o mini，特别是在编程、指令遵循以及上下文理解方面表现突出。

它们还支持更长的上下文窗口，最大可达100万个Token。

不过，需要注意的是：GPT-4.1 仅通过 API 提供。但虚竹哥还是把它集成进了GPT系统。

一、操作

操作指导

ChatGPT 4o国内直接访问地址：https://sass.xiaoxuzhu.cn/
在这里插入图片描述

输入购买的授权码即可。
在这里插入图片描述

二、主要特点和应用场景

以下为三款新模型的主要特点和应用场景：

GPT-4.1：OpenAI的旗舰级模型，擅长编码、指令遵循和长上下文理解，适用于处理复杂任务。

GPT-4.1 mini：OpenAI的高效小型模型，在多个基准测试中表现超越 GPT-4o，大幅减少延迟并降低 83% 成本，适合对性能要求高的场景。

GPT-4.1 nano：OpenAI 首个超小型模型，速度最快、成本最低，支持 100 万 Token 的上下文窗口，适用于低延迟任务，如分类和自动补全。

三、编码

GPT-4.1 在各种编码任务上都比 GPT-4o 表现得更好，包括代理解决编码任务、前端编码、减少无关编辑、可靠地遵循差异格式、确保一致的工具使用等等。

在衡量真实世界软件工程技能的 SWE-bench Verified 测试中，GPT-4.1 完成了 54.6% 的任务，而 GPT-4o（2024-11-20）的完成率为 33.2%。这反映了模型在探索代码库、完成任务以及生成可运行并通过测试的代码方面的能力有所提升。
在这里插入图片描述
GPT-4.1 在前端编码方面也比 GPT-4o 有了显著提升，能够创建功能更强大、更美观的 Web 应用。

四、遵循指令

GPT-4.1 更可靠地遵循指令，并且已经在各种指令遵循评估中测量到了显著的改进。
GPT-4.1 在困难提示方面的表现尤其优于 GPT-4o。
在这里插入图片描述

五、长上下文

GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 最多可以处理 100 万个上下文标记，而之前的 GPT-4o 型号最多可以处理 128,000 个。100 万个标记相当于整个 React 代码库的 8 个以上副本，因此长上下文非常适合处理大型代码库或大量长文档。
Graphwalks 使用由十六进制哈希值组成的有向图填充上下文窗口，然后要求模型从图中的随机节点开始执行广度优先搜索 (BFS)。然后，我们要求它返回特定深度的所有节点。GPT-4.1 在此基准测试中达到了 61.7% 的准确率，与 o1 的性能相当，并轻松击败了 GPT-4o。
在这里插入图片描述

六、图像理解

GPT-4.1 系列在图像理解方面非常强大，尤其是 GPT-4.1 mini 代表了重大的飞跃，在图像基准测试中经常击败 GPT-4o。
在这里插入图片描述

在这里插入图片描述

长上下文性能对于多模态用例（例如处理长视频）也很重要。在Video -MME中（在新窗口中打开）（长篇无字幕）模型会根据 30-60 分钟长的无字幕视频回答多项选择题。GPT-4.1 的表现达到了最佳水平，得分为 72.0%，高于 GPT-4o 的 65.3%。
在这里插入图片描述