
OpenAI深夜发布GPT-4.1系列模型,虚竹团队通宵对接,已经可以体验
我是虚竹哥,目标是带十万人玩转ChatGPT。
零、前言
4月15日凌晨,OpenAI正式在API中推出全新的GPT-4.1系列模型。此次发布包括三款新模型,分别是GPT-4.1、GPT-4.1 mini和GPT-4.1 nano三个新成员。
这些模型在各项指标上全面优于GPT-4o和GPT-4o mini,特别是在编程、指令遵循以及上下文理解方面表现突出。
它们还支持更长的上下文窗口,最大可达100万个Token。
不过,需要注意的是:GPT-4.1 仅通过 API 提供。但虚竹哥还是把它集成进了GPT系统。
一、操作
操作指导
ChatGPT 4o国内直接访问地址:https://sass.xiaoxuzhu.cn/
输入购买的授权码即可。
二、主要特点和应用场景
以下为三款新模型的主要特点和应用场景:
GPT-4.1:OpenAI的旗舰级模型,擅长编码、指令遵循和长上下文理解,适用于处理复杂任务。
GPT-4.1 mini:OpenAI的高效小型模型,在多个基准测试中表现超越 GPT-4o,大幅减少延迟并降低 83% 成本,适合对性能要求高的场景。
GPT-4.1 nano:OpenAI 首个超小型模型,速度最快、成本最低,支持 100 万 Token 的上下文窗口,适用于低延迟任务,如分类和自动补全。
三、编码
GPT-4.1 在各种编码任务上都比 GPT-4o 表现得更好,包括代理解决编码任务、前端编码、减少无关编辑、可靠地遵循差异格式、确保一致的工具使用等等。
在衡量真实世界软件工程技能的 SWE-bench Verified 测试中,GPT-4.1 完成了 54.6% 的任务,而 GPT-4o(2024-11-20)的完成率为 33.2%。这反映了模型在探索代码库、完成任务以及生成可运行并通过测试的代码方面的能力有所提升。
GPT-4.1 在前端编码方面也比 GPT-4o 有了显著提升,能够创建功能更强大、更美观的 Web 应用。
四、遵循指令
GPT-4.1 更可靠地遵循指令,并且已经在各种指令遵循评估中测量到了显著的改进。
GPT-4.1 在困难提示方面的表现尤其优于 GPT-4o。
五、长上下文
GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 最多可以处理 100 万个上下文标记,而之前的 GPT-4o 型号最多可以处理 128,000 个。100 万个标记相当于整个 React 代码库的 8 个以上副本,因此长上下文非常适合处理大型代码库或大量长文档。
Graphwalks 使用由十六进制哈希值组成的有向图填充上下文窗口,然后要求模型从图中的随机节点开始执行广度优先搜索 (BFS)。然后,我们要求它返回特定深度的所有节点。GPT-4.1 在此基准测试中达到了 61.7% 的准确率,与 o1 的性能相当,并轻松击败了 GPT-4o。
六、图像理解
GPT-4.1 系列在图像理解方面非常强大,尤其是 GPT-4.1 mini 代表了重大的飞跃,在图像基准测试中经常击败 GPT-4o。
长上下文性能对于多模态用例(例如处理长视频)也很重要。在Video -MME中(在新窗口中打开)(长篇无字幕)模型会根据 30-60 分钟长的无字幕视频回答多项选择题。GPT-4.1 的表现达到了最佳水平,得分为 72.0%,高于 GPT-4o 的 65.3%。
七、定价
GPT-4.1、GPT-4.1 mini 和 GPT-4.1 nano 现已向所有开发人员开放。
这个成本虚竹哥来承担,加量不加价 ,原先的PLUS用户可直接使用。
八、感受
GPT-4.1 是人工智能实际应用领域迈出的重要一步。通过密切关注开发者的实际需求——从编码到指令执行,再到长上下文理解——这些模型为构建智能系统和复杂的代理应用程序开启了全新的可能性。
好用的功能太多太多,我就不在这个一一列举了,有兴趣的可以自行尝试。
有提供免费的授权码可体验~
有提供免费的授权码可体验~
有提供免费的授权码可体验~
私信虚竹哥,获取体验码~
国内可直接使用~
我是虚竹哥,目标是带十万人玩转ChatGPT。
更多推荐
所有评论(0)