OpenAI新版4o逆袭-重返大模型竞技场榜首

OpenAI新版4o逆袭-重返大模型竞技场榜首

作者:news 发表时间:2025-08-04
全球首台:浙大“悟空”类脑计算机问世,神经元数量超 20 亿最新进展 谈输赢为之过早?信托尚未设立,压力给到杭州法院!宗馥莉特别强调→官方已经证实 i8“碰撞门”炸锅!理想主义坠落时刻?后续反转来了 高技术产业“狂飙”,这三省凭什么领跑全国? 阿里巴巴前董事会老大张勇加盟港交所 鸿蒙游戏生态加速崛起:牵手腾讯等大厂,小游戏成产业新增长点官方已经证实 宗庆后遗产暗战:三份文件交锋17.99亿美元家族信托是真的? 中信证券:特朗普关税政策会对美国通胀影响几何? “撞”出流量后:理想隔空邀约再撞 乘龙卡车内涵“活着,才有资格谈理想”太强大了 协鑫朱共山要搞一个500亿的多晶硅拯救基金记者时时跟进 特朗普说解雇鲍威尔“一秒都不会犹豫”,但担心这会扰乱市场专家已经证实 全球首台:浙大“悟空”类脑计算机问世,神经元数量超 20 亿后续反转来了 宗庆后遗产暗战:三份文件交锋17.99亿美元家族信托是真的吗? 阿里巴巴前董事会老大张勇加盟港交所官方已经证实 天风证券:首次覆盖五菱汽车 给予“买入”评级 目标价0.77港元这么做真的好么? 新东方-S港股公司点评:增速进入平稳期,宣布三年股东回报计划 打造42万人顶着热浪都要来的“人海磁场” 大悦城如何书写实体商业新故事?丨提振消费新引擎 上市公司在行动后续反转 因违反账户管理规定等多项违规行为 廊坊银行被罚款超195万元实时报道 汽车行业董秘薪酬榜:中集车辆营收净利双双逆势大降 董秘毛弋仍涨薪39万至230万上榜记者时时跟进 商汤宣布完成新一轮25亿港元配售,将开展具身智能、数字资产等业务实垂了 天风证券:首次覆盖五菱汽车 给予“买入”评级 目标价0.77港元 直击CJ | 小米YU7被围观!“人车家全生态”亮相科技水平又一个里程碑 巨人网络参展2025ChinaJoy,持续提升用户触达与拓展品牌影响力 打造42万人顶着热浪都要来的“人海磁场” 大悦城如何书写实体商业新故事?丨提振消费新引擎 上市公司在行动又一个里程碑 外交部:对美方制裁感到震惊、失望和无法理解实测是真的 因违反账户管理规定等多项违规行为 廊坊银行被罚款超195万元后续反转 多名干部被问责!财政部通报实垂了 美联储人事地震!理事库格勒提前辞职 特朗普“大改造”的良机来了?科技水平又一个里程碑 上半年地方经济“密码” 特朗普最生气的一天后续反转来了 黑色星期五!美股重挫道指跌超500点,黄金大涨近2%科技水平又一个里程碑 突发!美联储理事库格勒宣布辞职,特朗普再获提名空缺 上半年地方经济“密码”最新报道 “坑惨”客户?纽铜历史性暴跌的前一天:高盛建议做多铜!官方处理结果 期货和衍生品法实施三周年 期货服务实体经济能力不断增强官方通报来了 刘强东斥资185亿,想在欧洲“再造一个京东” 龙国游客在日本遭遇勒颈抢劫,凶手已被逮捕 山姆塌房了,但会员制仍值得一聊 北交所打新热情恰似盛夏高温 今年7只新股首日涨幅均超150%

在万众瞩目的新加坡OpenAI开发者日活动中,ChatGPT再度展现了其非凡的实力。最新版本的ChatGPT-4o(简称4o)在备受关注的大模型竞技场中一举夺魁,将此前占据榜首的Gemini拉下了马。

OpenAI新版4o逆袭

此次4o的更新重点在于“创意写作能力”,据官方介绍,新版本能够生成更加自然、吸引人且有针对性的文本,显著提升了文本的相关性和可读性。4o在处理上传文件方面也进行了优化,能够提供更深入的见解和更全面的回应。

o1的核心贡献者Karina Nguyen对此次更新表示了肯定。她指出,作为Canvas功能的一部分,改进写作是一个顶级用例,有望改变人机协作的方式,让创作过程更具创造性。尽管她承认这一研究问题非常主观且开放,但至少在写作方面取得的进展对于实现AGI(通用人工智能)的创造性智能至关重要。

OpenAI新版4o逆袭

在大模型竞技场的创意写作分榜上,新版4o(ChatGPT-4o-1120)的得分从上一个版本的1365跃升至1402,进步显著。同时,在代码能力、数学能力、困难任务以及风格控制等多个方面,4o也均有所提升,成功从之前的第二名跃升至第一名。

OpenAI新版4o逆袭

然而,尽管4o的表现亮眼,但网友们对于OpenAI迟迟未推出o1满血版仍表示不满。一些网友在社交媒体上直言,希望OpenAI能够尽快放出o1,与近期备受瞩目的DeepSeek等模型进行正面较量。甚至有网友调侃称,OpenAI的更新策略似乎就是每当有其他模型登上榜首时,便迅速推出新版本夺回第一。

OpenAI新版4o逆袭

尽管4o在创意写作方面取得了显著进步,但仍有网友对其生成的内容进行了测试,并发现系统仍能够准确识别出这些内容为AI所写。不过,也有网友对4o的更新进行了深入研究,并发现OpenAI在系统提示词方面进行了优化,新增了一道护栏,以确保ChatGPT在敏感话题上不会胡说八道。

OpenAI新版4o逆袭

目前,新版4o已在大模型竞技场中上线,感兴趣的读者可以前往体验并分享自己的感受。对于未来OpenAI是否会推出o1满血版,以及它将如何与其他模型进行竞争,我们拭目以待。

相关文章