DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

中天火箭拟每10股派现金红利0.19元是真的吗？ 李斌：汽车行业是一个非常年轻的新兵，特斯拉在第十年时也比较稚嫩实测是真的 宁波金融监管局同意交通银行宁波余姚金融大厦支行名称变更 视频教程一：私募基金管理人登记信息及投资者查询技巧太强大了 斑马股份IPO:前CFO朋友圈怼前高管“非常鄙视某些高管的人品，承认你的权谋与城府，但鄙视为人与价值观”科技水平又一个里程碑 祥源文旅拟用4.73 亿元资本公积弥补 5.19 亿元亏损实垂了 原美团平台技术负责人司天歌确认离职是真的？ 视频教程一：私募基金管理人登记信息及投资者查询技巧太强大了 洪灏：散户还没大规模进场，但要涨势更持久需要看到一些政策支持科技水平又一个里程碑 山东钢铁，扭亏为盈！ 蔚来汽车李斌：“蔚来是一个高端品牌”这件事几乎成了共识后续会怎么发展 精准加仓！广州一养老院，投资煤炭股大赚！反转来了 高端白酒价格平稳，习酒1988等多款次高端白酒线上价格下跌是真的吗？ 互联网金融急速冲高，指南针大涨超10%！百亿金融科技ETF（159851）拉升逾2%续创新高，资金大举加仓实测是真的 自身商业行为与诉讼主张矛盾?马斯克曾邀Meta联手收购OpenAI 山东钢铁，扭亏为盈！后续来了 山东钢铁，扭亏为盈！最新进展 AI伴侣用户“四倍跃升”! Zoom实现11个季度以来最强业绩增速 海越能源（600387）投资者索赔案部分达成调解是真的？ 喜报！星源材质获评深交所国证ESG AA评级实时报道 华泰联合保荐英思特IPO项目质量评级B级上市周期超两年专家已经证实 江特电机：上半年归母净利润亏损1.14亿元，同比亏损扩大后续反转 亚通股份涉嫌虚假陈述受损股民可索赔最新报道 601929，尾盘拉升，上演“地天板”这么做真的好么？ 麦田能源创业板IPO 稳健财务表现奠定坚实基础官方处理结果 晶华微涉嫌虚假陈述受损股民可索赔后续反转 科创板募资14亿，三年再亏9亿！星环科技赴港IPO找谁买单？反转来了 西安大润发超市被罚丨某批次香蕉农药残留超标约五倍 上海“临港科创城”推进大会举行，临港集团 “超级个体288行动”发布后续会怎么发展 外汇市场8月波动反常低迷交易员静候美联储信号 麦斯莫医疗对美国海关提起诉讼因其批准配备血氧功能的苹果手表进口这么做真的好么？ 金洲管道：2025年半年度净利润约5783万元 亿纬锂能上半年营收同比增长30% 动力电池出货量、毛利率双增又一个里程碑 金洲管道：累计回购约1512万股实测是真的 股东提议连续三年实施三季报分红不低于30%净利润，青农商行董事会“不予提交” 苏大维格：8月21日召开董事会会议官方已经证实 半年狂砸21亿，石头科技把钱都撒哪里了？ 三一重工上半年净利52.16亿元，同比增长46%官方通报 特朗普5亿美元的民事罚款被上诉法院驳回后续来了 三一重工上半年净利52.16亿元，同比增长46% 券商交易系统建设宜“快稳兼顾”官方通报来了 阿特斯上半年净利7.31亿元，同比降超四成 三一重工上半年净利52.16亿元，同比增长46% 跨界光伏近3年，重大项目接连告吹！棒杰股份拟终止扬州一光伏组件项目后续会怎么发展 拓斯达：上半年净利润同比下降19.75% 航天电器上半年净利润同比下滑超77%，核心业务“连接器及互连一体化产品”毛利率下滑实垂了 高新发展上半年营收下滑超17%，归母净利润同比增长超14%后续来了 美国制造业活动扩张速度为2022年以来最快受需求提振

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。