腾讯混元20发布:AI大模型技术新突破

  12月5日,腾讯正式宣告了其自研AI大模子混元2.0(Tencent HY2.0),这是继Hunyuan-T1之后的一次首要升级。HY2.0正在参数范围、推理才智以及使用场景上均有明显擢升,符号着腾讯正在AI范畴的连续革新与先进。

  HY2.0采用搀和专家(MoE)架构,总参数高达406B,激活参数为32B,支撑256K的上下文窗口。这种架构策画不但擢升了模子的推理才智和恶果,更使得HY2.0正在邦内AI大模子范畴中处于领先职位。凭据腾讯的声明,HY2.0正在文本创作、庞大指令听命等适用场景中显示越过,出现了健壮的使用潜力。

  正在数据预磨练和深化研习战略方面,HY2.0Think相较于前一版本有了明显改进。腾讯通过高质料的数据集以及Large Rollout深化研习,使得HY2.0正在庞大推理场景中的显示稳居邦内第一梯队。卓殊是正在邦际数学奥林匹克竞赛(IMO-AnswerBench)和哈佛MIT数学竞赛(HMMT2025)等威望测试中,HY2.0Think得到了优越成就,显示出其正在数学和科学常识推理方面的健壮才智。

  正在指令听命和众轮职司的才智上,HY2.0通过首要性采样校正本领,管理了磨练和推理纷歧概的题目,达成了长窗口RL的高效稳固磨练。另外,模子采用了众样化的职司沙盒和基于打分准绳的深化研习,明显擢升了正在MultiChallenge等指令听命职司中的显示。

  正在代码和智能体才智方面,HY2.0构修了范围化的可验证境况及高质料合成数据,加强了模子正在Agentic Coding及庞大用具移用场景下的实质使用才智。经历测试,HY2.0正在SWE-benchVerified和Tau2-Bench等真正使用场景的智能体职司上显示卓越,显示出其正在实质使用中的广博实用性。

  值得小心的是,HY2.0Think引入了精致的长度责罚战略,有用均衡了头脑链的恶果与效率,避免了模子输出冗余音信,达成了估计资源的更高效分派。凭据比拟,HY2.0正在IMO-AnswerBench、HMMT2025、ARC-AGI、Humanitys Last Exam(HLE)等威望推理职司中的显示,显示出正在好似切确率下,HY2.0的token泯灭明显低于其他模子,呈现了其正在智能密度上的行业领先秤谌。

  通过RLVR+RLHF双阶段的深化研习战略,HY2.0的输出质料有了明显擢升,正在文本创作、前端斥地和指令听命等实质使用场景中出现出鲜明的上风。与前版本比拟,HY2.0正在指令听命方面的切确率有了鲜明擢升,进一步安稳了其举动腾讯自研通用大模子的职位。

  另日,腾讯将连续对HY2.0实行迭代升级,核心合怀代码、智能体、天性化格调和长程追忆等对象,一切擢升模子正在实质使用中的显示。同时,干系本领和模子也将以开源局面向社区盛开,进一步激动AI本领的生长与使用。

  目前,HY2.0仍然率先正在腾讯的元宝和ima等原生AI使用中接入,并正在腾讯云上线API,用户可能直接体验或接入计划。跟着HY2.0的推出,腾讯正在AI范畴的革新程序将连续加快,为各行业的智能化转型供给强有力的本领支撑。返回搜狐,查看更众