腾讯混元三年转型

2026.01.12 本书字数：7212，阅读时间约12分钟Neocortex NewNewThing 卢彦军吴阳阳 2025 年 11 月底，大学毕业生林峰在深圳参加腾讯青云项目闭门会议。该活动仅限受邀者参加，并将持续两天。会议内容包括邮轮之旅、腾讯总部参观以及部门会议，姚均宇先生也出席了此次活动。这次会议持续了大约2个小时。姚舜瑜担任开幕演讲嘉宾。虽然讲座只有20分钟左右，但我的动力却非常足。他说浑源的目标是与世界上最大的模型进行比较。林峰告诉第一财经记者NeoCortex。姚舜禹给林枫留下了深刻的印象。 “我感觉他是会引领混源大规模模型开发进度的管理者”，他也是林峰在现场见过的为数不多的joYou see腾讯高管之一。姚逊yu预计于2025年下半年加入腾讯，此前曾在OpenAI工作。青云计划是腾讯在2023年下半年针对优秀毕业生提出的一项专门的AI人才招聘计划，将作为字节跳动初期人才计划的标杆。与青云计划同时进行的，腾讯已经进行了一年的高薪猎聘。多年从事基础模特招聘的徐兰告诉《新皮层》，腾讯最重要的招聘对象之一是字节跳动。在字节跳动排名2-2的候选人转入腾讯后可以获得排名T12或T13。这是他在字节跳动原职位上连续第二次晋升。更重要的是，你的工资会翻倍，有的人工资会增加200%。 “这种市场是上个月才出现的。此前，只有2、2名兼职候选人被分配到T9或T10级别，加薪幅度只有30%。”徐兰说。 2025年腾讯这是2024年的字节跳动。2024年，字节跳动加快基础模型研发进度，第一步就是获取人才。当时的主要目标是阿里巴巴。一年后，腾讯从字节跳动“输送”人才，收购了人才。多位接近腾讯的人士告诉New Cortex，腾讯计划在2024年底开始大规模招聘核心模型相关人才，并于2025年9月开始对组织架构进行一系列调整。姚舜瑜新政策出台之初，加入腾讯鸿源的外部员工大部分来自微软。 2024年，微软开源模式eWizardLM团队高级成员孙庆峰、微软亚洲研究院视觉计算组原首席研究员胡寒、微软WizardLM团队项目创始人徐灿先后加入腾讯。 2025 年 8 月，《月之暗面》音频模型的研究员谭旭加入D. 腾讯.在加入月之暗面之前，他曾在微软亚洲研究院工作。 “腾讯只考虑Deep Seek、Dark Side of the Moon、Byte和Alibaba这四个核心模型团队的候选人。其他公司暂不考虑候选人。”接近腾讯招聘团队的人士陈立峰告诉New Cortex。他告诉《新皮质》，字节跳动在2025年中期发行了“虚拟豆宝股”。激励员工就相当于给一个大模范团队加薪。不过，正是在这次股市激励期间，一些字节豆宝员工趁机化解了局面，加入了腾讯混元。字节跳动员工原本年总收入2.5至300万元，加入混源后，现在年收入300元，有可能收到万元以上的offer。 2025年12月，字节跳动再次向全球员工发出加薪邮件，并增加了公司范围内的员工工资。奖金投入和薪酬调整分别提高35%和1.5倍，确保员工薪酬和激励回报的竞争力在全球各个市场处于“高水平”。在Bait的辩护下，抓捕腾讯人的计划也在加强。 “姚舜宇的加入是腾讯鸿源人才招聘的重要节点。”徐兰表示，在姚君宇到来之前，“人才流动”在大公司里，高管加入腾讯是常态。姚君宇加入公司后，浑源不仅加强了招聘活动，还“加强了候选人信息的保密”。以姚新宇为节点的加入，腾讯招募了更多与大规模语言模型（LLM）相关的人才。此前，孙庆峰、胡涵、徐灿、谭等参与者的主要研究方向徐先生主要是多式联运，很多招聘人员告诉New Cortex，姚先生。舜宇将担任LLM相关职位的面试官，并亲自推荐一些候选人。这些新员工中包括至少三名来自Byte Seed和DeepSeek团队的T12级人才。其中一名负责预训练数据工作，另一名则与姚舜宇一起进行大模型的前沿探索。姚舜宇的到来让浑源的一些员工感到更加安全。 “他们认为姚舜宇可能会尝试在公司内部获得更多激励，类似于字节种子向团队成员分配豆子和股票的方式。”姚均宇的做法赢得了部分员工的信任。一名公司员工认为他“性格开朗，工作起来很安全”，而另一名员工则表示他拥有“良好的管理技能”。我想了一下。然而，一些混元成员开始担心自己的能力和适应能力不足，开始积极寻求外部机会。 “更多的人可能会离开浑源，无论是主动还是被动，”徐兰说。血液交换是这只是姚舜瑜加盟浑源后的新政策之一。在模型策略上，他提出了一个与之前模型的oneleaders不同的概念。一位接近腾讯鸿源的消息人士告诉《新皮质》，姚舜宇训练后比前任教练更加细心，这也是很多人预料到的。姚寻予迄今为止的主要工作与培训后的内容有关。但除此之外，我们还计划“从数据中重新训练混元”，相当于从预训练数据部分开始，回到起点。林峰表示，姚舜宇在11月份的青云项目闭门会议上也提出了降低“排放率”的明确方案。 “他说以前混元模型内部更新速度很快，有时一个星期就发布两个版本，他来这里第一件事就是放慢发布速度，好好打磨，完整的模型会重新发布。”林枫说道。他深深地我参与该项目。此前，他刚刚从普林斯顿大学毕业，研究方向为自然语言处理和强化学习。在博士学习期间，他产生了两项重大科研成果：人工智能计算框架ToT（Tree of Thoughts）；在解决复杂问题时，可以将问题分解为多个思考步骤，最终找到最优路径。另一个是反应。该算法允许大型模型同时进行推理和行动。 ToT和ReAct都可以应用在模型后训练阶段，提高模型的多步推理和实际操控能力。 ToT 和 ReAct 存在于 Operator、Deep Research 和其他 OpenAI 代理项目中。也就是说，当腾讯从OpenAI挖走姚舜宇时，他才入职一年。但在中国巨大的人才争夺战中，从地位和薪资来看，腾讯的报价可能是最好的。 2025年9月，有RU市场普遍认为，腾讯开出了数亿元的薪资来吸引他。随后，腾讯方面辟谣了这一传闻。姚舜宇先生于 1998 年获得了大语言法学硕士（法学硕士）“n.° 1”的称号，成为国家制造校长的年轻人。 2025年12月，腾讯宣布对混源组织架构进行调整。姚舜宇被任命为腾讯总裁兼执行董事，报告腾讯总裁刘炽平。它还负责人工智能基础设施和大规模语言模型。一位接近腾讯的消息人士告诉New Cortex，姚舜宇通常在该公司的香港办公室工作。据腾讯专家透露，姚舜宇是腾讯总裁兼首席执行官办公室人员名单上唯一的人。这是腾讯首次进行大规模局域网化改造自2023年开始研发大型模型以来，将大型模型列为重大项目。此外，该模型的负责人对其管辖的设备拥有直接、全面的管理和人事权利。 “刘炽平有财务经验，没有技术经验。姚新宇靠他，获取配套资源效率更高。”腾讯AI实验室退休员工秦莹莹告诉《新皮层》，到目前为止，腾讯研发的混元模式上游汇报环节长，下游管理体系复杂。浑源从年初到2025年底做出了一系列组织和人事变动，表明腾讯开始对SpaceBig的模式感到不舒服。这家大公司担心的直接原因是，内部开发的车型“混元”的性能不如大车型。我还不够高比赛中。 “很多公司推出新模型的时候，基准测试中对比的模型基本上都是GPT、Claude、Gemini、Qianwen、Kimi、DeepSeek。你看不到豆宝、混元。”一位各大模型行业负责人告诉《新皮质》，这次评选基本具有行业代表性。行业对谁处于模型第一层的了解。马化腾在2023年5月的股东大会上表示：“对于工业革命（机会均等）来说，提前一个月（或晚一个月）拔出灯泡从长远来看并不是那么重要。”然而，现在最伟大的模式是“实验科学”。 “从基本架构到注意力机制，从参数量到优化算法……每个环节都有多种解决方案，你必须尝试一下才能知道它是否有效以及使用什么尺寸的参数。”模型业内人士表示。这种实验性质意味着，新来者虽然有成熟的解决方案，但o 学习，与其他玩家相比，他们缺乏通过实验积累的经验。你移动得越慢，差距就越大，就越难追上。腾讯是最后一家推出自主研发大型车型的国内大型厂商。 2022年11月下旬，OpenAI推出ChatGPT。四个月后，2023年3月，百度推出第一代文心一言大模型。同年4月，阿里巴巴推出统一钱文大款。同年8月，字节跳动也推出了首款云雀大机型。腾讯的启动速度比这三个公司慢。 2023年2月，腾讯开始组建名为“混元助手”的团队，聚集各业务群的人才。时任腾讯AI实验室主任的张正友领导了整个项目。 TenseMany前员工告诉New Cortex，腾讯在大模型领域起步缓慢与内部节奏有很大关系。 2022年，当ChatGPT推出后，腾讯经历了多次低迷。薄弱领域之一是游戏业务。 2022年，中国游戏行业获批牌照总数同比下降32%，为多年来最低数量。另一位前腾讯员工告诉New Cortex，游戏是腾讯最赚钱的业务之一。由于版本数量急剧下降，游戏收入的不确定性正在增加。同年，该公司实施“降低成本、提高效率”。即使像腾讯的TEG（技术工程集团）这样的技术中心也必须承担自己的盈亏。后来主导混元模型研发的张正宇领导的人工智能研究院隶属于TEG。 “当时，AI 实验室并不鼓励研究人员发表论文。如果员工想参加会议，就必须动用大学的预算来参加会议，”他谈到《新》时说。腾讯AI Lab退休员工秦莹莹表示，2016年AI Lab成立时，主要任务仍然是进行基础研究。但到了2018年左右，AI Lab分裂成了两部分，只有少数成员继续进行AI基础研究，其余大部分开始为广告、游戏业务和公司做贡献。此外，这位前AI Lab员工表示，在游戏业务陷入危机之前，腾讯在2020年左右面临了重大危机， QQ的“孵化魔力”失败了。在2020年之前，腾讯的很多新业务和产品，比如QQ音乐、腾讯视频，都是通过QQ成功培育起来的。当时，QQ扮演的角色：与今天豆包发行中扮演的角色非常相似，但到了2020年左右，腾讯的很多新业务将很难复制过去的成功。例如，ンセントの电子商取引、今日头条と竞合する天天快报、抖音や快手と竞合する腾讯微视我期待された成功を收めていない。テンセントのもう一つの主要流通チャネルである微信の月间akutibuyuーザー数は2020年に12亿2,500ったが、当时のQQに比べて新产品を生み出す魔法はまだ発挥できていない。在众多新业务中，视频账号是腾讯高管认为唯一拥有的业务セント创业者兼会长兼最高経営责任人（CEO）の马化腾氏は社内suタッfu会议で「微茶事业主要目标是事业はビデオカウントであり、基本的に视聴人全体の希望だ」と述べたという。 2023年，马化腾在股东大会上表示：“人工智能是百年一遇的机会，就像行业一样。”革命。腾讯AI Lab 2023社に予算とプロジェクトの承认を申请する必要があります。「当时、モデルのtoreningにかかるkosutoはまだ非常に高く、试行错误には简単に数百万ドルかかる可能性がありました。たとえtoreninguが成功したとしても、モデルの目的は何でしょうか。当时は谁も明确に言うことができませんでした。”腾讯人工智能实验室界は、大型モデルが実験科学であるだけでなく、前例のない开発パラダイムを生み出すものであることを认识しました产业时代のように、明确なトップダウンの计划分业や大多数のエンジniaによる分业によって完成させることはできません。这种依赖性导致每个技术支柱都有不同的开发模型。大型模型的开发是一个系统工程。从预训练数据、预训练架构和算法来看，训练无法生成一个模型从集约开发。多个骨干技术除非模型的整体实验概念，一直到基础设施和后编码路径级别，处于最前沿。前述腾讯AI实验室退休员工告诉《新皮层》，在开始大规模模型开发三年后，腾讯长期以来一直未能为混元团队找到合适的技术负责人。微信团队也训练了一个模型，但后来放弃了。上述腾讯AI实验室退休员工告诉《新皮质》，在姚舜宇加入公司之前，腾讯鸿源有过两位总经理，分别是张正宇和姜杰。张正友的研究方向是计算机视觉。他发明的校准平板相机的方法在世界各地广泛使用，被称为“张氏方法”。但较大模型的核心是LLM。LLM的核心是自然语言处理，而不是图像处理。 ”经过张正宇先生的管理搞了快半年了，并没有取得满意的成绩。 “后来，江杰先生主动接手了混源项目，因为他认为大模型对宣传有用。”秦莹莹说。江杰于2012年加入腾讯，负责腾讯的企业发展，担任业务集团（CDG）和技术工程集团（TEG）副总裁，负责腾讯广告平台的产品技术管理。在江杰全面负责下，刘伟和王迪曾短暂直接管理混源。 “刘伟类似于协调员，王迪类似于执行者。”秦莹莹告诉《新皮层》，不过刘伟和王迪的技术背景并没有紧密联系。刘伟在2024年底离开腾讯后，创立了一家名为ReBirth的公司，主要方向是视频。一代人。王迪于2008年通过校招加入腾讯。在领导混源LLM、T.En EG模式之前，我主要负责搜索推广数据和算法。截至2024年11月，蒋杰不再管理浑源项目的LLM部分，仅负责浑源多式联运模式。上文提到的腾讯AI Lab退休员工表示，当时整个LLM团队都在等待“来自微软的高层次人才”，但这位微软领导者却从未等待。直到2025年9月，姚薰玉都会在这里。在姚舜宇负责浑源LLM模式并直接向腾讯总裁刘炽平汇报之前，浑源LLM人员处于三明治角色，工作上推或下推都很困难。秦莹莹告诉《新皮质》，张正宇和江杰带队时，混元LLM模式有一个队长，但地位不高。至少需要三层才能到达刘炽平身边。王迪e大模型技术负责人、混源大模型负责人姜杰、TEG总裁卢山。这种结构使得他无法像姚舜宇那样直接与刘志平沟通并获得支持资源。从下级管理的角度来看，团队领导者还需要跨越TEG的多个部门才能接触到项目相关的成员。 Hunyuan 成立于 2023 年，是一个虚拟团队，成员来自各个 AI Lab 和 TEG 部门。秦莹莹告诉《新皮层》，机器学习部、数据平台部等部门是老TEG组织架构的一部分，并非混源团队。调入混元项目的员工也将要进一步解决腾讯各部门和业务的AI需求。 “浑源半年来一直处于混乱之中，责任和权限也没有明确界定。这不被理解。 “张哲也没有直到2025年4月，腾讯才组建了类似字节种子的独立团队，并在TEG体系内成立了大规模的多模态建模和语言建模事业部。12月姚舜宇加盟正式宣布后，腾讯进一步调整组织架构，成立了AI基础设施部、AI数据部、计算平台部。组织架构首次适应了大模型时代的研发需求。多位腾讯招聘人员和员工向《新皮质》表示，腾讯AI实验室正在逐渐弱化，许多成员已经辞职，而AI实验室副主任徐兰也计划在1月底退休，AI实验室目前的重点是进行探索性研究，这意味着AI实验室。腾讯于2016年成立的公司实际上已成为浑源的下属部门，而不是其高层管理机构。据Neocortex获得的消息，随着于冬的辞职，AI Lab的语音和自然语言处理研究部门也将被撤销。剩下的两个方向是多模态理解方向，由 Mr.胡涵，以及由前 Bite Seed 成员领导的多模态理解和生成的统一方向。直到2025年底，混元才成为类似字节种子的组织，而字节也计划在2023年下半年开始类似的组织架构调整。这一迟到但大手笔的调整意味着腾讯已经基本克服了27岁的第一语言模型姚舜宇所面临的障碍。加速论与甜蜜期大规模模型军备竞赛进入第三个年头，落后者追赶的最佳路径d 对领先者的态度非常明确。如果你想快速推出一个符合市场预期的模式，最好是沿着别人走过的成功路径，直接遵循已经被证明有效的成熟实践，而不是在每个角落思考如何通过创新来取得领先。这种成功模式的最好例子就是谷歌。 2025年之前，中国的百度描述的是“早起、晚赶”，Recon Valley则以谷歌为例，谷歌发明了大型基础设施模型Transformer。然而，自 ChatGPT 推出以来，Google 的 Gemini 一直被认为在全球建模竞赛中落后于 OpenAI 的 GPT 和 Anthropic 的 Claude。上述大模型的行业人士告诉 Neocortex，在 Gemini 2.0 发布之前，Google 一直坚持 Encoder+Decoder 架构（注：Encoder + Decoder，是 Google 2017 年发明 Transformer 架构时的原始形式）。当Gemini 1.5重新发布时于 2024 年 2 月租用，其蓝图文件仍然强调了为什么这个架构很棒。然而，随着 2024 年底 Gemini 2.0 的发布，Google 不再宣传 Encoder+Decoder 和 co 架构的潜力，开始采用像 OpenAI 这样的 Decoder-only（注：纯解码器）架构。在偏执地坚持自己的本地架构之后，Google 凭借 2025 年 3 月发布的 Gemini 2.5 迅速回归了行业愿景。11 月发布的 Gemini 3.0 直接将 OpenAI 置于“红色警报”，以应对 Gemini 带来的流量压力。根据 SamelWeb 收集的 11 月份数据，用户在 Gemini 上的平均花费时间已超过 ChatGPT。业内人士告诉New Cortex，DeepSeek于2024年12月和2025年2月推出并开放的V3和R1型号也仅充当GPT解码器。架构曾经扮演的角色：告诉大家GPT-4和OpenAI o1效果类似的架构模型是什么。其中，第e V3 模型是一个“菜谱模型”，可以训练成与 GPT-4 模型等效。我们将为行业提供“PI”。 esto表示，要获得类似的模型效果，模型应该是MoE（混合专家模型）架构而不是密集模型。一个多月后发布的 R1 模型为类似 OpenAI o1 的推理模型提供了“配方”。这表明强化学习可以通过推理步骤对语料库进行模仿学习来直接实现。 “以前，没有人知道 GPT-4 是如何训练的，也不知道 o1 是如何训练的。”据业内人士透露，国内各大模型公司整个2024年的主要目标是“赶上GPT-4”，但目前还不清楚他们将如何做到这一点。从GPT 3.5开始，OpenAI停止在文章中透露其模型的核心架构和算法，甚至停止发布技术报告。 DeepSeek V3和R1模型的发布和开源加速了全球GPT的发布-4 和 OpenAI o1 模型。聘请在OpenAI上直接参与模型后训练并参与其预训练的研究员负责LLM模型，也将是对腾讯混元的加速。 2025年12月初，也就是姚新宇加入腾讯两个月后，腾讯推出总参数4060亿的混元2.0模型。英文名称已更新为HY2.0，看来是着眼全球市场的举措。有人推测，这种图案可能是由于姚舜瑜的出现而造成的。但从业界各代模型的训练周期来看，混元2.0不太可能是姚舜宇从头开始训练的模型。 “模型的参数个数和模型的容量之间存在充要关系。如果参数个数多，模型的性能可能不鲁棒，但如果参数个数少，模型的潜力就很大。”据上述业内人士透露，姚舜宇很可能会用更多的参数来训练模型，预计需要半年以上的时间。但有了“菜谱”和更多的资源，时间可能会进一步缩短。这意味着姚舜宇和腾讯的甜蜜期已经快半年了。这位27岁的年轻经理需要做出一些实际的成绩，才能坐稳腾讯这个11万大公司的大模型第一名。 2025年4月，姚舜宇在个人博客上发表了一篇题为“下半场”的文章，“宣布”大型模型具有足够的推理能力，但接近腾讯混元的消息人士告诉Neocortex，下一个版本的混元将主要是姚舜宇训练的智能体模型（应受访者林峰、徐兰、陈立峰的要求）。文中秦莹莹均为化名勒。记者王杰夫、见习记者李安、小何也对本文有贡献。）73第一财经持续追踪金融热点。如果您有任何关于公司动态、行业动态、财经事件等有价值的线索，我们欢迎您提供。私人邮箱：bianjibu@yicai.com（注：您的线索将经过验证，您的隐私将受到最严格的保密。）
特别提示：以上内容（包括图片、视频，如有）由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注：以上内容（包括图片和视频，如有）由网易号用户上传发布，网易号是一个仅提供信息存储服务的社交媒体平台。

你也可能喜欢

高桥塞米会当选民主自由党的总统吗？您可以消除日本政治的诅咒吗？北京新闻专栏

在季节中，使用淡淡的香气和水合来平静秋天的干燥

索尼本田量产车“AFEELA 1”将亮相CES 2026

DeepSeek玉树华为入选《时代》杂志，但OpenAI未入选

发表评论取消回复

你也可能喜欢

发表评论 取消回复

发表评论取消回复