腾讯的大模型“成品”终于来了_聚焦

今年6月，在2023腾讯股东大会上，当被问及大模型进展时，马化腾曾说，“我们一样在埋头研发，但是并不急于早早做完，把半成品拿出来展示。”

如今虽迟但到，鹅厂终于也推出了自己的通用大模型。9月7日，腾讯在一年一度的全球数字生态大会上，正式“亮相”了自己的混元大模型。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生介绍：混元大模型通过腾讯云对外开放，并已接入了腾讯广告、游戏、金融科技、腾讯会议、微信搜一搜等产品。

(资料图片)

汤道生表示，该大模型产品是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预训练语料超2万亿tokens，将作为腾讯云MaaS服务的底座，支持API直接调用，以及专属大模型产品应用构建。

如今一个普遍行业共识是：大模型正在改变云生态。它有可能成为互联网云厂商在价格战之外谋求份额增长的新动力，并为云计算行业带来全新的变革契机。

而在今年以来，腾讯云在公有云业务（IaaS+PaaS）市场份额下降的现实基础上，抓住此次时机，也显得尤为重要。腾讯云总裁邱跃鹏也在会上表示：“云是大模型的最佳载体，大模型将开创下一代云服务的全新形态。”

为何腾讯姗姗来迟

据赛迪顾问数据显示，截至 2023 年 7 月，中国累计已经有130个大模型问世。

今年上半年，在百度、阿里等一众大厂争发大模型之时，“不赶风头”的鹅厂，显得较为谨慎。不过相较于各家大厂普遍踏足的通用大模型，腾讯从一开始就把大模型重心引向了B端应用。

6月19日，腾讯云首次公布了行业大模型进度，发布了TO B客户解决方案：腾讯云MaaS（Model-as-a-Service，模型即服务），覆盖了金融、文旅、政务、传媒、教育等10大行业的多个模型，并提供了超过50个解决方案。

那时，行业和客户已经有很多关于大模型的需求。在经历几个月的在腾讯文档、会议等应用磨练后，腾讯才终于有信心把大模型开放出来，服务更多企业。

▲图注：腾讯集团副总裁蒋杰

据腾讯副总裁蒋杰介绍，彼时，已经收到了很多客户需求询问，但还没有对模型进行全面深度的评测，处于半研发半应用的阶段。

“腾讯的混元的大模型的体系，一开始不光是为了业界做一个发布，甚至评测、去打榜，我们一开始就是根据腾讯企业自己的自身的应用，去做了一个这样的研发和匹配，去做一些跟大模型更深度结合的应用，才能够去抵消整个大模型高昂的设备、训练、人员的成本。”蒋杰说。

早在2022年4月，腾讯首次对外披露了旗下“混元”AI大模型的研发进展，完整覆盖了NLP（自然语言处理）、CV（计算机视觉）、多模态等基础模型和众多行业模型。但类chat大语言模型则是迟迟未推出。

事实上，过早地推出大模型，也容易“翻车”，出现“幻觉”。

所谓“幻觉”，简单说就是大模型“胡言乱语”。为了确保大模型更加可靠，降低“幻觉率”是大语言模型的重中之重，即便不能彻底解决，但也尽力从概率上降到最低。

据介绍，腾讯混元的“幻觉率”相比主流开源大模型可降低30%至50%，用的是自研的“探真”技术来解决“幻觉”。

“外界其实一般多会用到知识图谱，甚至搜索外挂来让模型的检索支持能力变得更强，腾讯也会用，但不能用的比例很高。我们一定要在整个的大模型的预训练阶段把这个问题解决掉，控制掉。现在看到很多家开源模型和厂家发布的模型，搜索增强用到10%以上甚至更多，但这个会导致出现不一样的幻觉。”蒋杰说。

终局还是云之战

如今，大模型与To B的结合，已经越来越成为行业共识。在国内大模型之战打到焦灼之时，最近OpenAI 也推出了ChatGPT企业版，开始探索To B市场。

根据第三方网站 SimilarWeb 的监测数据，今年7 月，OpenAI 网站与移动客户端流量月环比下降了10.35%。8月中旬，市场调查分析机构 Gartner 也在发布的生成式 AI 炒作周期报告中指出，当前大模型发展已达到“膨胀预期峰值”，在未来的两到五年内，要么实现转型，要么跌入幻灭的低谷。

当下，前有ChatGPT企业板，后有开源的Llama2（Meta 的大语言模型），整个大模型行业门槛降低，市场则陷入了营收难的境地。

云厂商们也开始意识到，相较于难以预见的大模型商业化落地前景，云作为最前端可以售卖的 To B产品，更容易尽早赚钱。大模型的发展需要依靠算力、算法和数据的支持，这都需要云计算应用场景。也就是说，大模型之战的最终落地，还是要抢夺公有云市场。

而今年以来，随着个人、中小企业用户使用量减少，增速放缓，加之“政务云”的崛起，阿里云和腾讯云的市场份额均有所减少。

从资源利用率以及趋势来看，私有云难以成大势，公有云依然是主流市场。

根据中国信通院最新发布的《云计算白皮书（2023年）》，2022 年IaaS 市场收入稳定，规模在2442亿元，是PaaS+SaaS的3倍，依然占据主导地位。

IaaS靠规模效应赚钱，但投入过程长。但在激烈竞争下，产品同质化严重，云厂商不得已通过价格战来抢占市场。今年4月，新一波的降价潮开启，先是阿里云带头降价，京东云、腾讯云、华为云、天翼云等紧随其后。

IaaS 业务的高度雷同，低价策略难以可持续发展，腾讯云也开始探索不同的路线。PaaS、SaaS业务虽然体量小，但毛利率更高。但这两块业务投入大，腾讯云仍处于艰难的“爬坡”时期。

也因此，腾讯推出大模型，以提效为第一要义。“大语言模型更有商业永远价值的应该是提效，提效是更有价值的。”

蒋杰提到，腾讯是一个海量高并发的业务。“开源的很多的架构是不适应腾讯的体量，所以一定要走出一套基于自主体系的研发的道路，才能够去应对这些海量高并发的业务的冲击。”

大模型之战的同质化，让大厂间的竞争身位也难分轩轾。

蒋杰提到，如果未来对大语言模型进行评分，是一个综合实力的过程，“可能未来几个大的头部的厂家，评分差距只可能仅仅1分和2分的差距。这个版本他高了1分，下一个版本另外一个国内厂家就是再高了一两分，这是一个不断博弈和循序渐进的过程。所以其实随着大家投入这种资源不一样，抠的细节不一样，到最后这个差异才会出来。”

作者 | 赵子坤

编辑 | 李原

运营 | 解一帆