腾讯元宝多模态能力商业化进展分析
解锁更多功能
登录后即可使用AI智能分析、深度投研报告等高级功能
关于我们:Ginlix AI 是由真实数据驱动的 AI 投资助手,将先进的人工智能与专业金融数据库相结合,提供可验证的、基于事实的答案。请使用下方的聊天框提出任何金融问题。
相关个股
腾讯混元大模型的多模态能力是元宝产品商业化的核心技术支撑。2025年9月,腾讯开源了混元3D生成模型家族的两个新成员——混元3D-Omni和混元3D-Part,这两个模型均开源推理代码和权重,旨在加速3D生成在AR/VR等领域的实际应用[1]。2026年1月28日,腾讯混元团队宣布开源混元图像3.0图生图版本(HunyuanImage 3.0-Instruct),该模型基于800亿参数的混合专家架构,在全球权威大模型竞技场LMArena的图像编辑(Image Edit)榜单中进入第一梯队,成为全球最强的开源图生图模型[2]。
混元图像3.0支持多种图片编辑功能,包括增删改、风格变换、老照片修复、人物与文字修改等,此外还具备多图融合能力,能够将多张照片中的元素提取并合成新图。其原生的多模态架构使得模型在文本理解、视觉理解与图像生成上深度融合,提升了对用户指令的理解和生成效果[2]。腾讯混元团队一直在持续迭代通用基础能力和专业应用能力,研发了多种尺寸语言模型,以及图像、视频、3D等完整多模态生成模型和工具集插件[3]。
腾讯推出的HunyyuanOCR模型采用颠覆性的端到端设计思路,仅用1B参数,却能在身份证、发票、营业执照等复杂文档上实现接近人工校验的准确率,甚至能自动判断证件正反面、合并字段、输出结构化数据[4]。在任务切换机制方面,通过提示工程(Prompt Engineering),同一个模型可以灵活应对不同需求,无需更换模型权重,也无需重新训练,真正实现了"一模型通吃全场景"[4]。
腾讯元宝作为腾讯基于混元大模型的AI产品,已形成完整的C端多模态功能矩阵[5]:
- AI搜索功能:通过强大的模型和搜索能力获取精准答案,支持搜答案、搜资料、搜灵感
- AI解析功能:支持多类型文件和图片识别,用户可上传文件快速获取要点和信息总结
- AI写作功能:具备强大的语言理解和输出能力,支持报告、方案、代码等写作
- AI图片编辑增强:丰富创意风格随心换,一句话实现轻松P图
- 拍题答疑功能:多学科覆盖解题更专业
- AI头像功能:提供超多模板,免费玩不限次数
- 口语陪练功能:提供1V1在线教学,满足考学、出游等场景需求
- 超能翻译功能:提供多语言在线翻译,准确快速
2025年,腾讯完成了从"技术试验田"向"AI应用先锋"的战略转型。最关键的一步是元宝团队从TEG技术工程事业部转入CSIG云与智慧产业事业群,使元宝彻底摆脱了技术研发的孤岛状态,成为连接腾讯生态的智能中枢[6]。目前,元宝的AI能力已全面接入QQ音乐、腾讯会议、微信公众号及视频号评论区等数十款核心产品,覆盖社交、办公、内容消费等高频场景[6]。
2026年1月26日,腾讯元宝开启名为"元宝派"的社交AI功能内测,标志着大模型竞争进入下半场[7]。"元宝派"实质上将微信的社交能力、腾讯会议的协同工具以及AI大模型的核心能力融合为一体,打造了一款定位独特的全新产品[8]。该功能已深度打通微信与QQ的社交链路,用户可将生成的"派号"或专属邀请链接直接分享至微信朋友圈或微信、QQ好友,好友点击即可一键加入[8]。
根据研究机构QuestMobile于2025年12月23日发布的报告,在2025年12月8日至14日的统计周期内,通用AI助手"豆包"的周活跃用户规模达到1.55亿,位列市场首位;DeepSeek以8156万的周活跃用户排名第二;腾讯"元宝"以2084万位居第三[9]。截至2025年11月,腾讯元宝月活跃用户(MAU)达到3768万[10]。艾媒咨询统计显示,截至2025年10月,腾讯元宝在移动互联网的月独立设备数为6826万台[11]。
2026年1月25日,腾讯宣布将在2月1日开启新春活动,分10亿现金红包邀请用户体验元宝App[12]。马化腾在公司2025年度员工大会上表示,希望这次元宝10亿春节红包活动,重现当年微信红包的盛况[13]。单个红包金额可达万元,用户需通过完成AI任务、观看视频、猜口令等方式参与[14]。这不再是简单的节日营销,而是一场赤裸裸的用户争夺战[14]。
腾讯升级了大模型研发架构,新成立AI Infra部、AI Data部等核心部门,并引入前OpenAI高级研究员姚顺雨担任首席AI科学家[6]。同时,腾讯混元引入清华强将庞天宇,持续加强多模态领域的研发实力[3]。
目前混元系列大模型已在腾讯内部多个业务、外部多个行业和开源社区中被广泛接入。截至目前,腾讯混元的图像、视频衍生模型数量总数达到3000个,视频模型社区下载量超过500万,混元3D系列模型社区下载量超过300万[3]。2025年12月,腾讯混元开源了HY-MT1.5-1.8B——一款参数量仅为18亿的轻量级多语神经翻译模型,却实现了"手机端1GB内存可跑、平均延迟0.18秒、翻译质量媲美千亿级大模型"的技术突破,更重要的是它原生支持藏语、维吾尔语、蒙古语、彝语和粤语(作为方言代表)的翻译任务[15]。
腾讯的AI战略已形成"混元大模型为基,元宝为核,全生态渗透"的布局[6]。混元大模型2.0版本的MoE架构实现了推理效率的突破,为所有AI能力提供底层支撑;元宝则以日均更新一个版本的高频迭代快速打磨体验,用户规模跃居国内AI应用前三[6]。马化腾表示,2025年是AI大年,腾讯唯一花钱投入比较多的就是AI,未来腾讯将把大模型和AI产品以一体化的方式来考虑[13]。
对于腾讯而言,这种"寄生式"的生态打法是无奈,更是其最大优势。相比其他厂商从零开始打造AI入口,腾讯手握微信、QQ的12亿月活用户,无需重新搭建流量池,只需让AI能力无感嵌入现有生态,就能实现低成本的用户触达[6]。此次内测的"元宝派"则是腾讯将社交基因发挥到极致的尝试,试图将AI从冰冷的工具变成可分享、可协作的社交空间[16]。
[1] 映维网 - 腾讯开源混元3D-Omni和混元3D-Part (https://news.nweon.com/132855)
[2] 搜狐 - 腾讯混元开源800亿参数图生图模型 (https://www.sohu.com/a/981062783_121885030)
[3] 腾讯网 - 腾讯AI加速:混元引入清华强将庞天宇 (https://new.qq.com/rain/a/20260130A05PMG00)
[4] CSDN博客 - 腾讯混元OCR实战案例分享 (https://blog.csdn.net/weixin_42376614/article/details/156542934)
[5] 脚本之家 - 腾讯元宝app下载 (https://www.jb51.net/softs/938943.html)
[6] 搜狐 - 腾讯春晚10亿红包砸AI:社交王者的破局 (https://www.sohu.com/a/980958618_250147)
[7] 新浪网 - 马化腾春节将发10亿现金 (https://k.sina.com.cn/article_5952915705_162d248f906702fi9q.html)
[8] 腾讯网 - 腾讯正式推出社交AI功能"元宝派" (https://new.qq.com/rain/a/20260127A01TT800)
[9] 腾讯网 - 腾讯元宝,AI版微信 (https://new.qq.com/rain/a/20260126A06ZJ600)
[10] 中国经济网 - 为了挡住豆包,腾讯撒出10亿红包 (http://www.ce.cn/xwzx/gnsz/gdxw/202601/t20260129_2736853.shtml)
[11] 搜狐 - 发红包、加社交,腾讯重构AI的1000天 (https://www.sohu.com/a/980637641_116132)
[12] 搜狐 - 红包大战烧向大模型应用 (http://www.sohu.com/a/981067026_115565)
[13] 新浪网 - 元宝、派发15亿春节红包 (https://k.sina.com.cn/article_7857201856_1d45362c001901udwm.html)
[14] 搜狐 - 15亿红包背后,是腾讯百度的AI焦虑 (https://www.sohu.com/a/980859410_455789)
[15] CSDN博客 - 腾讯混元HY-MT1.5-1.8B:轻量模型的商业应用价值 (https://blog.csdn.net/weixin_32921023/article/details/157164759)
[16] 搜狐 - 腾讯春晚10亿红包砸AI:社交王者的破局 (https://www.sohu.com/a/980960285_211762)
数据基于历史,不代表未来趋势;仅供投资者参考,不构成投资建议
关于我们:Ginlix AI 是由真实数据驱动的 AI 投资助手,将先进的人工智能与专业金融数据库相结合,提供可验证的、基于事实的答案。请使用下方的聊天框提出任何金融问题。