商报讯(记者 吕文鹃 实习生 陈群壹 沈忱) 1月22日,百度发布并上线原生全模态大模型文心5.0正式版。该模型参数达2.4万亿,采用原生全模态统一建模技术,具备全模态理解与生成能力,支持文本、图像、音频、视频等多种信息的输入与输出。目前,个人用户可在文心APP、文心一言官网体验,企业与开发者可通过百度千帆平台进行调用。在40余项权威基准的综合评测中,文心 5.0 正式版的语言与多模态理解能力超越Gemini-2.5-Pro、GPT-5-High等模型,稳居国际第一梯队。图像与视频生成能力与垂直领域专精模型相当,整体处于全球领先水平。此前,百度文心助手月活已突破2亿。
与业界多数采用“后期融合”的多模态方案不同,文心5.0的技术路线采用统一的自回归架构进行原生全模态建模,将文本、图像、视频、音频等多源数据在同一模型框架中进行联合训练,使得多模态特征在统一架构下充分融合并协同优化,实现原生的全模态统一理解与生成。
百度应用模型研发部负责人贾磊指出,应用模型的价值不在模型里,而在应用里,希望让模型在真实应用场景里“跑得稳、答得对、用得起”。基于文心基础大模型,百度构建了矩阵模型和专精模型。矩阵模型面向产品级应用和通用场景快速落地,包括文心Lite模型、视频大模型和语音大模型;专精模型面向行业应用和垂直场景,包括搜索闪电专精模型、电商蒸汽机模型、文心数字人大模型及行业大模型。在文心Moment大会当天,百度千帆平台产品负责人张婷介绍了千帆专为行业落地打造的Agent Infra,目前千帆平台上已累计开发超130万个Agents,以百度独家能力“百度AI搜索”为代表的工具日均调用量已突破千万次。
基于强大的原生全模态统一建模技术,与2.4万亿参数的海量算力,“文心5.0”已具备让AI应用走进真实行业与复杂场景,提供更高效解决方案的能力。全球AI行业经历过去几年快速发展,正进入一个新的快车道,但在AI应用领域,以对话或文字输入为主的Chatbot仍是主流形式。AI如何应用于真实世界与行业,从而进一步产生价值,是行业都在探索的方向。