11月21日,百度公司正式发布了2023年第三季度财务报告。数据显示,本季度百度营收达344.47亿元,归属于百度的净利润(non-GAAP)达73亿元,同比增长23%,营收和利润均超出市场预期。
百度创始人、董事长兼首席执行官李彦宏表示:“在生成式AI和基础模型的新兴机遇背景下,百度不断强化技术、改进产品,特别是推出了文心大模型4.0,这是百度最强大的基础模型。我们还利用文心大模型和文心一言的能力,重构了消费级、企业级产品及自身运营,在带来AI原生体验的同时,不断提升效率。”
正如李彦宏所言:“百度坚持以人工智能为核心的业务和产品战略,为文心大模型和文心一言生态在未来多年的收入保持和利润扩张奠定基础。”在文心大模型对文心的赋能之下,百度在第三季度AI原生应用数据指标显著增长:API调用量呈指数级增长,百度AI原生应用的用户粘性和活跃度也在快速攀升,带动用户量、在线时长与付费率的多重提升。
大模型的火热,让一直聚焦于人工智能技术的百度来到了时代舞台的中心。作为国内人工智能领域的领先者,百度将如何把握大模型的发展,为行业作出示范,不仅是关乎自身发展,甚至也是影像国内人工智能行业整体发展方向的课题。
文心大模型能力全面提升,夯实技术基座
今年以来,随着生成式AI大潮的袭来,也为百度文心大模型的迭代按下了“加速键”。
自2019年3月最初的文心大模型1.0版,经过四年的技术深耕和研发迭代,如今文心大模型已经迭代到了4.0版,这是目前最强大的文心大模型,实现了基础模型的全面升级,在理解、生成、逻辑和记忆能力上都有着显著提升,形成了基础-任务-行业三级大模型技术体系,具备了知识增强和产业级两大特色。
在过去的8个月里,基于飞桨深度学习平台和万卡集群进行训练,利用多端多阶段对齐和可循环训练技术,实现了从海量数据和知识中融合学习,提升了模型的泛化能力和知识表达能力。从3月份文心一言发布至今,文心大模型4.0的训练算法效率提升了3.6倍,周均训练有效率超过98%,推理性能提升了50倍。
在先人一步的技术投入之下,文心大模型的“技术飞轮”已经初显成效,在多个评测和应用场景中展现出了优异的性能,并在刚刚闭幕的世界互联网大会上,包揽了“世界互联网大会领先科技奖”的荣誉。
霸榜之后,文心大模型走入“生态时代”
如果将大模型行业的众多榜单看作学业中的“成绩单”,那么百度文心大模型无疑是其中的佼佼者。然而,技术的突破只是开始,将这些“本领”转化为实际价值,走向产业化道路才是关键。
自2022年底ChatGPT出现以来,国内大模型数量迅猛增长,达到了惊人的238个,而且几乎个个在榜单之中“拳打GPT、脚踢Llama2”。然而,在大模型热衷于“刷榜”的另外一面,有一个问题不容忽视:这些大模型能为产业带来怎样的实际价值?遗憾的是,很多模型仍然停留在“纸上谈兵”的阶段。
对于大模型来说,过度关注榜单成绩可能会导致其与实际应用脱节,让大模型成为脱离实践的“做题家”,造成在实际应用中出现“一本正经地胡说八道”的幻觉问题。根据复旦大学联合上海人工智能实验室构建了大模型幻觉评估数据集HalluQA对业界主流的24个大模型进行了大模型幻觉评估中,结果仅有6个大模型取得了高于50%的无幻觉率,仅占所有参测模型的1/4。
其中,百度文心一言在评测中以69.33%的无幻觉率成为榜单中的第一名。更高的大模型“无幻觉率”,意味着文心大模型应用于产业中能够带来可靠性,为大模型全面走向产业化应用扫清了阻碍。除了文心本身强大的模型基础能力与检索增强之外,对于行业真实场景经验的积累,也成为了文心大模型能够脱颖而出的重点。
可见,百度在构建文心大模型之初,就已经明确了走向产业化的目标。因此,在大模型时代来临之际,百度凭借先发优势,在其他企业还在发力大模型研发时,率先将大模型开辟到了“生态”战场,寻找大模型的“场景飞轮”。
在大模型场景探索上,百度也一直走在行业的前列。自8月31日向全社会开放以来,文心一言用户规模迅速达到了7000万,涵盖了4300个场景和2492个应用。其最大的用户群体是一线、超一线城市的中青年打工人,占比最高的两大行业是IT互联网和教育,最高频的三大使用场景是知识问答、文本创作和代码能力,文心一言流畅的交互体验,以及丰富的知识积累,成为了解决工作与生活难题的得力助手。
在百度世界2023上,百度宣布与中国游泳协会达成战略合作,文心一言成为“中国国家跳水队人工智能合作伙伴”,为跳水运动员提供AI辅助训练系统,帮助他们精雕每招每式,完美完成每一跳。在文化和旅游部公布的2023年文化和旅游数字化创新示范十佳案例中,百度文心大模型创新文化产品生产方式入选十佳案例,也是唯一一个入选的大模型应用案例,展现了文心大模型在文化领域的创新和贡献。
AI原生应用正当时,生态普惠构筑场景飞轮
大模型的出现,将引领产业进入以人工智能为标志的第四次革命。⽬前正处于由⽣成式AI和基础模型驱动的变革中,将彻底重构每⼀个⾏业。可以说,未来大模型会成为一种企业都要使用的资源,每家企业都需要在AI时代,利用大模型将自身的业务进行重构以提升生产力,早已成为行业共识。
然而,大模型研发的经济和技术成本太高,“重复造轮子”不仅造成了社会资源的极大浪费,也因为技术门槛和成本门槛过高,使得多数通用大模型难以达到预期效果。
对此,李彦宏率先指出:“AI原生时代,我们需要100万量级的AI原生应用,但是不需要100个大模型。”而基于成熟的大模型为底座,只有构建起一个繁荣的AI生态,才能推动新一轮的经济增长,从而带来巨大的商业价值。
所谓AI原生应用,是指在设计、开发、部署、运营和维护过程中,具有内在安全、可信的AI能力应用,其中AI是功能的自然组成部分。大模型和AI原生应用,像移动互联网时代的操作系统和App一样相辅相成,然而AI带来的效率革命,将引导应用市场即将迎来大洗牌。
为了给行业作出示范,让更多的企业投入到AI原生应用生态的打造,李彦宏更是明确提出:“百度要做第一个把所有产品都进行重构的公司,我们要用AI思维,做出AI原生应用。”这一战略决策为大模型走向产业化铺设了坚实道路。
与其他仍在发力大模型研发的企业相比,百度率先在上个月的百度世界大会上,推出基于文心大模型4.0的“AI原生应用”家族,如文心一言、新搜索、新文库等。这些应用不仅在用户量和使用时长上实现全面增长,还展现了全新的商业化路径。以新搜索为例,通过“极致满足”提高用户满意度和粘性,借助“推荐激发”激发新需求,并利用“多轮互动”实现商业变现,新搜索为百度带来了可观的收入增量。百度如流作为新一代智能工作平台,以知识管理为核心,构建AI时代工作流水线,为企业提高效率和创新提供支持。如流超级助理通过自然语言交互方式,实现了办公场景的智能化。
在成功案例的“自证”之下,也让企业更倾向选择调用文心大模型开发自己的AI原生应用,目前文心大模型的调用量超其他200家之和,插件、API数据等也在激增。
随着AI原生应用时代的到来,大模型已经成为了推动产业智能化升级的核心引擎。在电商、医疗健康、金融等多个领域,大模型助力企业实现更高效、精准的决策与服务。这无疑为企业带来了巨大的商业价值。
可以预见的是,在全行业都在追求“降本增效”的背景之下,谁也不甘成为智能化革命的淘汰者,企业对于AI原生应用的需求将呈现井喷增长。
针对企业大模型落地的五大需求,百度智能云千帆以“大模型超级工厂”的理念,不仅为客户提供了极致高效和性价比的异构算力服务,同时提供国内外主流模型和高质量数据集,并基于“千帆AI原生应用开发工作台”,将开发大模型应用的常见模式、工具、流程封装成一个工作台,为开发者提供便捷的开发环境。针对企业对成熟AI原生应用的选购需求,百度智能云推出了国内首个AI原生应用商店——百度智能云千帆AI原生应用商店,为企业客户提供一站式交易通路,大幅提升客户应用选型与采购效率。目前,在百度智能云千帆大模型平台上,已经为超过20000家企业提供开发产业模型和解决方案。
在企业AI原生应用旺盛需求的背景下,AI原生能力或将开辟云服务赛道新的“游戏规则”,依托“云智一体”生态建设的深入,不仅能够为百度带来新客户线索,驱动百度云业务的持续增长与创新,也为伙伴商家创造更多商机,深入产业,实现生态繁荣,AI普惠。
写在最后
从能力到生态的比拼,并不是大模型赛场从“上半场”到“下半场”的切换,而更像是一场没有终点的长跑。在这个比拼中,大模型的能力只是起点,而生态的建设则是决定谁能在这场长跑中持续领先的关键。
百度并没有止步于“技术飞轮”,而是通过不断汇聚客户与用户的反馈,努力寻找发展的“场景飞轮”,进一步实现技术的价值。无论是在AI原生应用的开发领域,还是在底座大模型的研发领域,百度都展现出了行业前列的实力和水平。
大模型之家认为,随着更多大模型开始将重心转移到产业价值之上,未来一定会有更多富有创意和价值的AI原生应用涌现出来,推动AI原生应用的进一步发展和丰富,迎来一个更加开放、包容、创新的AI应用生态的时代。