在大模型蓬勃发展的推动下,人工智能正牵动着一场覆盖全行业、全领域的科技变革,而开源大模型已在这场变革中树立起不可或缺的地位。革命性的自然语言处理和生成能力赋予了企业和开发者前所未有的机会,构建更智能、更高效的应用和服务。在商业应用、数据分析、教育培训等领域展现出巨大潜力。
8月7日,元象XVERSE公司宣布开源其百亿参数的高性能通用大模型XVERSE-13B,可免费商用。据官方介绍,XVERSE-13B是目前同尺寸中效果最好的多语言大模型,在多项权威的标准中文和英文测评中,性能超越了Llama-2-13B、Baichuan-13B等国内外开源模型代表。
对此,「大模型之家」独家对话元象XVERSE,就开源大模型对企业、行业的价值与影响等多角度带来专业的观点与分析。以开源打造互联网时代主流模式
元象XVERSE向大模型之家表示,XVERSE-13B是完全开源,支持免费商用。企业本意就是为了推动国产大模型开源生态与产业应用的繁荣发展。如果技术发展,能推动生态和产业发展,我们自然能创造更多、更大的价值。
开源性质将促进知识的共享和合作,打破信息孤岛,使知识普惠化成为可能。这将使得知识和技术不再受限于特定的机构或地区,有助于缩小数字鸿沟,提高社会中更多人的数字素养水平。
强大自然语言处理和生成能力将在各个行业和领域产生深远影响。在医疗领域,它可以用于辅助医疗诊断、药物研发等;在金融领域,可以用于智能投资分析、风险评估等;在教育领域,可以推动个性化教育、智能辅导等;在媒体领域,可以改善内容生成和新闻报道。
除此之外,开源大模型还有助于加速科研进展,为研究人员提供更强大的工具,推动各领域的创新。据元象XVERSE介绍,哈尔滨工业大学已经率先使用XVERSE-13B大模型推进相关研究工作。哈工大计算机科学与技术学院张伟男教授表示,“开源是互联网时代主流模式,不仅能贡献社区,推动技术持续创新,还能利用协同解决算法透明性、稳定性、公众信任度等共性问题。”多数据领跑,让AI写作“用事实说话”
XVERSE-13B大模型基于标准Transformer结构,在1.4万亿高质量、多样化tokens的训练数据上,从零训练(train from scatch)了130亿参数大模型,支持40多种语言,上下文窗口大小为8192。
1.4万亿tokens为XVERSE-13B带来了更丰富和多样化的语言知识,能够处理更复杂和多变的自然语言任务。8192的上下文窗口大小,说明模型能够捕捉到更长距离的语义关系,但也需要更多的计算资源。
元象XVERSE向大模型之家介绍:“训练XVERSE-13B我们使用的是千卡算力,网络采用ROCE(RDMA over Converged Ethernet)是一种基于以太网的RDMA(Remote Direct Memory Access)协议,单机规格1.6Tbps。提升推理速度和效果是我们正在探索的工作,也是后续的优化方向。”
除此之外,大模型之家注意到在XVERSE-13B的测评过程中选择了AGIEval、GAOKAO-Bench等评测方法进行测试,这些评测方法主要为围绕一些国内外专业的官方入学和职业资格考试。
在回答“当面对非官方中文语言理解和逻辑推理时将如何避免XVERSE-13B回答出现‘幻觉’?”的问题时,对此元象XVERSE表示:好的团队基因是大模型获得良好的效果的重要原因。元象在2021年成立时就有完整的AI技术与人才布局。目前大模型团队有多位来自腾讯、百度和IDEA研究院等机构的技术专家,在NLP和搜索领域有深厚技术积累,对语言数据和高质量语料理解深入,在快速迭代模型方面经验丰富。
为了避免回答出现幻觉,元象采用了多样化且准确的数据进行训练,让模型尽可能地多学习。从拟人的角度看,其实人有时候也会出现“空耳”以及理解偏差的情况,但元象会努力让模型避免此类问题。从2022年开始,公司就针对“基于动态知识引入的事实一致性对话生成”这一关键核心课题进行深入研究,希望在结合上下文与背景信息时,减少与事实不符或错误背景描述的情况,让AI实现从写作“自然流畅”到“用事实说话”的技术跨越。深度结合自身业务,以AI驱动“端云协同”3D互动技术
元象作为国内领先的AI与元宇宙技术服务公司,致力于打造AI驱动的3D内容生产与消费一站式平台,通过大模型赋能自身业务将成为公司未来发展的重要方向。元象表示:XVERSE-13B是一个通用大模型,能与任何有需要的行业和业务结合,企业认为它在医疗、教育、文旅、金融和娱乐等行业将具有更大的发展前景。
除此之外,大模型也可能会对高智能数字人、未来人机交互带来颠覆性影响,这些是元宇宙内容的重要组成部分,XVERSE-13B也将提供强大技术后盾。
基于强大的语言理解和生成能力,以及结合元象原有的3D图形能力、语音技术能力,XVERSE-13B可以为高智能数字人提供更加丰富和多样化的内容来源和表现形式,使得高智能数字人更加逼真和智能。同时,由于大模型可以支持多种语言和任务,并且可以根据用户输入或反馈进行自适应调整,它们可以为未来人机交互提供更加灵活和个性化的交互方式,使得未来人机交互更加自然和流畅。
元象XVERSE创始人姚星表示:“真实世界的感知智能(3D),与真实世界的认知智能(AI),是探索通用人工智能(AGI)的必由之路,也是元象持续探索3D与AI前沿技术的动力。”作为“端云协同”3D互动技术的引领者,元象通过自研引擎和前沿AI算法驱动,为用户打造全新元宇宙体验,助⼒各⾏业3D化,实现自由「定义你的世界」愿景。
在《人工智能大模型产业创新价值研究报告》中指出:大模型产业价值的关键,在于降低人工智能的使用门槛,将其特征与能力与各种场景结合,以实现场景效率的提升。开源大模型可以通过大规模的数据和参数,学习到更多的语言和知识,从而提高人工智能的通用性和泛化能力。同时,通过预训练和微调的机制,简化人工智能的开发流程,降低人工智能的技术门槛和成本。
正如元象XVERSE所述,XVERSE-13B已基本实现国产可替代,公司也期待为国产大模型发展贡献一份力量。开源大模型本意还是让更多的开发者、用户可以直接部署和使用,推动生态和产业的发展为主。同时企业也支持在许可范围内,开发者对XVERSE-13B 修改得到模型衍生品,对于模型衍生品中付出创造性劳动的部分,开发者可以主张该部分的知识产权。
大模型之家认为开源大模型为社会的可持续发展提供了丰富的资源和可能性,作为人类共同智慧的桥梁,开源大模型将为社会创造更加智能、包容和进步的未来,引领我们迈向一个全球化、数字化的智慧文明时代。