Bye Siri ! 大模型能做的可不止是聊天机器人

在众多人工智能大模型发布会上，自然语言处理（NLP）能力一直是各大科技厂商着重展示的要点之一，事实上，早在四年前行业内的就已经围绕这颗人工智能“皇冠上的明珠”展开过激烈的讨论……

彼时的人工智能还没有今日的火热，很多人对自然语言处理（NLP）的理解还停留在“Hi，Siri”和“小度小度”等智能对话机器人。能否实现与人流利对话也成为了人们判断人工智能能力的一大重要手段。随着ChatGPT、文心一言、360智脑等众多大模型纷纷问世，让大语言模型成为了人们关注的焦点，也让人工智能的认识更加深入和全面。

大语言模型是聊天机器人吗？

在大模型未出现时，聊天机器人的自然语言处理仅停留在对固定问题的固定回答上，甚至换一种问法都很难得到答案，甚至一些“智能语音客服”至今也只能听懂一些预设问题，哪怕面对稍有变化的指令或问题，都很难为用户提供被需要的解救办法。

而具有大模型加持的聊天机器人在面对多样化的问题已经可以通过总结自身数据库中的数据为使用者生成答案。有业内人士对大模型之家表示，LLM当然不等价于Chatbot，不过现在的LLM很多都是用Chat数据指令调谐过的，Chat版本的LLM更适合用来构建Chatbot，技术上不能划等号。

聊天机器人是一种能够与人进行自然对话的系统，通常需要利用大语言模型来生成回复。为了让大语言模型更适合用于聊天机器人，可以在聊天数据上进行额外的训练，使其学习到更多的对话技巧和知识。因此，虽然大语言模型和聊天机器人有一定的关联，但它们在技术上是不同的概念。

无界AI联合创始人马千里对大模型之家表示，聊天机器人是语言大模型的众多功能或应用之一。语言大模型不应局限于聊天这一狭隘的场景。大模型不仅能够实现自然语言处理，还能通过各种插件功能，为使用者提供计算、文档总结、工作相关问题解答等服务。

大模型之家认为，大语言模型和聊天机器人的不同概念源自于不同的目标、评价指标、数据类型、数据规模、用户和场景。聊天机器人只是大语言模型的一个功能或应用，而不是它的本质。大模型的存在除了应用在自然语言处理方面，更重要的是体现在生产中的意义，大语言模型还有很多其他的功能或应用，比如音视频生成、金融、法律咨询等，这些都体现了大语言模型的能力和潜力。也是大语言模型商业化的重要方向。

大语言模型表现良莠不齐，根源在哪儿？

在大多数大模型发布会上，自然语言处理能力仍是被着重展示的部分，而对于使用者来说，聊天能力确实是判断大模型强大与否的重要指标之一。事实上大语言模型的表现并未像市场中吹捧的那般天花乱坠。360集团创始人周鸿祎也于近期表示，谁能解决大模型“幻觉”问题，就相当于摘下了“皇冠上的明珠”。

很多人认为市场上大模型对话能力的参差不齐与大模型研发的技术水平有着直接关系，在繁多的技术当中，数据的质量是影响大模型表现的关键技术因素，它决定了模型能否有效地学习和生成文本。数据质量需要从数据的正确性、有效性、丰富性和代表性等方面来提高。这需要经过数据清洗、标注、过滤和多样化等方法，保证数据没有错误或者矛盾，去除低质量和垃圾数据，涵盖不同的主题、领域、风格和观点。提高数据质量是影响大模型表现的关键技术因素，也是未来文本生成领域的重要研究方向。

行业领先人工智能企业「行者AI」对大模型之家表示：虽然如今大语言模型参数规模越来越大，涌现出的能力也越来越强，但它归根结底仍然是一种概率统计模型，因此理论上来说，即使是目前最好的模型，仍然有一定概率输出不佳的结果，只是这种概率较小而已。
而具体从技术上来说，大语言模型表现好坏受众多因素影响，其一是训练数据的质量和数量，模型本质上是以训练数据为老师进行学习，数据的质量和数量直接决定模型的上限，数据质量在某些方面的参差不齐可能会导致模型回答时有好有坏；其二是模型的架构和训练策略，训练模型时选择的不同模型架构和训练策略会导致最终得到的模型性能有所差异。

当然，除技术之外，无界AI联合创始人马千里认为，大模型表现的好坏，人的“问题”也占很大一部分。他指出，大语言模型的效果同样受到提问者输入的影响。使用者需要输入一个恰当的提示语后再提出问题。而问题的形式和方式会决定模型的回答质量，因此不同的使用者可能获得不同的体验。其次，模型本身也在持续更新和优化。由于部署在云端，为了保证安全性，它增加了对敏感内容的审核机制，如果使用者询问一些涉及危险信息的问题，大模型可能不会给出回答。

同时，大模型的本质神经网络生成内容的过程，数据、参数以及算法都具有一定的随机性，能提高大模型的泛化能力和创造力，但也会导致大模型的不稳定和不可预测。因此，使用者需要根据不同的数据和任务，选择合适的随机操作和超参数，以及监控和评估大模型的表现。

在《人工智能大模型产业创新价值研究报告》中，大模型之家认为，大模型将引发数据的革命。数据的质量以及数据清洗的工程化能力会显著拉开大模型预训练阶段的效果差距将成为决胜关键因素。同时大模型的发展将为数据相关产业和行业带来多重机遇，包括数据分析和洞察力，数据清洗和预处理，数据驱动的创新，数据安全和隐私保护以及数据驱动的行业转型等。

大模型是一种技术，也是一种趋势。决定大模型表现的也不止需要对数据质量进行把控，模型可解释性、安全性、创新性甚至使用者的操作都是必要考虑关键因素。除了聊天机器人，大模型能够在不同的领域和任务中表现出优秀的通用性和创造性，例如自然语言生成、图像识别、语音合成等。此外，大模型的训练和应用也依赖于高效的硬件和软件支持，例如GPU、TPU等处理器，以及分布式并行的平台和方法。

Bye Siri ! 大模型能做的可不止是聊天机器人

大语言模型是聊天机器人吗？

大语言模型表现良莠不齐，根源在哪儿？

相关推荐

发表评论