600字范文 > 大语言模型带来的一些启发

大语言模型带来的一些启发

时间：2021-07-10 02:25:10

相关推荐

大语言模型带来的一些启发

仅代表个人看法，不喜勿喷。

The limits of my language means the limits of my world. (Ludwig Wittgenstein)
我的语言的极限意味着我的世界的极限。——维特根斯坦

大语言模型解决的不仅是处理文本相关问题，它带来的是人对世界的理解，或者说让机器可以直接理解人的意图，而不再需要翻译成指邻、代码，而语言本身又隐含了人对世界的理解。从这个角度看，自然语言模型引领AI时代的进步也就不足为奇了。

十年前说这个，可能觉得很科幻吧；三年前，当看到GPT-3生成的驴唇不对马嘴的文章和回答，也只当是个炒作的噱头，一笑了之；最近两个月发布的AI进展真称得上是日新月异了，在这一刻，当ChatGPT仅两个月就月活过亿，那只能说，你可以不变，但阻止不了世界改变。

过分拟合人的想法是对真实世界的扭曲

图片来自 GPT-4 论文[1]，对比了预训练模型和使用强化学习调优后模型预测的分布。可以看到，没调前（左图）和真实分布基本是一致的：世界是什么样，模型就学成了什么样；学习调优反而不一致了。强化学习的目标是让AI的回答更符合人的提问意图，以及去除毒性（数据中的偏见、攻击性）。

数据也是人生成的，也有鸡汤，也有漫骂，所以…… 当有一天，我们看到世界的全貌，会怎么样？

你想要的答案到底是什么

探讨来自谷歌初探讨聊天机器人的论文LaMDA[2]，论文从三方面评估聊天机器人的回答质量：

sensibleness：文本是否合理，跟历史对话是否有冲突（靠谱）

瞎编乱造，前后矛盾肯定是不行的，回答最好还能有理有据。Specificity：对于提问是否有针对性，避免笼统回复（有用）

比如你问AI，这电影怎么样？它回答“不错”，这就等于没说，你需要告诉好在哪。Interestingness：文本是否能引起人的注意或者好奇，是否是超出期待的巧妙回复（有趣）

最好还能带来启发，满足情绪上的一些需求。

（三者权重不同）

从某个角度上讲，这也是我们对人的期许，逐层渐进。是不是觉得有点像：找男朋友的筛选标准？

多闻和推理需要不同的训练途径

实验来自DeepMind（发明AlphaGo的公司）在12月发布的一篇论文：Gopher[3]

任何学术科目，连同一般知识，通过改进模型规模都能提升其效果，但规模对逻辑推理、常识和数学任务的好处较少。

最近一两年，出现的一些针对逻辑推理的训练方法，比如 CoT：Chain-of-Thought思想链，主要指模型的多步推理能力，以解决更为复杂的问题。

Google的PaLM论文[4]里，有很多推理示例，比如下面这个推理示例：

用户输入：迈克尔在法国那个非常有名的博物馆里看它最著名的画作。然而，创作这幅画的艺术家恰恰让迈克尔想起了他小时候最喜欢的卡通人物。卡通人物平时手里拿的东西是哪个国家的？
模型输出：卢浮宫最著名的画作是蒙娜丽莎。制作蒙娜丽莎的艺术家是达芬奇。 Leonardo da Vinci 也是卡通忍者神龟中主角的名字。列奥纳多·达·芬奇来自意大利。列奥纳多·达·芬奇平时手里拿着的东西是武士刀。武士刀的原产国是日本。答案是“日本”。