为什么说AI总结不是出路？

导读

随着GPT等语言模型的爆火，AI应用也逐渐渗透到生活的日常中，比如各种AI文章总结，AI视频摘要等等。作为一个也亲自搭建过微信文章总结流程的人来说，也确实惊叹于这项技术的便利和潜力。

但在AI火热背后的冷静思考，我们真的需要AI来帮助总结内容吗？从全局视角看，我认为它未必是件好事，因此我想谈谈自己的一些观点看法。

一、对创作者的不尊重

设想摆在你面前的，有原始的文章，以及总结成几句话的简短介绍，你会更喜欢看哪个？

出于各种原因，如果大多数的阅读者倾向于看总结后的文本，那就会有创作者从总结后的文本生成内容。这就会使得大量“低成本作品”充斥在网络中，形成“劣币驱逐良币”的现象，让真正用心创作的作者受伤。

考虑到技术发展迭代，如果AI总结的内容质量可以进一步提升，能够很精准地提取文章的要点与精髓，那会发生什么？我担心会形成一个怪圈。可以参考微博花钱买热搜，花钱删热搜，同一批人做两波生意。

届时难免会有“商人”打着创作赚钱旗号兜售从一句话生成全部文案的工具，然后另一波“商人”再批量把文章内容转成一句话。

如果真是这样，并且大众也习惯与此，那就不限于是让创作者寒心，更加是人类的一种损失。本身写文章表达观点是一个深度思考的过程，而AI的出现却在抹杀这种可能性。（同样的事情已经在AI绘画上发生，因为AI模仿画的太好了以至于超过了大多数人，很多画手都在考虑转行，人们从此又逐渐少了一个表达自己精神世界的渠道。）

二、质量与幻觉

AI 概括的内容未必是全面、准确的。这其实是几个影响因素的综合作用。

首先是语言模型的上下文感知长度，过长的文本无法被识别。之前有论文发现，随着输入文本量的增加，GPT的模型会对开头和结尾内容比较敏感，而中间的内容就有概率被忽略。模型能识别的文本长度存在一个隐形的天花板。「有论文图就比较好了」

其次是压缩率，等于输入文本量 / 总结后文本量，如果文本很长而要求总结后内容不变，那势必会丢失信息。若要保持压缩率不变，那就需要总结后的文本量是与输入文本量成正比，能做这件事情的似乎只是在prompt中加字数要求，能凑合但也终究不是个很优雅的方案。

也许你会说，内容太长，那可以分段呀，分段后的字数就可以控制了。而这又带来了不稳定性，因为采取何种的分段方式对结果依然影响很大。比方说，在文章中我花篇幅举了个例子，为了论述某个观点，例子本身并不是重点。但在分段模式下，例子就成了重点内容，这就影响了对全文的理解。在一些行文比较跳跃、比较蒙太奇叙述的文章中尤是。

最后是幻觉和“下毒”。如何相信AI总结的内容反应了真实意图。往深了讲，这里还涉及到信息曲解，以及“意识形态的选择性忽略”。

选择性忽略：比如文章中说了正反两个观点，但是这个语言模型有某种倾向，“不喜欢”正方观点，于是总结出来只有反方观点

下毒：这也是某篇论文中提到的针对语言模型下毒的方法，即在内容的介绍中用人类看不见的白色字体，要求语言模型总结对某个人不利的内容。这其实是一种“提示词攻击”，语言模型可能误把文本内容当成了总结要求，而产生了别有用心的、带偏见的、受操控的内容。

有这些问题不代表要停下脚步，但也确实要采取措施去防范这些潜在的风险。

三、阅读时更需要导读与提问

试想总结内容对读者的收益是什么。可能有两个主要原因，一、可以大略知道这个文章/视频讲了什么，来决定是否要看。二、可以跳转到感兴趣的内容。

对于第一点，我认为，对于长视频/长文来说，讲清楚内容是基本功。可以通过标题、导语、简介之类说明，作者总结的导读信息肯定更凝练。参考例子是像新闻稿那样采用总分总的结构。

借鉴阳志平老师讲如何阅读一本书的方法，先看背后的推荐语，再看看序章，就可以大略知道讲什么了。AI要模仿若干名人生成推荐语还是困难，是因为请名人写才有背书。AI生成的推荐语没有背书，所以并不能提升你看这个内容的权重。

而第二点跳转到感兴趣的内容，则是更为合适的。比较推荐的方式是带着提问去阅读，然后在书中寻找答案。

提出好问题是需要门槛和意识的，在阅读前先想问题是需要“思考成本”的。也许AI可以折衷，在其已阅读完内容的假设下，提出与内容相关的几个问题。如果对问题的答案感兴趣，那就看。不感兴趣就不看了，称之提问式总结。（这可能是一个可以发挥 AI 创造性的方向，如果 AI 还能提前了解你的兴趣点的话）

四、总结内容难以做检索和召回

检索/召回是一个专用术语，用来指代从海量内容中寻找并定位想要的内容。通常总结的内容由于缺乏关键细节，导致难以召回。

以前阅读的时候，也许我的脑子记得先前哪篇文章中提到的某个数据（大脑对例子的记忆更深刻），就是想不起来在哪里看的。对比若是我直接读了这个文章的摘要，可能我以后更想不起来它说了啥了。

如果你有想把 AI 当成“第二大脑”外挂的想法，那么喂给它的信息就更不应该是总结后的内容，至少也应该是原始内容+总结后的内容。

五、不是AI写的总结

试图总结一下，一方面读者不想看AI生成的大段内容，一方面又想看AI生成的精炼总结。这需求本身有些很微妙的矛盾。变革时代中，定位自身角色是不容易的，上一秒你以为拿着AI武器在“收割”别人的财富，下一秒你就可能成为别人“收割”财富的工具和养料。这也是我写文提醒“慎用AI总结”的一大直接原因。

从纯技术角度，AI总结也发展了挺久到能用的阶段，但仍然存在长度的挑战。我相信随着时间的推移这些挑战会被克服，可仍然需要对一些潜在的被攻击的风险保持警惕，尤其是意识形态方面的。

未来，个人创造的重要性会提升，如果能有AI加持则也是如虎添翼，重要的是你自己想创造什么，然后加速执行。