导读
随着GPT等语言模型的爆火,AI应用也逐渐渗透到生活的日常中,比如各种AI文章总结,AI视频摘要等等。作为一个也亲自搭建过微信文章总结流程的人来说,也确实惊叹于这项技术的便利和潜力。
但在AI火热背后的冷静思考,我们真的需要AI来帮助总结内容吗?从全局视角看,我认为它未必是件好事,因此我想谈谈自己的一些观点看法。
一、对创作者的不尊重
设想摆在你面前的,有原始的文章,以及总结成几句话的简短介绍,你会更喜欢看哪个?
出于各种原因,如果大多数的阅读者倾向于看总结后的文本,那就会有创作者从总结后的文本生成内容。这就会使得大量“低成本作品”充斥在网络中,形成“劣币驱逐良币”的现象,让真正用心创作的作者受伤。
考虑到技术发展迭代,如果AI总结的内容质量可以进一步提升,能够很精准地提取文章的要点与精髓,那会发生什么?我担心会形成一个怪圈。可以参考微博花钱买热搜,花钱删热搜,同一批人做两波生意。
届时难免会有“商人”打着创作赚钱旗号兜售从一句话生成全部文案的工具,然后另一波“商人”再批量把文章内容转成一句话。
如果真是这样,并且大众也习惯与此,那就不限于是让创作者寒心,更加是人类的一种损失。本身写文章表达观点是一个深度思考的过程,而AI的出现却在抹杀这种可能性。(同样的事情已经在AI绘画上发生,因为AI模仿画的太好了以至于超过了大多数人,很多画手都在考虑转行,人们从此又逐渐少了一个表达自己精神世界的渠道。)
二、质量与幻觉
AI 概括的内容未必是全面、准确的。这其实是几个影响因素的综合作用。
首先是语言模型的上下文感知长度,过长的文本无法被识别。之前有论文发现,随着输入文本量的增加,GPT的模型会对开头和结尾内容比较敏感,而中间的内容就有概率被忽略。模型能识别的文本长度存在一个隐形的天花板。「有论文图就比较好了」
其次是压缩率,等于 输入文本量 / 总结后文本量,如果文本很长而要求总结后内容不变,那势必会丢失信息。若要保持压缩率不变,那就需要总结后的文本量是与输入文本量成正比,能做这件事情的似乎只是在prompt中加字数要求,能凑合但也终究不是个很优雅的方案。
也许你会说,内容太长,那可以分段呀,分段后的字数就可以控制了。而这又带来了不稳定性,因为采取何种的分段方式对结果依然影响很大。比方说,在文章中我花篇幅举了个例子,为了论述某个观点,例子本身并不是重点。但在分段模式下,例子就成了重点内容,这就影响了对全文的理解。在一些行文比较跳跃、比较蒙太奇叙述的文章中尤是。
最后是幻觉和“下毒”。如何相信AI总结的内容反应了真实意图。往深了讲,这里还涉及到信息曲解,以及“意识形态的选择性忽略”。
- 选择性忽略:比如文章中说了正反两个观点,但是这个语言模型有某种倾向,“不喜欢”正方观点,于是总结出来只有反方观点
- 下毒:这也是某篇论文中提到的针对语言模型下毒的方法,即在内容的介绍中用人类看不见的白色字体,要求语言模型总结对某个人不利的内容。这其实是一种“提示词攻击”,语言模型可能误把文本内容当成了总结要求,而产生了别有用心的、带偏见的、受操控的内容。
有这些问题不代表要停下脚步,但也确实要采取措施去防范这些潜在的风险。
三、阅读时更需要导读与提问
试想总结内容对读者的收益是什么。可能有两个主要原因,一、可以大略知道这个文章/视频讲了什么,来决定是否要看。二、可以跳转到感兴趣的内容。
对于第一点,我认为,对于长视频/长文来说,讲清楚内容是基本功。可以通过标题、导语、简介之类说明,作者总结的导读信息肯定更凝练。参考例子是像新闻稿那样采用总分总的结构。
借鉴阳志平老师讲如何阅读一本书的方法,先看背后的推荐语,再看看序章,就可以大略知道讲什么了。AI要模仿若干名人生成推荐语还是困难,是因为请名人写才有背书。AI生成的推荐语没有背书,所以并不能提升你看这个内容的权重。
而第二点跳转到感兴趣的内容,则是更为合适的。比较推荐的方式是带着提问去阅读,然后在书中寻找答案。
提出好问题是需要门槛和意识的,在阅读前先想问题是需要“思考成本”的。也许AI可以折衷,在其已阅读完内容的假设下,提出与内容相关的几个问题。如果对问题的答案感兴趣,那就看。不感兴趣就不看了,称之提问式总结。(这可能是一个可以发挥 AI 创造性的方向,如果 AI 还能提前了解你的兴趣点的话)
四、总结内容难以做检索和召回
检索/召回是一个专用术语,用来指代从海量内容中寻找并定位想要的内容。通常总结的内容由于缺乏关键细节,导致难以召回。
以前阅读的时候,也许我的脑子记得先前哪篇文章中提到的某个数据(大脑对例子的记忆更深刻),就是想不起来在哪里看的。对比若是我直接读了这个文章的摘要,可能我以后更想不起来它说了啥了。
如果你有想把 AI 当成“第二大脑”外挂的想法,那么喂给它的信息就更不应该是总结后的内容,至少也应该是原始内容+总结后的内容。
五、不是AI写的总结
试图总结一下,一方面读者不想看AI生成的大段内容,一方面又想看AI生成的精炼总结。这需求本身有些很微妙的矛盾。变革时代中,定位自身角色是不容易的,上一秒你以为拿着AI武器在“收割”别人的财富,下一秒你就可能成为别人“收割”财富的工具和养料。这也是我写文提醒“慎用AI总结”的一大直接原因。
从纯技术角度,AI总结也发展了挺久到能用的阶段,但仍然存在长度的挑战。我相信随着时间的推移这些挑战会被克服,可仍然需要对一些潜在的被攻击的风险保持警惕,尤其是意识形态方面的。
未来,个人创造的重要性会提升,如果能有AI加持则也是如虎添翼,重要的是你自己想创造什么,然后加速执行。