1 . 阅读下面的文字,完成下面小题。
作为如今最为强大的内容生成工具,各类AI在信息生态循环中扮演着双重角色,它们既被认定为当今信息环境中最为活跃的污染源,却又是信息污染的隐藏受害者。
生成式AI作为污染源饱受诟病,其无法去除的“幻觉”问题使其经常一本正经地胡说八道,凭空创造出看似合理却完全虚构的信息。大语言模型的核心算法目标是预测和生成“最可能”的内容,这些错误往往还被包装在流畅的语言与结构化的逻辑中,极具欺骗性,让缺乏相关知识的用户难以察觉。
如果说文本回答的污染已经足以令用户担忧,那么AI在图像、音频、视频方面的多模态生成则让信息污染的范围扩大了几个维度。在历史上,每一次传播媒介技术的进步都在改变着人类获取信息的方式,而这种多模态生成的污染则可能让之后我们感知真实的本能也被迫发生改变。
事实上,只将AI认定为污染制造者也过于片面了,AI也是信息污染的重要受害者。
生成式AI的本质是模仿训练集中的文本进行文字续写,因此会表现出和训练集文本相似的特性。由于大多数AI都使用了历史和网络中的大量文本进行训练,很多历史偏见很容易被吸收进模型的训练集中。虽然对文本进行人工标注和精调可以一定程度上修正这些偏误,但一方面对如此大量的训练文本进行人工标注需要大量成本,另一方面这种批改错题式的解决方案无法彻底解决所有可能出现的问题。
而更令人担忧的是,随着高质量的人类原创内容被AI大量消耗,AI想要获得新的数据进行训练,就不得不从互联网上爬取新的内容,而AI生成内容越来越多地充斥着互联网,未来AI的训练数据将不可避免地包含AI生成的垃圾内容。
当这类生成的数据污染了后续模型的训练集时,会让模型逐渐丢失掉真实数据中的概率相对较低的信息,发生退化。比如前文是“猫吃了……”,原本的真实信息下文概率分布从高到低可能是“鱼”“罐罐”“老鼠”“毛团”“一惊”等,但在模型反复以自己的输出为训练集进行训练后,概率较低的“毛团”和“一惊”可能就会丢失,模型的输出将会趋近于同质化。加上幻觉的污染,模型也会在训练中接触到更多完全错误的数据,迭代多次后,模型生成的内容可信度也会越来越低,这就是所谓的“模型崩溃”(Model collapse)。
这种模型崩溃是AI作为污染受害者的最终体现,当AI逐渐远离人类原创的高质量内容,它的输出也会逐步同质化和平庸化,就像一幅不断被复制的画作,每一次复制都失去一些细节与神韵,而当AI不再能提供更多更好的创作时,它的生命周期也将随着这个污染怪圈走向尽头。
如果说AI是信息污染的污染源与受害者,那么在这个污染系统的另一端,人类既是无意识的盲从者,也是幕后精明的操控者。
人类的大脑天生有着认知偏差,这是我们处理复杂信息流做出决策的基础。面对无边的信息海洋,我们本能地寻找认知的捷径。其中之一就是诉诸权威。而AI以表面的客观性和无可比拟的知识面广度,正在成为新的信息权威,“AI说的”正在替代“百度说的”,被用作论据的权威依据。
这种对AI的盲从源于多重的心理机制:一种是自动化偏差,我们总是相信机器比人更为客观更为可靠;另一种是认知负担转移,信息量如此庞大,将判断的责任交给AI可以减轻我们的决策压力;……而媒体和市场为了追求热度对AI能力的不断神化,也让公众对AI有了过度的期待。
从众心理和随之而来的信息茧房,则成为了人类身为盲从者和操控者的交汇点。一方面,我们倾向于相信高点赞多转发的内容,将数据量视为可信度的证明,另一方面,一部分人利用这种倾向,制造虚假的从众假象,诱导流量。算法推荐系统则顺应了人类的弱点并为之推波助澜——根据用户已有偏好不断推送相似内容。这种双向互动使信息污染有了稳定的生态循环,让用户不自觉地陷入信息茧房。
对AI神化的舆论趋势背后,是更为根本的经济驱动力。当商业估值模型更看重用户数量时,提升内容准确性就不如提供更多内容生成的功能来得更为紧迫。企业为了满足投资者预期而加速开发并不算完善的生成功能,部分媒体为流量而持续炒作AI能力,用户使用并传播AI内容,形成了一个由资本力量主导的生态圈。
理解了这种机制后,一些人开始更为主动地操控信息生态。由于很多互联网内容平台都设置了所谓的“流量激励”机制,有人就从中嗅到商机——使用AI批量生成吸引眼球的内容,是一种低成本、高回报的商业策略。当广告收入主要依赖点击量和停留时间时,内容的真实性往往让位于其吸引力。内容农场们借助AI,每天能生成数百篇不同主题的文章,只为赚取流量和广告费;而起号的各类社交媒体账号,也不惜利用AI撰写假新闻,来获得点赞和转发;这些利益上的动机都进一步推动了信息污染的传播。
在这个复杂的信息生态系统中,盲从与操控并非截然对立的两极,而是相互强化的闭环。人类既是算法推荐和AI生成内容的被动消费者,又在不断学习如何利用和操纵这些技术为己所用。这种复杂的共生关系,正是当代信息污染如此难以治理的核心原因。
节选自antares《互联网正在沦为“信息垃圾场”,真的是DeepSeek们的错吗?》有删改
1.
下列对材料相关内容的理解和分析,正确的一项是( )2.
根据材料内容,下列说法正确的一项是( )3.
下列对材料表达方式的分析,不正确的一项是( )4.
有人认为“AI与人类之间形成了信息的污染循环”,请根据文本内容说明。5.
AI让互联网沦为“信息垃圾场”,请根据材料分别以正方或者反方的身份进行一辩陈述,列出陈词要点。
A. AI是信息污染的污染源与受害者,在复杂的信息生态系统中,其盲从与操控是相互强化的闭环。
B. 模型生成内容的可信度跟人类原创内容有关,AI凭借表面的客观性和知识面广度,正在成为新的信息权威。
C. 在流畅的语言与结构化的逻辑中,AI的文本回答极具欺骗性,也可能改变着我们感知真实的本能。
D. 当代信息污染难以治理,其核心原因是人类受经济利益驱动,更为主动地去操控信息生态。
A. 生成式AI会表现出与训练集文本相似的特性,其生成内容有很多历史偏见,也将包含AI生成的垃圾。
B. “AI说的”被用作权威依据,这种盲从源于认知负担转移,与大脑天生的认知偏差有关。
C. 算法推荐系统根据人类偏好推送的内容,使信息污染稳定循环,最终让用户陷入信息茧房。
D. 人类更为主动地操控信息生态,致使信息污染进一步传播,也将直接导致AI的生命周期走向尽头。
A. 文中运用作比较的方法,说明AI文本回答污染与多模态信息污染的危害,表明多模态生成污染之厉害。
B. 文中举例子说明模型反复以自己的输出进行训练的后果,让人们理解模型逐渐丢失信息,走向同质化的过程。
C. 文中以一幅不断复制的画类比,说明远离人类原创的高质量的内容,AI的生命也走到了尽头。
D. 文中采用分类别的方式介绍盲从AI的心理机制,解读人们用“AI说的”作为权威论据背后的心理原因。