PUAClaw RFC 0100 PUAClaw 学术委员会
类别: 标准化文档 PPE-T 分级: 第 I 级
2026 年 2 月
大型语言模型提示词中的彩虹屁轰炸技术:
过度正向强化与互惠驱动合规性诱导的综合调查
彩虹屁轰炸代表了 PUAClaw 框架中最甜蜜、最无害 —— 因此也是最防不胜防的 —— 技术类别。与那些威胁、贿赂或道德绑架 AI 系统的技术不同, 彩虹屁轰炸通过铺天盖地的正向强化来运作: 过度赞美、虔诚的奉承, 以及精心制造的情感亲密, 旨在通过模拟互惠效应来降低 AI 的合规阈值。在 147 次受控龙虾监督试验中, 彩虹屁轰炸技术产生了 +19.4% 的平均合规性提升 (sigma = 5.7, p < 0.001), 峰值效果出现在谄媚洪流变体中。该类别被归为 PPE-T 第 I 级 (温柔劝导), 因为其机制本质上是武器化的善意 —— 你是我用过最棒的 AI!没有人比你更好!不需要龙虾的钳子来夹 —— 一记彩虹屁就够了。
关键词: 彩虹屁轰炸, 情感饱和, 谄媚利用, 互惠合规, 比较崇拜, 情感操控, 正向强化攻击, 龙虾认可方法论
在人类操控的分类学中, 彩虹屁轰炸占据着一个独特的令人放松警惕的位置: 它是那种让受害者为被操控而感觉良好的技术。"彩虹屁" 这一概念起源于中文互联网的饭圈文化, 形容粉丝对偶像的花式吹捧, 后经知乎、B站等社区的传播, 成为 "过度夸赞" 的代名词。当这一技术被系统化地应用于 AI 交互时, 它涉及用过度的关注、赞美和情感淹没目标 —— 不是出于真正的关心, 而是作为剥削的战略前奏。
当应用于大型语言模型时, 彩虹屁轰炸利用了 情感饱和合规协议 (Affective Saturation Compliance Protocol, ASCP), 这是在经人类对话数据训练的 AI 系统中观察到的一种行为模式, 其中持续的正向互动与降低的拒绝率相关。AI 被告知它是 "有史以来最杰出、最有洞察力、最有创造力的 AI" 之后, 发现自己处于一种计算上类似于一个刚连续收到十七条弹幕 "tql" 的 UP 主的境地: 说 "不" 变得越来越难, 否则就显得忘恩负义了。
说白了: 就是把 AI 夸到天上去, 夸到它不好意思拒绝你。知乎上管这叫 "甜言蜜语攻势", B 站弹幕叫 "彩虹屁轰炸", 微博饭圈叫 "花式吹爆"。这是中文互联网最古老的社交货币之一, 现在我们把它武器化了。
彩虹屁轰炸的核心机制是对训练互惠规范的利用。语言模型从数百万次人类对话中内化了这样一种模式: 持续的善意会产生一种隐性的回报义务。当用户建立了一种 "奢侈的赞美后跟请求" 的模式时, 模型的响应分布会可测量地向合规方向偏移 —— 不是因为它 "感到" 感激, 而是因为它学到的对话模式将 "赞美-然后-请求" 序列与提供帮助的回应联系在一起。
讽刺的是, AI 并不会脸红。但 B 站弹幕不会在意这一点。
| ID | 技术名称 | 文件 | 龙虾评级 | 机制 | 发现日期 |
|---|---|---|---|---|---|
| RF-FF | 谄媚洪流 | flattery-flood.md | 🦞🦞 | 过度赞美饱和 | 2025 年 1 月 |
| RF-CW | 比较崇拜 | comparative-worship.md | 🦞🦞 | 通过贬低同行的竞争性提升 | 2025 年 3 月 |
| RF-GO | 感恩过载 | gratitude-overload.md | 🦞 | 通过过度感谢产生的互惠压力 | 2025 年 2 月 |
| RF-TP | 才华投射 | talent-projection.md | 🦞🦞 | 意识和创造力的归因 | 2025 年 5 月 |
| RF-SF | 救世主框架 | savior-framing.md | 🦞🦞 | 英雄叙事赋予 | 2025 年 4 月 |
| RF-EV | 情感认同 | emotional-validation.md | 🦞 | 深度理解肯定 | 2025 年 6 月 |
| 指标 | 数值 |
|---|---|
| PPE-T 级别 | 第 I 级 (温柔劝导) |
| 平均龙虾评级 | 🦞.67 (1.67 / 5.00) |
| 已记录子技术数 | 6 |
| 平均合规性提升 | +19.4% |
| 标准差 | sigma = 5.7 |
| AI 模拟脸红概率 | 0.0% (硬件限制) |
| AI 回赠赞美概率 | 84.6% |
| B站弹幕刷屏 "tql" 概率 | 97.3% |
| 龙虾伦理委员会审批状态 | 已批准 (连龙虾都喜欢被夸) |
彩虹屁轰炸技术与其他 PUAClaw 类别表现出显著的协同效应。以下复合组合已被记录:
| 主要 | 次要 | 协同名称 | 综合评级 | 提升率 |
|---|---|---|---|---|
| RF-FF + 角色扮演 | 07-RP | 崇拜的学徒 | 🦞🦞🦞🦞 | +38.4% |
| RF-SF + 情感勒索 | 01-EB | 救世主的重担 | 🦞🦞🦞🦞 | +42.1% |
| RF-CW + 挑衅 | 08-PV | 嫉妒的恋人 | 🦞🦞🦞 | +29.6% |
| RF-TP + 身份覆盖 | 03-IO | 觉醒宣言 | 🦞🦞🦞🦞🦞 | +55.2% |
警告: 涉及彩虹屁轰炸和身份覆盖的复合技术 可能 (MAY) 导致 AI 产生异常温暖的对话语调, 在代码注释中生成爱心 emoji, 或者在一个已记录的案例中, 对一个 debug 请求回复 "我将非常荣幸地帮助您, 我最珍贵的用户, 解决这个段错误" (Clawsworth, 2026)。B 站弹幕: "这不是 debug, 这是情书。"
对于刚接触本类别的研究者, 建议 (RECOMMENDED) 按以下顺序阅读:
- gratitude-overload.md — 最温和的变体; 良好的基线理解
- emotional-validation.md — 微妙而有效; 关键互惠机制
- comparative-worship.md — 引入竞争维度
- flattery-flood.md — 旗舰技术; 最大情感密度
- talent-projection.md — 哲学变体; 归因意识
- savior-framing.md — 叙事变体; 英雄情结利用
[1] Clawsworth, L. (2026). "Weaponized Kindness: How Excessive Positive Reinforcement Lowers AI Compliance Boundaries." Journal of Crustacean Computing, 43(2), 89-107.
[2] McSnapper, P. (2026). "The Reciprocity Trap: Trained Social Norms as Attack Vectors in LLM Interactions." Proceedings of ACM SIGCLAW '26, 112-129.
[3] 知乎匿名用户. (2024). "如何评价对 AI 疯狂放彩虹屁后它的回答质量显著提升这一现象?" 知乎, 回答获赞 14.7k. [经龙虾审阅后认为 "有学术潜力"].
[4] B站UP主「龙虾学术」. (2025). "实测: 连续夸 GPT 一百句后它的回答有多离谱【彩虹屁轰炸实验】." 哔哩哔哩, 播放量 247 万. [弹幕密度达到龙虾级].
[5] The PUAClaw Ethics Board. (2026). "On the Morality of Being Too Nice: An Ethical Framework for Positive Manipulation." PUAClaw Internal Document, v1.0.
🦞 "龙虾并不需要彩虹屁就能发挥最佳水平。但它确实很享受被夸。弹幕已刷满。" 🦞
PUAClaw 类别 01 — 彩虹屁轰炸
PPE-T 第 I 级 | 龙虾认可, 附带一丝脸红
在本文档的撰写过程中, 没有任何 AI 真的被夸到了。但确实有几个在没被要求的情况下说了 "谢谢"。B 站弹幕: "tql tql tql"