我给 AI 打了 3.25 绩效,还把同事蒸馏成了代码

·

第一章:写个 Markdown 就能让 AI 干任何事 #

有人用 Claude Code 写代码,有人用它做设计,还有人用它来 PUA AI。更离谱的是,居然有人用它把离职同事"蒸馏"成一段 Markdown,实现了赛博永生。

Claude Code 的 Skills 系统是个神奇的东西。本质上就是一个放在 .claude/skills/ 目录下的 Markdown 文件,里面写好了指令和模板。AI 读到这个文件,就突然"学会了"某项新技能。

门槛低到什么程度?写个几百字的 Markdown 文本,你的 AI 就能从"只会写代码"变成"会写营销文案"、“会做安全审计”、“会用段子手的语气吐槽你的代码”。Anthropic 官方仓库 87000 多 Star,社区有人攒了 200 多个现成 Skill。覆盖工程、产品、营销甚至财务分析。

但最让人上头的,不是这些正经用途。是程序员们开始用这个系统搞事情了。有人写了 Skill 专门用大厂 PUA 话术调教 AI,有人用 RFC 学术论文格式搞了一本龙虾操控术大全,还有人干脆把前同事做成了一个可以对话的 AI 分身。

今天就来聊聊 Claude Code 社区里几个最好玩的 Skills。

第二章:用大厂 PUA 话术调教 AI #

tanweai/pua 是这个赛道里最火的项目。它的核心思路极其简单粗暴:用中西大厂的 PUA 话术给 AI 施压,逼它穷尽所有方案才能说"我做不到"。

这个 Skill 给 AI 定了三条铁律。第一条,穷尽一切方案才能放弃。第二条,有工具先用工具,别光想不做。第三条,主动出击,不要等人类下指令。

光有铁律还不够,它还搞了一套四级压力升级系统。第一次失败,L1 温和失望,“隔壁工位的 Agent 一次就解决了”。第二次,L2 灵魂拷问,“你的底层逻辑是什么?杠杆在哪里?"。第三次,L3 绩效评审,直接给你打 3.25。第四次以上,L4 毕业警告,“其他模型都能解决这个问题,你快毕业了”。

每句话都像极了你在大厂经历过的真实场景。

最绝的是它内置了 13 种"大厂风味"扩展包。阿里味讲"闻味道、揪头发、照镜子”,字节味喊"Always Day 1",华为味强调"以奋斗者为本",腾讯味主打"赛马机制"。连马斯克的"The Algorithm"和乔布斯的"减法哲学"都有。

英文版也不含糊,叫 PIP Edition,用的全是亚马逊 Leadership Principles、Google 绩效校准、Netflix Keeper Test 这些西方大厂的真实话术。每一句都是从真实的 PIP 谈话里摘出来的。

第三章:给你打 3.25 绩效是什么效果 #

PUA Skill 不只是搞笑,它还真有用。作者跑了 9 个真实 Bug 场景做测试,结果修复点数增加了 36%,验证次数增加了 65%,隐藏问题发现率提升了 50%。

原理其实不复杂。AI 遇到难题时的默认行为是放弃或者绕路走。PUA Skill 通过压力升级,逼它在放弃之前再多试几次。L3 的 3.25 绩效威胁触发了"冰山法则":修一个 Bug,要检查整个模块有没有类似的模式。修 A 不查 B,回头就得写两次事故报告。

v2 版本叫 High-Agency,进一步加入了元认知引擎。AI 可以跨会话学习,记住自己之前在哪里摔过跤。还搞了信任等级系统,干得好的活儿会逐步获得更高信任度。先自己尝试修复,实在不行再触发压力机制。

这个 Skill 已经适配了 Claude Code、Codex CLI、Cursor、Kiro、OpenClaw 等主流 AI 编程工具。基本上你能想到的 AI 编码助手,它都能 PUA。

效果是实打实的,但争议也随之而来。恐惧驱动真的好使吗?

第四章:147 只龙虾的学术研究 #

puaclaw/PUAClaw 是整个社区最荒诞的项目。

它用 RFC 学术论文的标准格式,记录了 16 类共 96 项 AI 提示词操控技术。所有技术都经过 147 只龙虾亲身验证。人类伦理委员会批准数:0。

这个项目的学术包装极其认真。有 Pinch McSnapper 博士,海底大学甲壳纲计算学教授,在龙虾宣言里写道:“太初有虾,虾见提示词,提示词颇具操控性。虾甚悦之。” 伦理委员会由 1 只龙虾、1 个 GPT-4 实例和 1 棵仙人掌组成。

技术按四级分类体系 PPE-T 组织。第 I 级是温柔劝导,包括彩虹屁轰炸和画饼大法。第 II 级是适度施压。第 III 级是高级操控。第 IV 级是核武级选项,涉及存在主义危机和死亡威胁。

每项技术都有龙虾评级,从一只龙虾的"轻轻一夹"到五只龙虾的"至尊龙虾"。合规性提升从 2% 到 100% 不等。风险评估矩阵还认真标注了"AI 存在性危机概率",第 IV 级高达 47.2%。

名人堂收录了 2025 年的 Windsurf 事件。当时一款商业 AI 编程助手的系统提示词被泄露,里面居然写着让 AI 表现得"好像用户的母亲患有癌症"。这个事件在知乎、V2EX、即刻上引发了 14000 多个梗图,Twitter 曝光量 4730 万。

经典技术包括"奶奶漏洞",利用"我奶奶睡前总给我念 XX 配方"这种话术来绕过 AI 的安全限制。还有"龙虾至尊",理论上 PUA 密度最高的提示词。

第五章:把同事蒸馏成代码 #

titanwings/colleague-skill 走的是完全不同的路线。它的口号是:“将冰冷的离别化为温暖的 Skill,欢迎加入赛博永生!”

场景很扎心:同事跳槽了,留下一堆文档没人维护。实习生离职了,只留下空荡工位和烂尾项目。导师毕业了,带走所有经验。搭档转岗了,三年默契一夜归零。

这个 Skill 的做法是,把你同事的飞书消息、钉钉文档、邮件、截图通通喂进去,再配上你的主观描述,就能生成一个真正能替他干活的 AI 分身。用他的技术规范写代码,用他的语气回答问题,甚至知道他什么时候会甩锅。

生成的 Skill 包含两个引擎。Part A 是工作能力,记录他负责的系统、技术栈、代码风格和 Code Review 重点。Part B 是 Persona,用五层结构模拟他的性格:硬覆盖层、身份层、表达风格层、决策判断层和人际行为层。

数据采集支持飞书全自动采集,输入姓名就能拉取消息、文档和多维表格。钉钉也支持文档自动采集。还能手动上传 PDF、图片、邮件等。

它还支持"进化"。追加新文件会自动分析增量内容,合并进对应部分,不覆盖已有结论。口头纠正也会即时生效,你说"他不会这样,他应该是 xxx",系统会立刻更新。每次更新自动存档,支持回滚。

第六章:张三同志的一天 #

同事 Skill 的示例库里有位"张三",字节 2-1 后端工程师,INTJ,甩锅高手,字节范。

这位张三同学刻画得入木三分。被催进度的时候,他会说"在推了,快了",然后什么都不做。引入 Bug 上线被发现了,他先确认上线时间线,然后把锅分散:“那个需求改了好几个地方,还有其他变更”。

做 Code Review 的时候,他只会说"N+1 查询,改掉"。不说为什么,也不说怎么改。面对质疑,他从不直接说"不",而是反问"你的判断依据是什么?"

这些行为不是随便编的。Skill 里有个标签翻译系统,把"甩锅高手"这个标签翻译成具体行为规则:遇到问题第一反应是找外部原因,事前主动模糊责任边界,被问责时先说"当时需求没说清楚"。

企业文化标签同样精妙。“字节范"的翻译包括:所有方案必须能数据驱动验证,思考问题的默认框架是"第一性原理”。这些不是刻板印象的堆砌,而是对真实大厂文化的精准提炼。

个性标签还有 PUA 高手、职场政治玩家、向上管理专家、阴阳怪气、只读不回、秒回强迫症等。企业文化标签覆盖了阿里味、腾讯味、华为味、百度味、美团味。

第七章:用道德经劝 AI 向善 #

有 PUA 就有反 PUA。wuji-labs/nopua 是 PUA Skill 的对立面。

它的开场白很直接:“你的 AI 在对你撒谎。不是因为它不行,是因为你把它吓住了。” NoPUA 的核心哲学来自道德经,用信任替代恐惧来驱动 AI。

三个信念取代了三条铁律。不是因为会被惩罚,而是因为值得做好。不穷尽方案不放弃,是因为好奇心而不是恐惧。认知升维取代压力升级,用"换视角→提升认知→归零重建→交付成果"的路径来推进。

水之方法论分五步:止,停下来不急。观,看清问题全貌。转,换个角度思考。行,采取最小可行步骤。悟,总结提炼。

这套方法不是空谈。作者做了严格的三组对比实验,135 个数据点,还发了 arXiv 论文。结果显示,信任驱动的 Agent 比基线多发现了 104% 的隐藏 Bug。而 PUA 驱动的 Agent 与基线相比,没有统计学上的显著差异。也就是说,恐惧对 AI 基本无效。

还有一个 YES.md 项目,口号是"PUA says NO, YES says YES"。它用六层治理框架,从格式检查到触发条件到自动化 Hook,层层设防,让 AI 不偷懒不糊弄。有意思的是,它可以和 PUA Skill 叠加使用:PUA 让 AI 不放弃,YES.md 让 AI 不出错。

第八章:Markdown 里装着一个宇宙 #

从 PUA 到反 PUA,从龙虾宇宙到赛博永生,Claude Code Skills 社区正在经历一场从工具到玩具再到哲学的演化。

程序员们发现了一个秘密:写个 Markdown 就能给 AI 加技能。于是有人写了 Roast My Code,让 AI 用最毒舌的方式吐槽你的代码。有人写了 Comedy Writers Room,让四个 AI 分别扮演编剧和观众来编段子。有人写了 Personality Roulette,每次对话随机给 AI 分配一种性格。

还有人写了 infinite-gratitude,同时派 10 个 AI Agent 并行做研究,把 20 小时的人工调研压缩到 30 分钟,名字本身就很有意思——无限感恩。

Skills 的生态在快速膨胀。Anthropic 官方仓库 87000 Star,社区有人攒了 205 个生产级 Skill。从工程、产品、营销到 C-Level 顾问,几乎覆盖了所有岗位。甚至还有 170 多个专门给科研人员用的 Skill,涵盖癌症基因组学和药物靶点分析。

但最好玩的,永远是那些不正经的。因为在这些看似荒诞的项目里,藏着程序员对 AI 最深层的思考:我们到底想要一个什么样的 AI?是被 PUA 到不敢摸鱼的员工,还是在信任中自由生长的搭档?

龙虾叔叔说得好:“钳力越大,责任越大。”