From legal-skills
Detects and removes AI-like writing patterns (AI腔) from Chinese text. Must be invoked after drafting to eliminate程式化 (stylized) expressions, overused modifiers, template structures, and other telltale AI artifacts.
How this skill is triggered — by the user, by Claude, or both
Slash command
/legal-skills:de-ai-polishThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
检测文章中的AI化表述:
检测文章中的AI化表述:
# 全文扫描检测
/de-ai-polish detect @article.md
# 直接修改
/de-ai-polish fix @article.md
核心原则:以下清单和规则是参考框架,不是穷举清单。AI 写作的变体无穷,正则匹配必然遗漏。检测必须以 Agent 通读全文为主,清单仅作为辅助参考。
AI化表述往往以变体出现,不会恰好匹配清单字面形式。遵循以下原则:
越来越/越...越...、其实、往往/通常/很多时候、经常/常常、更重要的是/更麻烦的是、看起来/看来、真正、不只/不只是、更像/更像一个/更像一种、很容易、更容易才...才...、不是...而是...、就是X,就是Y,就是Z)容易X、容易Y、容易Z);句子开头用程式化引导词(更麻烦的是、说到这里);程度副词+抽象名词固定搭配(有很强的体感)窄/小/平/浅/局限、变化/改变/转变/变革,在短距离内超过3次即为AI词汇贫乏的表现下面 7 类用于把本 skill 的细碎禁用风格归纳成稳定问题来源。原有 17 类清单继续保留,负责具体命中;本类型学负责先判断“为什么这句话像 AI”,再决定怎么改。
结论:本 skill 的负面风格清理项可以完整归入这 7 类;personal-style-guide.md中的正向个人风格是改写目标,不属于污染项。
| 污染类型 | 问题来源 | 覆盖本 skill 中的规则 | 改写优先级 |
|---|---|---|---|
| 姿态污染 | 文本在评价自己、讨好读者或摆作者姿态 | 结尾姿态句、谄媚语气、自我陈述、评价式陈述、过度强调知名度、客观让步姿态 | 删除姿态层,直接保留事实、判断或经验 |
| 模板污染 | 用固定句式组织观点,替代真实判断 | 对比句式、程式化连接词、AI 过渡语、导语式口癖、比较性与断定性表述 | 重写整句,改成直接陈述、因果、场景或并列 |
| 语义稀释 | 模糊词、程度副词和大词冲淡信息 | 绝对化 / 哲学化 / 戏剧化、程度副词堆叠、模糊频次词、同义循环、空泛意义拔高 | 补足对象、条件、范围、结果;删掉无信息修饰 |
| 节奏污染 | 句式、排比、短句和断句形成机器节奏 | 工整排比、疑问词排比、连续短段、长级联 越...越...、句子节奏问题 | 打散工整结构,合并碎句,恢复自然段落节奏 |
| 概念污染 | 借黑话、隐喻、口号或专业词制造高级感 | 口号化隐喻、互联网黑话、引号误用、格局/生态/闭环/模板/叙事 等抽象词 | 能不用术语就改普通词;必须用时说明本文用法和边界 |
| 过程泄漏 | 把 AI、调研、协作或写作过程暴露给读者 | 模糊归因、知识截止免责声明、协作交流痕迹、以上是/请告诉我、资料状态式表达 | 删除过程痕迹;正文只留可确认事实和作者判断 |
| 格式污染 | 用格式包装替代正文表达 | 无序列表滥用、内联标题垂直列表、表情符号、过度粗体、引用块宣言、引号滥用 | 还原为自然段、合法清单或真实引用 |
使用方式:
**这是 X** 出现在引用块里”主类型是模板污染,协同格式污染。以下模式在任何情况下都应去除,它们是最明显的AI痕迹:
必须去除的模式:
不是.*而是并非.*而是不在于.*在于不在.*而在(缩写形式,如「问题不在工具,而在…」)不再是.*而是与.*是两回事与.*不等同于看似.*实则(如:看似在讲隐喻,实则在讲生产方式)看起来.*其实(如:看起来是X,其实是Y)可以.*但不能.*(能力限定式对比,如"冷水可以让人清醒,但不能替人看见未来")不在于.*也不在于(双重否定变体)远不只是.*("不只是"的加强变体)这不是X。这是Y。(分离式对比:把「不是…而是」拆成两句,本质相同)这不是X(否定宣言:作为段落开头或独立断言,如「这不是想象」「这不是追热点」)**这是X**(肯定宣言:作为独立加粗行或引用块,本质与否定宣言相同,只是省略了否定前缀,如「这是提前移动自己的观察位置」「这是在新的信任机制里,为自己建立位置」)低水平X...高水平Y / 表层X...深层Y(工整对称对比,常出现在引用块中)改写策略:根据上下文选择「删 / 合并 / 改写」。拆成独立陈述句或递进关系,避免为了强调而强行对比。改写时不要套用同一结构("本质上是X""症结在于X"),要根据语境灵活选择陈述、问答、因果、并列等替代方式。
否定宣言和肯定宣言的改写:直接删除"这不是"或"这是"前缀,保留核心内容即可。加粗行本身的格式已足够传达强调,无需再用"这是"开头。
同义词循环:
检测模式:在短距离内使用多个同义词指代同一事物
示例:
主人公…主要角色…中心人物…英雄(同一段落中用4个词指代同一人)系统…平台…工具…解决方案(频繁换词但指代同一事物)改写:统一使用最准确的词汇,在上下文清晰的情况下重复使用同一词汇。
写作规则中已禁用:
首先、其次、此外、但是、因此、然而一方面、另一方面综上所述、总而言之AI 词汇库:
深入探讨、深入分析(过度使用)强调、凸显、彰显(过度重复)持久的、持久的证明增强、增强其培养、培养/促进、促进获得、获得.*的认可相互作用、复杂的相互作用复杂/复杂性、错综复杂的格局、整体格局、格局的演变(抽象名词滥用)织锦、社会织锦(抽象名词滥用)宝贵的、宝贵的经验充满活力的、充满活力的社区肤浅分析表述:
突出/强调/彰显…,确保…反映/象征…,为…做出贡献培养/促进…,涵盖…展示…,体现…必须检测的表述:
方向已经明确未来可期拭目以待这只是开始让我们期待公式化展望:
检测关键词:
尽管其…面临若干挑战…尽管存在这些挑战、尽管面临挑战挑战与遗产、机遇与挑战并存未来展望、下一步计划我们将继续关注、值得关注改写:删除空洞的展望,用具体事实或具体计划结尾,或直接结束。
必须检测的词汇:
稳、挺稳、很稳、靠谱飘、摇摆、不稳搞定、没问题迟早得、肯定、必须得肯定、绝对、一定跑偏、很顺、挺顺等过于口语化的状态描述随意化表述模式:
写长了、做多了、搞定了等过于随意的说法迟早得拆、肯定会、必须得等口语化表达接下来要盯的东西、接下来要关注的等口语化表达改写方向:使用更正式、更具体的表达("迟早得拆"→"需要考虑拆分","跑偏"→"偏离预期","很顺"→"顺畅")。
系动词回避:
作为/代表/标志着/充当 [一个]、拥有/设有/提供 [一个]、位于.*的中心、坐落于谄媚语气:
好问题!、您说得完全正确!、这就是一个很好的观点必须检测的表述:
并不是一个绝对命题本质上、从根本上说、从本质上讲必然、无疑、绝对、必须真正的、核心的、关键的(过度使用)推到底、刺痛感这词听着玄、道理其实很朴素天然、天生、自然而然(绝对化自然表述)立刻、马上、立即(过于绝对的时间表述)其实(过度使用,显得矫饰)其实已经能看清、其实很简单等带"其实"的表述很现实(AI式绝对化判断)过度强调意义:
作为.*的体现/证明/提醒、充当.*的证明标志着.*关键时刻、见证了.*历史是.*不可或缺的组成部分、是.*的重要体现凸显/强调/彰显了其重要性/意义反映了更广泛的、象征着其持续的/永恒的/持久的为.*做出贡献、为.*奠定基础关键转折点、不断演变的格局虚假范围:
从.*到.*(检查是否在有意义的尺度上)程度副词堆叠结构:
很+形容词/动词:很直接、很吃人、很依赖、很麻烦非常+形容词/动词:非常依赖、非常麻烦、非常清楚有+很+的+名词:有很直接的感觉、有很强的体感、有很深的感受戏剧化感受词:
改写:用弹性表达替代绝对化("必然"→"往往"/"多半"/"可能","本质上"→"通常"/"在某种程度")。保留空间感,不过度封死结论。
必须检测的结构:
具体示例:
疑问词排比:
三个以上疑问词引导的并列项,是 AI 列举场景时的典型结构:
能不能...能不能...能不能...(如"能不能下载,能不能直接跑,能不能少填几张表")怎样...怎样...怎样...(如"怎样收集信息,怎样组织判断,怎样沉淀经验")如何...如何...如何...(如"如何识别问题,如何做成工具,如何翻译工作")越...越...越...(如"越理解工具,越容易提升效率;越提升效率,越容易输出")改写:将部分项合并为名词短语或动宾短语,打破统一句式。如"怎样收集信息,怎样组织判断,怎样沉淀经验"→"怎么收集信息、组织判断,怎么沉淀经验"(合并+缩减)。
改写:打破工整结构,改为陈述句或混合结构,避免三个以上相同结构的并列。
必须检测的过渡语:
先把.*摆出来、摆上台面不妨把.*拆成、不妨这两个问题一问、答案就清晰了这话对了一半、这话没错我后来发现、我也想过一个直接的原因、一个现实的原因、一个根本的原因一个很现实的原因是、一个很直接的原因是原因很简单、原因很直接这也是为什么(结论倒装式过渡,直接删除前缀即可)从一开始就(时间绝对化框架,如"从一开始就没有对准问题")协作交流痕迹:
希望这对您有帮助、当然!、您说得完全正确!、请告诉我、以上是…必须检测的表述:
我更愿意、我更倾向于我给自己定、我设定了我想强调、我想指出我期待、我希望渐进式自我陈述:
我越来越觉得、我越来越认为、我越来越倾向于、我现在越来越必须检测的表述:
表面上看更关键的是、更值得写的是、更重要的是更大的变化在于、更实质的变化是、更X的是/更X的在于("更"字引导的递进式宣言)从经验看、在实践中这当然成立、毫无疑问接下来会、接下来我们频次表述重复:
很多时候(整篇文章出现超过2次)、往往、通常(过度重复)模糊归因:
行业报告显示、观察者指出、专家认为、多个来源(无具体出处)知识截止免责声明:
截至 [日期]、根据我最后的训练更新、基于可用信息…、在现有资料中…必须检测的表述:
必须检测的词汇:
必须检测的表述:
被.*多家媒体报道、受到.*广泛关注独立报道、地方/区域/国家媒体由知名专家撰写、专家团队活跃的社交媒体账号拥有超过.*粉丝、关注者改写:删除空洞的知名度强调,或提供具体有意义的内容。
以下模式需要根据文章风格、语境和目标读者来判断是否修改:
检测标准:列表是否在"堆积观点"而非"说明步骤";整篇文章无序列表出现超过2-3次应改为段落。
可接受场景:操作步骤、检查清单、核心框架列举。
内联标题垂直列表:
- **用户体验:** 用户体验通过新界面得到显著改善(粗体标题+冒号的机械列表)表情符号和粗体过度使用:
🚀 **启动阶段:**、💡 **关键洞察:**、过度使用 **OKRs** 等粗体检测过度使用:
"..."'...'AI写作特有的引号误用模式(必须检测):
以下类型的引号通常不需要,应去除:描述性短语("可调用的能力")、比喻性描述("Skill 的外壳")、口语化表达("能不能一键跑起来")、动作/状态描述("换一个 Skill")、属性列举("可组织、可迭代")、问题表达("Skill 很火")、价值判断("工作标准")。
正确使用引号的场景:引用原文、核心术语定义(首次出现)、避免歧义、特殊概念区分。
检测标准:
必须检测的模式:
把.*讲得很清楚、把.*说得很明白更尖、更锐利、更深刻(评价性形容词修饰抽象概念)更硬的定义、更.*的.*(过度修饰的形容词结构)被.*卡住、被.*阻挡(被动句式+过度概括)一旦把视角从.*就更容易看清(视角转换程式化)更具体一点、更准确地说(AI式过渡语)改写:直接陈述内容,删除评价性修饰和过渡语。"被两件事卡住"→"两件事挡在路中间","更具体一点"→直接进入具体内容。
必须检测的模式:
它更像一种、更像一个.*它其实是、这里其实、其实是第二类天然会、天生就、自然而然就会更清楚、会更.*(过度使用的"会更"模式)就.*了、就.*能(过于绝对的断言)否定式断定性表述:
事实并不是这样、事情并不是这样、并不是.*而是、其实并不是改写方向:
模糊频次词(虚假普遍性):
经常、常常、常常会 — AI 用这些词制造"普遍现象"的假象很容易 + 抽象判断(如"讨论很容易变窄")— 模糊频次 + 模糊后果的组合评价性断语(客观让步姿态):
太绝对、太武断、话说得太死、说过头了、容易被反驳这个判断太X、这种说法太Y — AI 先立靶子再打倒的程式化让步改写对照:
| 原文 | 改写 | 说明 |
|---|---|---|
| 经常听到一个判断 | 最近几次都会碰到一个判断 | 具体频次替代模糊词 |
| 讨论很容易变窄 | 讨论就容易局限在产品层面 | 补充"窄在哪" |
| 这个判断太绝对,也容易被反驳 | 说 X,我不这么看 | 个人立场替代客观评价 |
去 AI 味的力度、容忍度和保护范围因场景而异。开始通读前,先判定本次属于哪类场景,并据此调整后续 Step 2-5 的力度与重点。若用户未指明,默认按“通用”处理。
| 场景 | 默认力度 | 重点扫描的污染类 | Protected Spans 宽度 |
|---|---|---|---|
| 法律文书(判决/意见/合同/代理词/法律意见书) | 克制 | 姿态污染 / 过程泄漏 / 格式污染 | 最宽 |
| 公众号·公开评论 | 激进 | 模板污染 / 节奏污染 / 语义稀释 | 标准 |
| 口语·即时回复(chat/status/站会) | 最小 | 谄媚 / 协作痕迹 | 标准 |
| 通用(未指明) | 按公众号力度 | 全类 | 标准 |
场景判定约束后续三件事:① 改写力度(克制/激进/最小);② Protected Spans 宽度(法律文书最宽,见 Step 1);③ 重点扫哪几类污染(其余污染类仍按默认处理,不跳过,只是优先级靠后)。法律文书场景下,正式语体、程序术语、固定程式表达默认保留,不当作 AI 味处理。
必须完整通读全文,理解核心观点、文章风格和上下文语境。不得仅通过正则/grep 匹配来检测——正则只能覆盖已知模式的精确形式,会遗漏大量语义等价但形式不同的变体。
通读时同步划定 Protected Spans(禁改项):标记必须原样保留、后续 Step 2-4 不得触碰的范围。默认覆盖:
判定原则:宁可多保留,不可误改。若某 Protected Span 表面像 AI 味(如公司全称带“有限公司”被误判为宣传性),仍保留原样,只在备注里提示用户复核。场景为“法律文书”时,Protected Spans 范围取最宽。
以 Agent 通读全文的方式识别 AI 化表述。前文的核心检测规则(§总则 + §一~§二)是参考框架,不是穷举清单。Agent 应当:
进入本步之前,先声明扫描范围:本次覆盖了哪些 §(§总则、§一、§二 的具体小节),本次未覆盖的 § 也明确列出。让用户一眼看到检测的边界在哪。
识别过程不得触碰 Step 1 划定的 Protected Spans:即使 Protected Span 内部出现疑似 AI 模式(对比句式、宣传语等),也不列入 finding、不改写;最多在交付备注里提示用户复核。
**粗体** 或 > 引用 中是 X。是 Y。是 Z。 / 生成 X,生成 Y,生成 Z / 先把 X。先把 Y。先把 Z。 / 我们要的是 X,是 Y,是 Z能不能 X?能不能 Y?能不能 Z? / 怎样 X,怎样 Y,怎样 Z / 如何 X,如何 Y越来越 真正 不只 等超过 2 次的词)禁止的做法:仅用 grep/正则匹配清单中的关键词,然后声称检测完成。正则匹配只能作为频次统计的辅助工具,不能替代通读理解。词汇层扫完不能宣布完成——必须再走一遍结构层扫描。
为什么结构层必须独立走:词汇层 flag(如「不是 X 而是 Y」「其实」「真正」)容易锚定,agent 容易把全部注意力放在词替换上。结构层 flag(连续问号、连续短段、连续虚词引导的并列)不会出现在词级 grep 结果里——必须按位置、按节奏、按并列项数单独扫一遍。词扫得再彻底,结构不扫等于没扫。
不是所有匹配都需要修改。判断标准:是否影响表达自然度、是否符合文章风格、是否有修辞目的。
核心原则:重新表述整个句子,不要只删除词汇或替换同义词。
错误(×):"它更像一种可维护的模块" → "这是一种可维护的模块"(只删词,结构没变)
正确(✓):"它更像一种可维护的模块" → "这种设计便于后续维护"(重构句子)
同义词替换是无效改写:把"窄"换成"局限"、把"小"换成"有限"、把"这不是"换成"那不是",句式和语气都没有变化,读者仍然能感受到 AI 味。必须在理解原句核心意思的前提下,换一种全新的表达结构。
| 原文 | 无效改写(×) | 有效改写(✓) | 说明 |
|---|---|---|---|
| 格局一开始就小了 | 格局一开始就窄了 | 讨论就没抓到重点 | 换了语义场,换了句式 |
| 这不是我理解的 AI | 那不是我关注的 | 我关注的角度不太一样 | 去掉否定宣言,换成个人立场 |
| 视野就窄了 | 视野就局限了 | 但只看到这些还不够 | 彻底换一种表达 |
| 你越X,越Y;越Y,越Z | 你越X就越Y,越Y就越Z | 理解工具,效率会先提上来。有了余量,输出自然就多了 | 长级联拆成短句 |
在去除 AI 化表述后,可选地注入个人风格特征。目标比例:技术准确性 60% / 个人化 40%。本步可选,纯技术/法律文书若无需个人化可跳过。
两条路径(按是否有作者样本选择):
reference/personal-style-guide.md 的"Voice Calibration 流程"提取 voice profile(七维度:句长分布 / 词选层级 / 段落开头 / 标点习惯 / 口头禅与过渡 / 观点密度 / 语气倾向),改写时按 profile 匹配。样本优先于下面的默认特征。reference/personal-style-guide.md"默认 voice"节。样本边界:只使用用户提供或确认可用于本次任务的作者样本。Voice Calibration 只学习表达特征,不冒充作者身份、不复制样本原句或高辨识短语、不把样本事实写进目标文本。若样本含敏感信息,只抽象成 voice profile,不在交付正文中复述。
默认正向特征(无样本时使用):
参考文件(读取以获取详细指南):
reference/personal-style-guide.md:Voice Calibration 流程 + 默认 voice 特征reference/expression-transformations.md:表达方式转化对照表reference/sentence-rhythm-guide.md:句子节奏指南reference/quality-scoring.md:质量评分系统必须作为最后一步执行。 AI 修改文本后往往会遗留英文标点,纯靠 LLM 提醒修正效果不可靠,因此使用脚本强制转换。
python3 scripts/fix_punctuation.py <文件路径>
脚本会自动处理:
" → 中文引号 ""(交替状态机), → ,、; → ;、? → ?、! → !: → :、() → (). → 。脚本会自动跳过以下区域不做转换:
--- 之间的元数据)![]()、[]())```、`)Step 4-6 完成后、交付用户前,按 reference/quality-scoring.md 的 5 维(自然度 / 节奏感 / 专业度 / 个性度 / 精炼度,总分 10)对最终文本评分:
评分时可用"直接度""信任读者"两个辅助视角定位扣分原因(见 reference/quality-scoring.md"作为交付门禁使用"节),不单独打分。评分过程与结果默认不写入交付正文,只在交付备注或用户要求时给出。
npx claudepluginhub cat-xierluo/legal-skills --plugin transcription-correctorRewrites Chinese articles to remove AI-generated patterns like template openings, cliché transitions, buzzwords, fake quotes, overused dashes, bullet stacking, and translationese. Supports diagnostic, light, deep, and final editing modes.
Detects and removes AI-generated writing patterns (puffery, vagueness, hollow significance) from any text. Use to make prose sound human-written.
Audits and rewrites content to remove AI writing patterns ("AI-isms"). Supports detect-only mode, file edit-in-place, voice profiles, and iterative refinement.