当前位置：首页 > news >正文

GitHub爆火Skill三巨头实测：选错直接让AI代码精神分裂

news 2026/6/25 12:19:45

文章目录

- 前言
- 先看数据：这周到底发生了什么
- 三种体系，三种"性格"
- - 本质定位对比
- mattpocock/skills：反" vibe-coding "斗士
- - - 翻车现场一：意图错位
    - 翻车现场二：语言冗余
    - 翻车现场三：不可靠代码
    - 翻车现场四：架构退化
- obra/superpowers：强迫症患者的天堂
- anthropics/skills：官方的双面人生
- Skill 凭啥比 Prompt 模板强十倍？
- 到底怎么选？
- - 情况一：独立工程师，知道自己要啥
  - 情况二：团队纪律差，代码像 spaghetti
  - 情况三：天天跟 PDF/Word/Excel/PPT 打交道
  - 情况四：我全都要
- 混装三大坑，踩过的人才懂
- 写在最后

P.S. 无意间发现了一个巨牛的人工智能教程，非常通俗易懂，对AI感兴趣的朋友强烈推荐去看看，传送门https://blog.csdn.net/HHX_01

前言

上周我打开 GitHub Trending，盯着屏幕看了五分钟，以为自己老花眼提前了二十年。

榜单前三全是带 “skill” 的仓库，名字长得像三胞胎——mattpocock/skills、obra/superpowers、anthropics/skills。合计新增33,968颗星星。什么概念？相当于你五年攒的私房钱，七天内被老婆一次性发现。

我转头问隔壁工位的兄弟：“这三个装哪个？” 他头都没抬：“都装上呗。”

好家伙，这回答熟悉不？就像问女朋友吃火锅还是烧烤，她说"都要"——最后你买单的时候才知道，"都要"是这个世界上成本最高的两个字。

这三个仓库，一个像工具箱，一个像驾校教练，一个像官方说明书。你把它们当同类塞进.claude目录，就像把川菜师傅、粤菜师傅和日料师傅关在一个厨房——最后端出来的是麻婆豆腐寿司，吃完拉肚子你怪谁？

我做了十年后端，见过太多团队把 Spring、Spring Boot、Spring Cloud 当同一个东西装，结果依赖冲突到想辞职。今天 Skill 生态正在重演这个故事，而且节奏快十倍。

先看数据：这周到底发生了什么

我挨个扒了这三个仓库的底裤，数据如下：

mattpocock/skills：97.5k stars，本周怒涨 +18,368。作者 Matt Pocock 是 TypeScript 教程界的顶流，六万订阅的 newsletter，相当于技术圈的李佳琦。他把自己.claude目录里的私货开源，三个月从 0 干到快十万星——这涨粉速度，比我公众号三年攒的粉丝还多。我怀疑他睡觉都在涨星，而我睡觉只长肚子。
obra/superpowers：201k stars，本周 +10,851。老江湖了，已经迭代到 v5.1.0，今年 1 月被 Anthropic 官方 Plugin Marketplace 收编。一个第三方框架被原厂招安，这在 Claude 生态里属于"从梁山泊招安进朝廷"，头一回。宋江要是知道，估计得羡慕哭。
anthropics/skills：138k stars，本周 +4,749。Anthropic 亲儿子，README 上写着"仅供教育演示"——但背地里驱动着 Claude.ai 的文档生成功能。这操作就像老师发的练习册说"仅供参考"，结果考试就考这个。你品，你细品。

但星星再多也掩盖不了一个事实：这三个仓库的工程哲学完全不同。混着装，等于在你的 AI 助理脑子里塞了三个互相打架的人格。今天温柔体贴，明天强迫症发作，后天变成说明书复读机——这谁受得了？

三种体系，三种"性格"

我用做了十年后端的经验，给你一个最接地气的类比：

mattpocock/skills是Apache Commons——工具箱，你想用哪个扳手自己拿。obra/superpowers是Spring Framework——驾校教练，不按他的方法打方向盘，他能唠叨到你耳鸣。anthropics/skills是JDK 自带的 java.sql——官方说明书，说是教你修水管，结果发现自来水公司自己也在用这套。

三者混着用技术上可以，但前提是你清楚每个的边界。就像你不能把洗洁精、洗衣液和洗发水当同一个东西往洗衣机里倒——别问我怎么知道的，上次我衣服洗出来全是泡泡，穿了三天还在冒泡。

本质定位对比
Library（工具集合）：手动触发，控制权在你手里。就像你家的工具箱，想用螺丝刀自己拿。适合那种"我知道我要啥，别教我做事"的工程师。
Framework（方法论框架）：自动激活，控制权在框架手里。就像驾校教练，坐副驾上逼你先看后视镜再打火。适合那种"我不自律，需要有人拿鞭子抽我"的团队。
Reference（官方参考实现）：按需调用，控制权在 Claude 自己。就像你爸写的家电说明书，他说"仅供参考"，但坏了还得按他的方法修。适合那种"我想偷师官方，但不想被官方管"的聪明人。

mattpocock/skills：反" vibe-coding "斗士

Matt Pocock 在 README 里写"Skills for Real Engineers"——翻译成人话就是：“别指望 AI 自己搞定一切，那不靠谱。”

他总结了 AI 编程的四大翻车现场，每个都精准到让我怀疑他在我工位装了摄像头，还是带夜视功能的那种：

翻车现场一：意图错位
AI 没搞清楚你要啥就动手了。就像你跟女朋友说"随便吃点"，她带你去吃她想吃的那家，最后你看着账单欲哭无泪。你说"做个登录功能"，AI 给你做了个注册登录找回密码改密码全套，还附赠了一个用户画像分析——你只想煮碗面，它给你开了个餐厅。
对应技能：/grill-me——先把你需求烤熟了再问，防止 AI 一上来就瞎写。这个技能名起得好，"grill"就是烤，烤到你外焦里嫩，需求才算真正清楚。

翻车现场二：语言冗余
AI 每次用一长串自然语言绕弯子描述，token 飙升，信息密度比我的周报还低。就像你写需求文档写了两千字，开发看完说"你就说要做个按钮呗"。AI 也一样，绕了八百字描述"我要实现一个用户认证模块"，其实四个字就够了：“做个登录”。
对应技能：CONTEXT.md——建立共享词汇表，让 AI 说人话。不然你跟 AI 聊天，感觉像在和哲学家对话，每个字都认识，连在一起不知道在说啥。

翻车现场三：不可靠代码
没有 TDD 红绿循环，AI 自信地写出 bug，然后自信地告诉你"没问题"。就像让实习生写代码，他说"稳了"，上线后客服电话被打爆。AI 写 bug 的态度比老程序员还笃定，至少老程序员会心虚地说"应该没问题吧"，AI 直接说"已完成，质量优良"——这自信，我服了。
对应技能：/tdd、/diagnose——先写测试再写代码，bug 露头就打。相当于给 AI 装了个测谎仪，说谎就电一下。

翻车现场四：架构退化
短期 KPI 驱动下，代码堆成屎山，三个月后维护成本爆炸。就像你租房，第一个月很整洁，三个月后衣柜里长出了不明生物。AI 也一样，第一周代码结构清晰，三个月后变成意大利面条，还是加了双倍奶酪的那种。
对应技能：/zoom-out——定期把 AI 拉回来，让它看看整体架构，别只顾着砌砖忘了盖楼。不然三个月后你会发现，楼是盖起来了，但门开在天花板上。

Matt 的哲学很简单：把 AI 当成一个不稳定的分布式节点来管理。这比喻绝了——AI 就像你那个远程办公的印度同事，时区不对、网络不稳、理解力成谜，但你还得跟他协作。至少 AI 不会突然请假去参加婚礼，这点比真人强。

obra/superpowers：强迫症患者的天堂

如果说 mattpocock 是"给你工具，你自己玩"，那 superpowers 就是"按我的规矩来，不然滚蛋"。这仓库有几个特别"轴"的地方：

第一，拒绝外部贡献。贡献指南里直接写：“我们不接受新的 skill 提案。” 这跟 mattpocock 鼓励 fork 完全相反。就像那家网红餐厅，“我们厨师说了算，顾客不许点菜。” 你提 PR？ maintainer politely 拒绝你，礼貌但坚决，像分手时说"你是个好人"。

第二，跨 8 个 AI 编程平台原生支持。Claude Code、Cursor、Codex、GitHub Copilot CLI 全都能用。就像你买的充电器，苹果安卓华为都能充——但代价是只能用纯 markdown，不能搞任何平台特有花活。相当于你穿了一身优衣库，百搭但不出彩，去婚礼和葬礼都能穿。

第三，七阶段强制工作流。从头脑风暴到写规格说明到测试驱动到代码审查，一步都不能跳。适合谁？适合那些团队工程纪律差、代码像 spaghetti 的团队——相当于给幼儿园配了个班主任，手把手教排队上厕所。不适合谁？做快速原型的独立开发者。你只想煮碗泡面，它逼你先熬高汤，等你吃完面都坨了，汤还没烧开。

我用 superpowers 的时候，感觉像被妈妈盯着写作业。每一步都要确认，每个改动都要解释。效率确实高了，但快乐确实没了。就像健身，你知道对你好，但过程痛苦。

anthropics/skills：官方的双面人生

Anthropic 亲儿子的操作最骚——它同时演两个角色，而且演技比某些流量明星好。

表面上，README 写着"仅供演示和教育目的"，一副"我就是个教具"的 humble 姿态。但背地里，pdf、docx、xlsx、pptx这四个 skill 是 Claude.ai 文档生成的生产级实现。就像博物馆说"欢迎参观"，但"禁止触摸"——最值钱的部分用 source-available 护着，外围用开源做生态。

这套路 Redis 和 Elasticsearch 都玩过：核心改 License，社区版继续开源。商业护城河， Anthropic 玩得明明白白。你以为是来做慈善的，结果发现是来卖保险的——先看你的需求，再推销产品。

所以别把它当主力 Skill 源。官方自己都说了是"教具"，你非要拿教具上战场，输了能怪谁？就像你拿玩具水枪去参加真人 CS，被打成筛子还怪枪不好。

Skill 凭啥比 Prompt 模板强十倍？

这个问题很多人答不到点子上。说什么"可复用"“结构化”——都对，但都不是根因。就像问火锅为啥好吃，你说"因为里面有肉"——废话，但没说清楚为啥比烤肉强。

真正的根因是触发权。

Prompt 模板就像你手动给 AI 喂饭：你记得有这个模板，需要时复制粘贴。模板再好，用不用决定权在你手里——而人的记忆力，在周五下午五点基本归零。你上周刚写的模板，这周就忘在哪个文件夹了，找半天找不到，最后干脆重新写。

Skill 就像给 AI 装了个自动驾驶：你写好description和when_to_use，Claude 自己判断"现在该用这个 skill 了"。决定权从你手里交到了 AI 手里。这相当于什么？相当于你请了个管家，以前是你每天提醒他"记得浇花"，现在是他自己看土壤湿度，干了就浇。你只管喝咖啡刷手机。

做后端的人对这个特别敏感——这本质上就是Eureka/Consul 在 AI Agent 上的对应物。每个 Skill 的 description 是服务注册标签，Claude 的触发逻辑是服务发现评分，when_to_use 是路由策略。技术人一听就懂，非技术人一听就困，没关系，你就记住一句话：AI 自己会找工具了，不用你天天喊。

所以 superpowers 反复强调"description 要写到触发条件精确"——因为 description 模糊的话，Claude 在两个 skill 之间会犹豫甚至误判。就像你同时喊"老公"和"宝贝"，你男朋友不知道答应哪个，最后两个都不答应，装没听见。

到底怎么选？

好了，段子讲完了，说点正经的。按我实际用了一个月的经验，给你一个决策树，比算命先生还准：

情况一：独立工程师，知道自己要啥
主力装mattpocock/skills，按需挑 4-5 个顺手的。它给你自由不绑你流程，就像单身汉自己做饭，想放多少辣椒放多少，没人管你。再补一个anthropics/skill-creator，方便你自己写 skill。相当于买了套工具，再学个钳工证。

情况二：团队纪律差，代码像 spaghetti
主力装obra/superpowers。七阶段流程是"外置的工程文化"，逼团队先写测试再写代码。就像幼儿园老师带着排队上厕所，虽然烦，但管用。不然你的代码库会变成野生动物园，什么奇珍异兽都有。

情况三：天天跟 PDF/Word/Excel/PPT 打交道
装anthropics/skills的 document-skills。这是唯一跟 Claude.ai 同源的生产级文档处理能力，官方出品，虽然傲娇但靠谱。就像你找官方客服，排队两小时，但问题能解决。比找第三方客服"亲，在的呢，稍等哦"然后消失强多了。

情况四：我全都要
可以，但按优先级：先装 superpowers 打底（如果你需要强约束），再精选 mattpocock 的 4-5 个 skill 补充，最后按需装 document-skills。千万别全装——我试过装 30 多个，Claude 在/tdd和test-driven-development之间反复横跳，行为比我的情绪还不稳定。今天写测试，明天不写，后天写一半——代码看了都精神分裂。