当前位置: 首页 > news >正文

GitHub爆火Skill三巨头实测:选错直接让AI代码精神分裂

文章目录

    • 前言
    • 先看数据:这周到底发生了什么
    • 三种体系,三种"性格"
      • 本质定位对比
    • mattpocock/skills:反" vibe-coding "斗士
        • 翻车现场一:意图错位
        • 翻车现场二:语言冗余
        • 翻车现场三:不可靠代码
        • 翻车现场四:架构退化
    • obra/superpowers:强迫症患者的天堂
    • anthropics/skills:官方的双面人生
    • Skill 凭啥比 Prompt 模板强十倍?
    • 到底怎么选?
      • 情况一:独立工程师,知道自己要啥
      • 情况二:团队纪律差,代码像 spaghetti
      • 情况三:天天跟 PDF/Word/Excel/PPT 打交道
      • 情况四:我全都要
    • 混装三大坑,踩过的人才懂
    • 写在最后

P.S. 无意间发现了一个巨牛的人工智能教程,非常通俗易懂,对AI感兴趣的朋友强烈推荐去看看,传送门https://blog.csdn.net/HHX_01

前言

上周我打开 GitHub Trending,盯着屏幕看了五分钟,以为自己老花眼提前了二十年。

榜单前三全是带 “skill” 的仓库,名字长得像三胞胎——mattpocock/skillsobra/superpowersanthropics/skills。合计新增33,968颗星星。什么概念?相当于你五年攒的私房钱,七天内被老婆一次性发现。

我转头问隔壁工位的兄弟:“这三个装哪个?” 他头都没抬:“都装上呗。”

好家伙,这回答熟悉不?就像问女朋友吃火锅还是烧烤,她说"都要"——最后你买单的时候才知道,"都要"是这个世界上成本最高的两个字。

这三个仓库,一个像工具箱,一个像驾校教练,一个像官方说明书。你把它们当同类塞进.claude目录,就像把川菜师傅、粤菜师傅和日料师傅关在一个厨房——最后端出来的是麻婆豆腐寿司,吃完拉肚子你怪谁?

我做了十年后端,见过太多团队把 Spring、Spring Boot、Spring Cloud 当同一个东西装,结果依赖冲突到想辞职。今天 Skill 生态正在重演这个故事,而且节奏快十倍。

先看数据:这周到底发生了什么

我挨个扒了这三个仓库的底裤,数据如下:

mattpocock/skills:97.5k stars,本周怒涨 +18,368。作者 Matt Pocock 是 TypeScript 教程界的顶流,六万订阅的 newsletter,相当于技术圈的李佳琦。他把自己.claude目录里的私货开源,三个月从 0 干到快十万星——这涨粉速度,比我公众号三年攒的粉丝还多。我怀疑他睡觉都在涨星,而我睡觉只长肚子。

obra/superpowers:201k stars,本周 +10,851。老江湖了,已经迭代到 v5.1.0,今年 1 月被 Anthropic 官方 Plugin Marketplace 收编。一个第三方框架被原厂招安,这在 Claude 生态里属于"从梁山泊招安进朝廷",头一回。宋江要是知道,估计得羡慕哭。

anthropics/skills:138k stars,本周 +4,749。Anthropic 亲儿子,README 上写着"仅供教育演示"——但背地里驱动着 Claude.ai 的文档生成功能。这操作就像老师发的练习册说"仅供参考",结果考试就考这个。你品,你细品。

但星星再多也掩盖不了一个事实:这三个仓库的工程哲学完全不同。混着装,等于在你的 AI 助理脑子里塞了三个互相打架的人格。今天温柔体贴,明天强迫症发作,后天变成说明书复读机——这谁受得了?

三种体系,三种"性格"

我用做了十年后端的经验,给你一个最接地气的类比:

mattpocock/skillsApache Commons——工具箱,你想用哪个扳手自己拿。obra/superpowersSpring Framework——驾校教练,不按他的方法打方向盘,他能唠叨到你耳鸣。anthropics/skillsJDK 自带的 java.sql——官方说明书,说是教你修水管,结果发现自来水公司自己也在用这套。

三者混着用技术上可以,但前提是你清楚每个的边界。就像你不能把洗洁精、洗衣液和洗发水当同一个东西往洗衣机里倒——别问我怎么知道的,上次我衣服洗出来全是泡泡,穿了三天还在冒泡。

本质定位对比

Library(工具集合):手动触发,控制权在你手里。就像你家的工具箱,想用螺丝刀自己拿。适合那种"我知道我要啥,别教我做事"的工程师。

Framework(方法论框架):自动激活,控制权在框架手里。就像驾校教练,坐副驾上逼你先看后视镜再打火。适合那种"我不自律,需要有人拿鞭子抽我"的团队。

Reference(官方参考实现):按需调用,控制权在 Claude 自己。就像你爸写的家电说明书,他说"仅供参考",但坏了还得按他的方法修。适合那种"我想偷师官方,但不想被官方管"的聪明人。

mattpocock/skills:反" vibe-coding "斗士

Matt Pocock 在 README 里写"Skills for Real Engineers"——翻译成人话就是:“别指望 AI 自己搞定一切,那不靠谱。”

他总结了 AI 编程的四大翻车现场,每个都精准到让我怀疑他在我工位装了摄像头,还是带夜视功能的那种:

翻车现场一:意图错位

AI 没搞清楚你要啥就动手了。就像你跟女朋友说"随便吃点",她带你去吃她想吃的那家,最后你看着账单欲哭无泪。你说"做个登录功能",AI 给你做了个注册登录找回密码改密码全套,还附赠了一个用户画像分析——你只想煮碗面,它给你开了个餐厅。

对应技能:/grill-me——先把你需求烤熟了再问,防止 AI 一上来就瞎写。这个技能名起得好,"grill"就是烤,烤到你外焦里嫩,需求才算真正清楚。

翻车现场二:语言冗余

AI 每次用一长串自然语言绕弯子描述,token 飙升,信息密度比我的周报还低。就像你写需求文档写了两千字,开发看完说"你就说要做个按钮呗"。AI 也一样,绕了八百字描述"我要实现一个用户认证模块",其实四个字就够了:“做个登录”。

对应技能:CONTEXT.md——建立共享词汇表,让 AI 说人话。不然你跟 AI 聊天,感觉像在和哲学家对话,每个字都认识,连在一起不知道在说啥。

翻车现场三:不可靠代码

没有 TDD 红绿循环,AI 自信地写出 bug,然后自信地告诉你"没问题"。就像让实习生写代码,他说"稳了",上线后客服电话被打爆。AI 写 bug 的态度比老程序员还笃定,至少老程序员会心虚地说"应该没问题吧",AI 直接说"已完成,质量优良"——这自信,我服了。

对应技能:/tdd/diagnose——先写测试再写代码,bug 露头就打。相当于给 AI 装了个测谎仪,说谎就电一下。

翻车现场四:架构退化

短期 KPI 驱动下,代码堆成屎山,三个月后维护成本爆炸。就像你租房,第一个月很整洁,三个月后衣柜里长出了不明生物。AI 也一样,第一周代码结构清晰,三个月后变成意大利面条,还是加了双倍奶酪的那种。

对应技能:/zoom-out——定期把 AI 拉回来,让它看看整体架构,别只顾着砌砖忘了盖楼。不然三个月后你会发现,楼是盖起来了,但门开在天花板上。

Matt 的哲学很简单:把 AI 当成一个不稳定的分布式节点来管理。这比喻绝了——AI 就像你那个远程办公的印度同事,时区不对、网络不稳、理解力成谜,但你还得跟他协作。至少 AI 不会突然请假去参加婚礼,这点比真人强。

obra/superpowers:强迫症患者的天堂

如果说 mattpocock 是"给你工具,你自己玩",那 superpowers 就是"按我的规矩来,不然滚蛋"。这仓库有几个特别"轴"的地方:

第一,拒绝外部贡献。贡献指南里直接写:“我们不接受新的 skill 提案。” 这跟 mattpocock 鼓励 fork 完全相反。就像那家网红餐厅,“我们厨师说了算,顾客不许点菜。” 你提 PR? maintainer politely 拒绝你,礼貌但坚决,像分手时说"你是个好人"。

第二,跨 8 个 AI 编程平台原生支持。Claude Code、Cursor、Codex、GitHub Copilot CLI 全都能用。就像你买的充电器,苹果安卓华为都能充——但代价是只能用纯 markdown,不能搞任何平台特有花活。相当于你穿了一身优衣库,百搭但不出彩,去婚礼和葬礼都能穿。

第三,七阶段强制工作流。从头脑风暴到写规格说明到测试驱动到代码审查,一步都不能跳。适合谁?适合那些团队工程纪律差、代码像 spaghetti 的团队——相当于给幼儿园配了个班主任,手把手教排队上厕所。不适合谁?做快速原型的独立开发者。你只想煮碗泡面,它逼你先熬高汤,等你吃完面都坨了,汤还没烧开。

我用 superpowers 的时候,感觉像被妈妈盯着写作业。每一步都要确认,每个改动都要解释。效率确实高了,但快乐确实没了。就像健身,你知道对你好,但过程痛苦。

anthropics/skills:官方的双面人生

Anthropic 亲儿子的操作最骚——它同时演两个角色,而且演技比某些流量明星好。

表面上,README 写着"仅供演示和教育目的",一副"我就是个教具"的 humble 姿态。但背地里,pdfdocxxlsxpptx这四个 skill 是 Claude.ai 文档生成的生产级实现。就像博物馆说"欢迎参观",但"禁止触摸"——最值钱的部分用 source-available 护着,外围用开源做生态。

这套路 Redis 和 Elasticsearch 都玩过:核心改 License,社区版继续开源。商业护城河, Anthropic 玩得明明白白。你以为是来做慈善的,结果发现是来卖保险的——先看你的需求,再推销产品。

所以别把它当主力 Skill 源。官方自己都说了是"教具",你非要拿教具上战场,输了能怪谁?就像你拿玩具水枪去参加真人 CS,被打成筛子还怪枪不好。

Skill 凭啥比 Prompt 模板强十倍?

这个问题很多人答不到点子上。说什么"可复用"“结构化”——都对,但都不是根因。就像问火锅为啥好吃,你说"因为里面有肉"——废话,但没说清楚为啥比烤肉强。

真正的根因是触发权

Prompt 模板就像你手动给 AI 喂饭:你记得有这个模板,需要时复制粘贴。模板再好,用不用决定权在你手里——而人的记忆力,在周五下午五点基本归零。你上周刚写的模板,这周就忘在哪个文件夹了,找半天找不到,最后干脆重新写。

Skill 就像给 AI 装了个自动驾驶:你写好descriptionwhen_to_useClaude 自己判断"现在该用这个 skill 了"。决定权从你手里交到了 AI 手里。这相当于什么?相当于你请了个管家,以前是你每天提醒他"记得浇花",现在是他自己看土壤湿度,干了就浇。你只管喝咖啡刷手机。

做后端的人对这个特别敏感——这本质上就是Eureka/Consul 在 AI Agent 上的对应物。每个 Skill 的 description 是服务注册标签,Claude 的触发逻辑是服务发现评分,when_to_use 是路由策略。技术人一听就懂,非技术人一听就困,没关系,你就记住一句话:AI 自己会找工具了,不用你天天喊。

所以 superpowers 反复强调"description 要写到触发条件精确"——因为 description 模糊的话,Claude 在两个 skill 之间会犹豫甚至误判。就像你同时喊"老公"和"宝贝",你男朋友不知道答应哪个,最后两个都不答应,装没听见。

到底怎么选?

好了,段子讲完了,说点正经的。按我实际用了一个月的经验,给你一个决策树,比算命先生还准:

情况一:独立工程师,知道自己要啥

主力装mattpocock/skills,按需挑 4-5 个顺手的。它给你自由不绑你流程,就像单身汉自己做饭,想放多少辣椒放多少,没人管你。再补一个anthropics/skill-creator,方便你自己写 skill。相当于买了套工具,再学个钳工证。

情况二:团队纪律差,代码像 spaghetti

主力装obra/superpowers。七阶段流程是"外置的工程文化",逼团队先写测试再写代码。就像幼儿园老师带着排队上厕所,虽然烦,但管用。不然你的代码库会变成野生动物园,什么奇珍异兽都有。

情况三:天天跟 PDF/Word/Excel/PPT 打交道

anthropics/skills的 document-skills。这是唯一跟 Claude.ai 同源的生产级文档处理能力,官方出品,虽然傲娇但靠谱。就像你找官方客服,排队两小时,但问题能解决。比找第三方客服"亲,在的呢,稍等哦"然后消失强多了。

情况四:我全都要

可以,但按优先级:先装 superpowers 打底(如果你需要强约束),再精选 mattpocock 的 4-5 个 skill 补充,最后按需装 document-skills。千万别全装——我试过装 30 多个,Claude 在/tddtest-driven-development之间反复横跳,行为比我的情绪还不稳定。今天写测试,明天不写,后天写一半——代码看了都精神分裂。

混装三大坑,踩过的人才懂

坑一:Description 冲突。mattpocock 和 superpowers 都有"代码审查"“测试驱动"相关的 skill,描述写得像,Claude 会随机选一个。就像你有两个女朋友都叫"宝贝”,喊一嗓子不知道谁答应——别问我为什么有两个女朋友,这是比喻。

解决:打开 SKILL.md 对比 description,保留更精确的那个,删掉另一个。不要心软,该删就删,就像删前任照片,犹豫就会败北。

坑二:Plugin 重复注册。superpowers 现在进了官方 Marketplace,如果你之前用旧路径装过,现在又装一遍,会存在两份副本。就像你微信里存了同一个同事的两个号,发消息都不知道发哪个,最后发到了工作群,还是吐槽老板的内容。

解决:/plugin list查一下,旧路径的卸载,只留官方版。简单,但很多人懒得做,就像很多人懒得清理手机相册,直到提示存储空间不足。

坑三:把 anthropics 当主力。官方自己都说是"教具",你非要拿它上战场。就像你拿玩具水枪去参加真人 CS,被打成筛子还怪枪不好。枪没问题,是你的问题。

解决:把它当工具书,需要的时候查skill-creator的写法,用 document-skills 处理文档,别当工作流主力。主力还得靠 mattpocock 或 superpowers,anthropics 是备胎,而且是"仅供参考"的那种备胎。

写在最后

说到底,这波 Skill 生态炸榜不是偶然。它解决的是 prompt 模板永远解决不了的问题:让 AI 在"该出手的时候自己出手"。以前是你追着 AI 喂饭,现在是 AI 自己饿了会找冰箱。

Library 给你工具的自由,Framework 给你纪律的强制,Reference 给你官方的标杆——每一种都对应一类工程师的痛点。没有最好的,只有最适合的。就像找对象,没有完美的人,只有最能忍你的那个。

我现在用的是 mattpocock 主力 + superpowers 的 brainstorming 单个 skill + anthropics 的 skill-creator。三个仓库各取一部分,没有谁能完全替代谁。就像我的衣柜,优衣库、Zara、淘宝货混着穿,舒服就行。

你身边有同事还在问"这三个装哪个"的,把这篇甩给他。省他自己踩坑一个月,你收获一顿火锅,不亏。如果他看完还问,那就让他三个都装,等他踩了坑再回来找你,到时候火锅升级成烤肉。

P.S. 无意间发现了一个巨牛的人工智能教程,非常通俗易懂,对AI感兴趣的朋友强烈推荐去看看,传送门https://blog.csdn.net/HHX_01

http://www.cnnetsun.cn/news/3001688.html

相关文章:

  • 遗传算法实战:编码策略、适应度设计与早熟诊断
  • NanaZip完整指南:为什么这款Windows压缩工具值得你立即尝试
  • 终极指南:如何在Windows 11 LTSC系统中轻松安装Microsoft Store应用商店
  • TestSprite 全自动化 AI Web 测试详解——从原理到测试报告完整实战指南
  • Boss直聘批量投递工具:3步让你每天多投50份简历
  • 权威测评:2026年不容错过的专业AI论文软件
  • 回归模型评估指标实战指南:从面试陷阱到工业级KPI诊断
  • 3分钟掌握:B站视频下载工具的核心技术与实战指南
  • 5分钟掌握跨平台资源下载工具:你的智能资源嗅探器终极指南
  • 为什么你的浏览器需要一个本地视频下载扩展?
  • EdgeRemover:Windows系统上彻底告别微软Edge的终极解决方案
  • 算法竞赛实战复盘:从读题策略到代码模板的系统性备赛方法
  • 基于Pytest+Requests+Allure的接口自动化测试框架实战指南
  • 多维聚合实战:维度建模、度量聚合与数据变形三步法
  • Claude语义压缩层蒸发:架构级黑箱化与可控性重构指南
  • 魔兽争霸3性能重生:如何用开源工具让经典游戏在现代硬件上焕发新生
  • KMS_VL_ALL_AIO:5分钟搞定Windows和Office永久激活终极方案
  • 从经典到粘性解:非一致椭圆方程Harnack不等式理论与数值实践
  • Prompt Engineering 与 Agent 工作流:从单次调用到自主决策的编排架构
  • 041、继承的正确打开方式:单继承、多重继承、Mixin 模式与钻石问题
  • AI应用安全部署:3步实现环境变量与密钥管理,告别硬编码风险
  • VMware桥接不上网?别重装!资深架构师压箱底的7个诊断命令清单(含Wireshark抓包黄金组合)
  • AI协作能力图谱:构建提问结构、反馈机制、结果校验与任务拆解四大接口
  • 防爆门气密性检测 + 抗爆冲击波试验全套技术验收要点
  • vMotion迁移突然卡死?揭秘底层TCP重传风暴与NUMA绑定冲突(仅0.3%工程师掌握的底层日志分析法)
  • 代谢组学数据分析新选择:MetaboAnalystR 4.0 完全指南 让复杂代谢组学分析变得简单
  • roop-unleashed终极指南:5分钟掌握专业级AI换脸技术
  • AI可论证性实战指南:从黑箱厨师到交作业工程师
  • 手机浏览器零代码运行Gemma-4B:WASM+AWQ实战指南
  • Hello ROCm day8-14小项目:ai智能评论分析师