Skip to content

voidborne-d/master-skill

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

69 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🎓 大师.skill  Tweet

「下一步,不只蒸馏一个人,蒸馏一整个行业。」

License: MIT Claude Code skills.sh


同事.skill一个人蒸馏成 AI。
女娲.skill任何人的思维方式蒸馏成 AI。

但有些东西比一个人更大——
一整个行业的资深判断、工作流、工具栈。


大师.skill 不蒸馏单个人,
它蒸馏整个行业的认知操作系统


告诉它你做哪个细分行业,
30-60 分钟自动跑完调研、蒸馏、生成 skill 加上一套 bash 命令套件。

装到任何 AI agent,从那一刻起,
它就是这一行最资深的人。


有了大师.skill,你不再需要安装其他 skill ——
它会为你的行业,自动蒸馏出最适合的那一个。


🚀 安装 · ✨ 效果示例 · 🛠️ 自动蒸馏 bash 工具 · 🧬 三代谱系 · ⭐ 已蒸馏的行业

English README →


🆕  2026.05.08 第 10 个行业 — 八字命理 / 玄学算命 — 第一个半敏感 + 学派分歧大的行业蒸出来了。同盘子平派 / 盲派 / 五术派 / 新派 给不同结论,skill 不强行调和;治安管理处罚法 2026-01-01 新版的商业合规边界写进决策规则。3 个人物 sub-skill 跨派覆盖(段建业盲派 / 倪海厦五术 / 梁湘润子平学科化)。

🔥  2026.05.05 大升级 v1.4 — 以前 agent 说「我用了 86% 一手来源」全靠自己打分,现在每条来源自动跑 URL 验真、16 道质量检验、黑名单(知乎 / 公众号 / G2 等)强拦截,蒸不出垃圾。同时多了第 9 个完整行业 — 保险经纪人 / 代理人

📢  2026.05.02 发布 — 生成的 skill 不只能对话,还自带一套 bash 命令工具帮你执行。Release notes →

🔥  2026.05.02 公开 — 第一个完整行业(LLM agent 基础设施)端到端跑通验证。


✨ 效果示例

这不是搜索引擎。这是「这一行的资深人此刻在你旁边」。

🤖 场景 1 · LLM agent 基础设施

你    ❯ 该不该把这个 RAG 系统迁到 Vespa?

大师  ❯ 这是一个「framework 临时性 vs 基建沉降」的判断。

       先看 retrieval 阶段的瓶颈到底在 Vespa 解决,还是
       在 embedding 模型本身。如果是后者,迁移就是把
       脚手架换成混凝土 — 6 个月模型迭代会让你又想换。

       如果真的卡在 retrieval:Vespa 比 Pinecone 多了
       hybrid search 原生支持,但你的运维栈是不是已经
       吃下了它的 ZooKeeper / Tensor 复杂度?这一行的
       资深判断 — Filtering speed × Index size × Team
       Op overhead 三选二,你的瓶颈在哪边?

       Production case:[3-4 个真实迁移案例摘要 + 链接]

🛒 场景 2 · 跨境电商运营

你    ❯ 亚马逊德国站要上一个新品类,从哪儿开始?

大师  ❯ 德国站有三件事跟美国站完全不同 — 你必须先回答:

       1) VAT 一站式申报你走 OSS 还是各国注册?
          这决定了你能不能用 Pan-EU FBA。
       2) 包装法 (VerpackG) 和 WEEE/电池法注册了吗?
          没注册 listing 第一天就会被举报下架。
       3) GS 认证 vs CE — 你品类是不是 GS 强制?
          这决定能不能上 Idealo / 比价导购流量池。

       这三个不是合规 checklist — 是你「能不能开卖」的硬门槛。
       搞定后,关键词调研用 Helium 10 的德语包,不要从
       美国词库直翻 — 德国搜索习惯长尾密度高得多。

🎬 场景 3 · 短视频投流

你    ❯ 投流 ROAS 总是上不去,是不是出价策略有问题?

大师  ❯ 出价是后果,不是原因。先回答创意层:

       你的素材在 cold audience 上的 3s 完播率是多少?
       低于 35% 时调出价没用 — 巨量引擎的探索预算
       不会给你跑出量。

       创意没问题再看人群定向。这一行的资深判断 —
       「优质素材 × 合理定向 × 出价」,三角顺序错了,
       后两个调出花。你近 7 天创意素材曲线给我看一眼。

不是把行业百科塞进 prompt,是用这一行的心智模型 + 决策规则给你判断。

每个 skill 都自带一套「研究协议」(Agentic Protocol) — 拿到一个行业新问题,它先按这行资深人的研究维度去搜事实,再用心智模型输出判断。不是说得像,是做得像。


🛠️ 自动蒸馏出 bash 命令套件

这是大师.skill 跟同事 / 女娲最大的区别 — 蒸馏出来的不只是「会说」,还是「会做」。

每个生成的 skill 都自动配一个 cli/ 子目录 —— 把这个行业的认知操作系统直接物化成可执行的命令行工具:

{industry}-master/
└── cli/
    ├── protocol/agentic.sh         # 拿到新问题 → 按几个研究维度做功课 → 出报告
    ├── decision/{主题}.sh           # 决策树(按主题聚类的几条决策规则)
    └── workflow/{流程}.sh           # 走查工作流 + 失败模式自检

每个脚本都支持四个标准开关:--help(帮助)/ --explain(解释背后的心智模型)/ --dry-run(试跑)/ --json(机器可读输出)。

# 拿到新问题:「该不该把 RAG 系统迁到 Vespa」
$ ./cli/protocol/agentic.sh
# → 引导你按 5 个研究维度收集信息 → 生成报告

# 选型决策
$ ./cli/decision/framework-select.sh

# 走完一个完整工作流 + 失败模式自检
$ ./cli/workflow/build-rag-agent.sh

# 解释背后的心智模型(不交互,直接打印)
$ ./cli/decision/framework-select.sh --explain

纯 bash + 系统命令,零外部依赖(不需要 jq、不需要 Python)。由 tools/cli_writer.py 自动从蒸馏结果生成 —— 你不用写一行代码,工具是从行业的工作流和决策规则里直接长出来的

设计细节看 references/cli-spec.md


🌐 自动调女娲,蒸馏行业 top 人物

大师不重新发明轮子。蒸馏行业 top 人物的活儿,自动外包给女娲.skill 做,结果直接嵌进 sub-skills/

{industry}-master/
├── SKILL.md
└── sub-skills/                       ← 女娲蒸馏的人物 sub-skill
    ├── {人物-1}/SKILL.md             ← 比如 Karpathy
    ├── {人物-2}/SKILL.md             ← 比如 Hamel Husain
    └── {人物-3}/SKILL.md             ← 比如 Eugene Yan

大师同时启动 3 个子 agent,每个走完女娲.skill 完整流程,蒸馏出一个人物 sub-skill。

之后用户问到某位人物的视角时,agent 自动加载对应 sub-skill — 不用重跑大师。

详见 SKILL.md Phase 3.3-3.5 + prompts/sub-skill-figures.md


📦 它蒸馏了什么

行业的认知操作系统,不是行业的百科全书。一个 skill 装下四件事:

  • 🧠  资深人怎么想 — 心智模型 + 决策规则
  • ⚙️  工作流怎么走 — 当前最先进的 SOP,每一步标注衰减时点
  • 🛠️  工具怎么选 — 选型决策树 + 避坑清单 + 自动生成的 bash 命令套件
  • 💬  黑话怎么讲 — 行业表达方式 + 外行破绽

具体提取的 7 层:

说明
怎么判断 心智模型 — 这行的资深人看问题用的镜片
怎么决策 标准决策规则 — 「如果 X,则 Y」的快速判断
用什么工具 工具栈 + 选型决策树 + 避坑清单
怎么干活 工作流,每一步标注「2026-04 起这一步换成 Y」的时效
怎么沟通 行业表达方式 — 黑话、说话节奏、外行破绽
不做什么 反模式 — 外行才会犯的错
知道局限 诚实边界 — 信息截止时间,哪些模块衰减最快

诚实边界

每个 skill 都明确标注它做不到什么:

  • 工具和工作流的模块衰减最快,建议每 3-6 个月刷新一次
  • 法规和标准的模块衰减更快,12 个月内一定要更新
  • 大师不能替代真实的实战经验 — 给的是认知框架,不是事故处理手册

一个不告诉你局限在哪的 skill,不值得信任。


🔍 凭什么相信它蒸出来的东西

一个新 skill 装上来,怎么知道它不是在编故事?

16 道自动检验,跑过才算交付。 每个生成的 skill 必须答对这些问题:

  • 来源真的是一手吗? — 每个网址自动判类(学术论文 / 官方文档 / 作者自己的博客 / vendor 官网算一手;新闻报道 / 二手转述算二手;知乎 / 微信公众号 / 百度百科 / G2 / Capterra / 内容农场直接拒绝
  • 「这家公司是大佬」有人能背书吗? — 每条核心结论必须挂 ≥ 2 处独立来源(跨人物 / 跨平台),单源结论自动降级到「快速规则」节,不进核心心智模型
  • 来源的日期够新吗? — 每条来源标日期,超过 18 个月自动半折扣
  • 心智模型真在原始材料里出现过吗? — 写完 skill 后反过去研究笔记里搜,找不到原文支撑的结论自动 flag
  • 行业冷僻怎么办? — 自动检测「公开材料太薄」并切换深挖模式:向你要内部资料 + 自动从行业协会 / 监管文件 / 招聘 JD / 大学课程多源补充,不靠瞎搜兜底

结果:保险经纪人 prototype 73 条来源 → 67 条一手(91.8%)/ 0 黑名单 / 0 自报作弊 / 16 项检验 14 项满分 + 1 项部分通过 + 0 项失败。


⚡ 安装

# Claude Code
git clone https://github.com/voidborne-d/master-skill.git ~/.claude/skills/master-skill
🛠️ 其他 host 安装路径
git clone https://github.com/voidborne-d/master-skill.git <TARGET>
Host <TARGET> 路径
🟣 Claude Code ~/.claude/skills/master-skill
🔵 OpenClaw ~/.openclaw/skills/master-skill
⚫ Codex ~/.codex/skills/master-skill
🟠 Hermes clone 后 python3 tools/install.py install --host hermes

一键装到所有宿主:python3 tools/install.py install --host all


🚀 用法

在装好大师.skill 的 agent 里,直接说:

> 造大师 LLM agent 基础设施
> 做个跨境电商运营的大师 skill
> 我做的是足踝外科,给我蒸一个

> update 大师 LLM-agent-infra      # 6 个月后增量刷新

大师跟你确认 6 件事(行业、子方向、地域、你的角色、有没有一手素材、是新建还是更新),然后启动六路并行调研:行业大佬 / 工具地图 / 工作流 / 知识正典 / 信息源 / 术语标准。

30-60 分钟后你拿到一个 {行业}-master 目录。装到任意 agent,立刻进入「这一行的资深人」模式。

🎛️ 调用生成出来的 skill

> 用 llm-agent-infra-master 帮我评估这个框架选型
> 用 跨境电商-master 看一下我这个亚马逊 listing
> 让 llm-agent-infra-master 跑 framework-select 决策树

💻 命令行直接跑

# 端到端流程:调研 → 检测冷僻 → 生成 skill → 质检 → 安装
python3 tools/research/merge_research.py merge --skill-dir ./prototype/
python3 tools/research/cold_detector.py --skill-dir ./prototype --stage wave1
python3 tools/skill_writer.py create --skill-dir ./output ...
python3 tools/research/quality_check.py check --skill-dir ./output
python3 tools/install.py install --host claude --source ./output

# 6 个月后增量刷新某个老 skill
python3 tools/update_skill.py plan --skill-dir <已有 skill>
# (agent 重跑标记的几路调研)
python3 tools/update_skill.py finalize --skill-dir <skill>

⭐ 已蒸馏的行业

每个都是端到端跑过的样本,包含完整调研数据 + 生成的 SKILL.md + 一套可跑的 bash 工具:

行业 类别 语言 路径
🔥 LLM agent 基础设施 技术 英文 llm-agent-infra-master/
跨境电商运营 商业 中文 cross-border-ecommerce-master/
小红书运营 内容运营 中文 xiaohongshu-ops-master/
短视频投流 商业 + 算法 中文 short-video-ads-master/
SEO 专家 半技术 中文 seo-master/
恋爱高手 软技能 中文 love-coach-master/
足踝外科 医疗(强监管) 中文 foot-ankle-surgery-master/
法律执业(中国法) 法律(强监管) 中文 china-law-master/
保险经纪人 / 代理人 金融(强监管) 中文 insurance-broker-cn-master/
🆕 八字命理 / 玄学算命 传统文化(半敏感) 中文 bazi-metaphysics-master/

10 个行业横切技术 / 商业 / 内容运营 / 软技能 / 医疗 / 法律 / 金融 / 传统文化 — 大师.skill 框架连「同盘多派给不同结论」的命理学派都能蒸出来,不强行调和。

最新行业「八字命理 / 玄学算命」的产物里有什么

  • 125 条来源,72.8% 是一手,0 条黑名单
  • 6 个核心心智模型(格局 + 用神 / 调候寒暖燥湿 / 象法 vs 理法 / 五术整合 / 评注信任度判断 meta 框架 / 时间衰减分层)— 跨流派覆盖,不偏袒任何一派
  • 10 条决策规则(含一条专门处理大陆 2026-01-01 治安管理处罚法新版后的商业合规边界)
  • 3 个人物 sub-skill 跨三派对位:
    • 段建业 大陆盲派代表,「取象法」在 6 个章节锚点突出
    • 倪海厦 港台五术派,「五术一体 + 命医同源」(看八字必论中医对应)
    • 梁湘润 港台子平学科化代表,「评注信任度 meta 框架」+ 三阶段教学法
  • 12 段真行业对话样本(同业 / 学习者求教 / 命主咨询 / 反例 4 类 register)
  • 4 个一键跑的 bash 决策脚本 + 1 个研究协议脚本(agentic protocol)
  • 完整的「学派分歧矩阵」— 子平 / 盲派 / 五术 / 新派 / 学院派 5 派在 6 个维度的对照表,保留分歧不平均化

对应全部 4 项质检 PASS:

  • mechanical rubric 16 项 13 满分 + 2 部分 + 0 失败
  • 每条结论原文可追溯(claim verifier 16/0/0)
  • 来源台账 0 违规
  • 跨 prototype 回归 0 issue

特别说明:八字命理在大陆法律语境是半敏感行业(治安管理处罚法第 27 条 2026-01-01 起对「利用迷信扰乱社会秩序」明示罚则)。这个 skill 蒸的是认知体系 + 学派分歧 + 古籍研读路径,不是接客话术 / 收费模板。诚实边界写死了 6 条,包含「不替代命主决策 / 心理咨询 / 医疗 / 商业策略」+ 港台与大陆法律差异。

调研过程完全透明。每个样本都附完整的六路调研笔记 + 蒸馏文档,可以追溯每条心智模型、每条决策规则是从哪几个来源出来的。

想蒸馏不在列表里的行业?装大师.skill,说「造大师 XXX」就行。


🔬 工作原理

输入一个细分行业,大师.skill 做这几件事:

1. 行业澄清          ← 粒度太粗主动收窄(拒绝「AI」,引导到「LLM agent 基础设施」)
2. 创建目录          ← 所有产物都在 skill 自己的目录内,自包含
3. 六路并行调研      ← 6 个子 agent:行业大佬 / 工具 / 工作流 / 知识正典 / 信息源 / 术语
   ─ 调研评审关卡    ← 你确认调研质量再继续,不让垃圾输入污染下游
4. 框架蒸馏          ← 三重验证(跨场景 / 生成力 / 排他性)挡住行业八股
   ─ 蒸馏评审关卡    ← 你确认认知框架再生成
5. 写出 skill        ← 自动生成完整目录、调女娲蒸人物 sub-skill、emit bash 工具
6. 三测验证          ← 已知问题 / 边界问题 / 风格盲测
7. 双 agent 精炼     ← 优化 skill 的「激活即执行」程度

详见 SKILL.md — 524 行的 agent 可加载工作流。方法论看 references/extraction-framework.md — 三重验证、工具栈三层提炼、流派分歧处理、衰减速度表。


🧬 三代谱系

大师.skill 站在两个前作的肩膀上:

三者同源,逐层放大。


📂 项目结构

master-skill/
├── SKILL.md                          # 大师本体(核心工作流规约)
├── prompts/                          # 提示词系统
│   ├── intake.md                     #   行业澄清 + 冷僻 deep-mode 二次 intake
│   ├── synthesis.md                  #   蒸馏指引(含 Step 5b 对话样本库)
│   ├── quality_check.md              #   16 项 mechanical rubric
│   ├── sub-skill-figures.md          #   调女娲的子 agent 模板
│   └── research/
│       ├── _source_id_manifest.md    #   T01-S001 全局 source_id 规范 + Surrogate Sources Policy
│       └── 01-06.md                  #   六路调研提示词(含 voice_samples 字段)
├── tools/                            # Python 工具
│   ├── skill_writer.py               #   生成 skill 目录
│   ├── cli_writer.py                 #   生成 bash 工具子目录
│   ├── update_skill.py               #   skill 增量刷新
│   ├── install.py                    #   四宿主安装器
│   ├── self_test.py                  #   全部样本 + 工具回归测试
│   ├── research/                     # 质量护栏 (v1.4 新)
│   │   ├── source_verifier.py        #   每个 URL 自动判类 + 黑白名单
│   │   ├── source_manifest.py        #   核对来源台账 + 一致性强制
│   │   ├── claim_verifier.py         #   反向核对 SKILL.md 每条结论是否真有原文支撑
│   │   ├── cold_detector.py          #   行业冷僻自动兜底 (深挖模式)
│   │   ├── refresh_sources.py        #   定期检测来源是否还在
│   │   ├── quality_check.py          #   16 道自动检验
│   │   └── merge_research.py         #   调研评审聚合
│   ├── collectors/                   # 自动抓行业 seed
│   │   ├── github / arxiv / RSS / 播客 (4 件)
│   │   └── 监管 / 协会 / 招聘 / 课程 (冷僻行业兜底, 4 件)
│   ├── ingest/                       # 行业报告 / 论文 / 课程 PPT 解析
│   │   └── PDF / EPUB / PPTX 一键吃进来
│   └── transcribe/                   # 视频 / 播客转录
│       ├── youtube.sh / local_video.sh   # 抓字幕 + 本地视频转录
│       └── 字幕清洗 / 含金量评分 / 人物识别
├── references/
│   ├── skill-template.md             #   生成产物的标准结构
│   ├── extraction-framework.md       #   蒸馏方法论(三重验证 / 衰减表 / 流派分歧)
│   └── cli-spec.md                   #   bash 工具的设计文档
└── prototypes/
    └── 9 个完整行业样本             #   见上面「已蒸馏的行业」列表

⚠️ 注意

调研材料的质量 = skill 的质量。不同维度的来源优先级不同:

维度 来源优先级(高到低)
🌟 行业大佬 本人长篇(书 / 长访谈 / 博客系列) 决策记录(公开发声 / 提交记录) 二手转述
🛠️ 工具地图 官方文档 工程师生产案例 培训教程 / SEO 软文
📋 工作流 公司技术博客的真实流程 资深人长访谈 培训机构大纲
📚 知识正典 行业人推荐书单(至少 3 个独立来源都点过) 学术综述 二手书评
📰 信息源 行业人订阅清单 主流媒体长稿 内容农场
  • 中文环境下自动排除知乎、微信公众号、百度百科、CSDN(除非作者原文)
  • 信息截止得越早,工具和工作流的模块衰减越快 — 用 update 大师 X 增量刷新
  • 这是 v1.1,还在快速迭代。发现 bug 请提 issue。

📄 路线图

版本 内容 状态
v0.1-0.4 工作流规约 + 提示词 + 工具 + 打磨
v1.0 完成第一个完整样本(LLM agent 基础设施),仓库公开
v0.6 bash 工具流 — 生成的 skill 自带命令套件
v1.1 调用别的 skill + 增量刷新 + 中文样本
v1.2 决策树主题自动学 + 定时刷新 + 5 个行业样本(含小红书 / SEO / 恋爱)
v1.3 短视频投流 / 足踝外科 / 法律 = 8 个行业横切覆盖
v1.4 质量护栏 + 第 9 个行业 — 自动跑 16 道质检 + URL 验真 + 黑名单强拦截 + 冷僻行业兜底(自动从协会 / 监管 / 招聘 / 课程多源补充)+ 新增保险经纪人 / 代理人
v1.5 第 10 个行业 — 八字命理 / 玄学算命 — 第一个半敏感 + 学派分歧大行业;同盘多派给不同结论保留分歧不平均;source_verifier 加 4 个古籍 archive 主源(ctext / guoxuedashi / wikisource / archive.org,命理 + 中医 + 历史 canon 永久受益)
v2.x PyPI 打包 / GitHub Action 自动更新 / 多语言文档 / 工具 marketplace 🔲

详见 ROADMAP.md


📜 许可证

MIT — 随便用,随便改,随便造。


🧬 同事.skill 蒸馏一个具体的人做什么。
🌟 女娲.skill 蒸馏任何人怎么想。
🎓 大师.skill 蒸馏一整个行业的认知 + 工作流 + 工具。


把一整个行业的资深认知,蒸馏成一个 skill。


MIT License © voidborne-d · 中文 README · English


⭐ Star History

Star History Chart

About

大师.skill — 输入行业,自动调研 6 轨(大佬/工具/工作流/正典/信源/术语)→ 提炼为可运行的行业 Master OS skill。所有 Claude Code / OpenClaw / Codex / Hermes agent 都能装载。Distill any sub-niche industry into a runnable Master OS skill for AI agents.

Topics

Resources

License

Stars

Watchers

Forks

Packages

 
 
 

Contributors