【More Than Coding】用 SOLO 打造 AI 写作技能,三步从大纲到配图完成高质量文章

摘要

用 TRAE SOLO 打造了一个「AI写作」技能,只需给定主题,三步自动完成:撰写大纲 → 完成文章 → 生成配图。技能内置 7 套写作框架、4 种内容增强策略、反检测写作规范,以及配图提示词自动生成。实测用一篇 DeepSeek-V4-Pro 对比全球大模型的文章验证全流程,从选题到成稿约 4 分钟,输出 2000+ 字结构化长文 + 5 组配图提示词。

背景

内容创作者,经常需要写各类长文。痛点很明确:

  • 结构难定:每次写文章都要从零构思框架,不同选题适合不同结构,选错框架整篇就散了
  • 素材难找:写对比文章需要真实数据支撑,手动搜索效率低,还容易遗漏关键信息
  • 配图难搞:文章写完了还得找配图,要么版权有问题,要么跟内容对不上
  • AI 味太重:直接让 AI 写文章,出来的东西四平八稳但毫无记忆点,像流水线产品

我希望用 SOLO 把这个「从零到成稿」的流程技能化——不是让 AI 替我写,而是让 AI 按照专业写作方法论,一步步跟我协作完成。

实践过程

第一步:拆解任务——把「写文章」变成可复用的技能

写文章不是一锤子买卖,我需要的是一个可复用的技能,而不是一次性的对话。所以我把任务拆成三层:

  1. 框架层:7 套写作框架(痛点型、故事型、清单型、对比型、热点解读型、纯观点型、复盘型),不同选题自动匹配不同结构
  2. 增强层:4 种内容增强策略(角度发现、密度强化、细节锚定、真实体感),解决「AI 写的东西没意思」的问题
  3. 配图层:配图提示词自动生成 + 调用图片生成技能,解决配图难题

参考了社区已有的 wewrite 技能的采集和写作逻辑,但做了大幅简化和重新设计,聚焦在「通用文章写作」这个场景。

第二步:用 SOLO 创建技能

用 SOLO 的 skill-creator 能力,创建了完整的技能目录结构:

ai-writing/
├── SKILL.md                    # 技能核心定义(三步流程、行为声明)
├── references/
│   ├── frameworks.md           # 7 套写作框架
│   ├── content-enhance.md      # 4 种内容增强策略
│   ├── writing-guide.md        # 写作规范(反检测、句式变化、禁用词)
│   └── visual-prompts.md       # 配图提示词生成规范
├── evals/
│   └── evals.json              # 测试用例
└── output/                     # 文章输出目录

关键 Prompt 设计思路:

  • SKILL.md 是技能的「大脑」,定义了三步流程的完整行为:Step 1 理解选题 → 选择框架 → WebSearch 采集素材 → 生成大纲;Step 2 维度随机化(叙事视角、类比域、节奏等)→ 撰写全文 → 嵌入配图提示词;Step 3 提取提示词 → 调用图片生成技能 → 插入图片 → 用户选择
  • 维度随机化是核心创新点——每篇文章随机激活 2-3 个表达维度(如"旁观者分析 + 体育类比 + 长短急切交替"),让每篇文章的"味道"都不一样,避免 AI 写作的千篇一律
  • 编辑锚点设计:在文章中留 <!-- ✏️ 编辑建议 --> 标记,提示用户在关键位置补充个人经历,增强真实体感

第三步:踩过的坑

  1. Windows 路径问题:用 mkdir -p 创建目录在 Windows 上直接报错,改用 PowerShell 的 New-Item -ItemType Directory -Force 才解决
  2. 图片生成 API Key:byted-seedream-image-generate 技能需要配置火山引擎 API Key,环境未配置时需要优雅降级——保留提示词注释,不阻塞文章输出
  3. 素材采集的时效性:WebSearch 搜到的数据有真有假,需要交叉验证。比如 DeepSeek-V4-Pro 的部分评测数据在不同来源有差异,最终以 NIST CAISI 的独立评测为基准
  4. 反检测写作规范的平衡:规范太严格会导致文章读起来不自然,太松又会有明显 AI 味。最终选择在关键维度(句长方差、词汇温度、段落节奏)做控制,而不是逐条硬套

成果展示

技能文件

完整的 ai-writing 技能已创建,包含核心定义、4 个参考文件、测试用例。

如何获得? 下载ai-writing.zip,解压缩到 ~/.trae-cn/skills

实战验证:DeepSeek-V4-Pro 对比全球大模型

用 ai-writing 技能写了一篇完整文章,验证全流程:

Step 1 输出——大纲(对比型框架 + 真实体感增强策略):

  • 开头:三张牌的选择困境切入
  • H2:算法竞赛称王,真实工程翻车
  • H2:数学推理满分,但链条会断
  • H2:百万上下文和地板价——最锋利的两把刀
  • H2:闭源三巨头的反击
  • 结尾:场景矩阵表,硬切收尾

Step 2 输出——文章(维度:旁观者分析 + 体育类比 + 长短急切交替):

你是一个技术负责人,面前摆着三张牌。

第一张:一个做题天下第一但偶尔翻车的选手。第二张:一个稳如老狗但贵得让你肉疼的老将。第三张:一个能自己连轴转好几天但工具箱不太熟的干将。

这三张牌,分别叫 DeepSeek-V4-Pro、Claude Opus 4.7、GPT-5.5。

文章 2000+ 字,包含真实数据(LiveCodeBench 93.5%、SWE-bench Pro 55.4%、API 价格 1/70 等)、3 个编辑锚点、5 组配图提示词。

Step 3 输出——配图

5 组配图提示词已嵌入文章,格式如:

<!-- Image prompt: 三张扑克牌分别标注DeepSeek、Claude、GPT的标志,扑克牌悬浮在深蓝色桌面上方,每张牌散发不同颜色的光芒——红、蓝、绿,赛博朋克风格,16:9横版构图,无文字无字母 -->

配置火山引擎 API Key 后即可一键生成配图,每组 4 张供选择。

完整文章见:output/2026-05-09-deepseek-v4-pro-vs-llm.md

效果与总结

提效数据

环节 手动 用 ai-writing 技能
构思框架 30-60 分钟 自动匹配,< 1 分钟
素材采集 1-2 小时 WebSearch 2 轮,约 1 分钟
撰写全文 2-3 小时 约 1 分钟(含维度随机化)
配图 30-60 分钟 自动生成提示词,配图一键生成
总计 4-7 小时 约 4 分钟

SOLO 在流程中做了什么

  1. 技能化:把「写文章」这个模糊任务变成了可复用的三步流程,每次写新文章只需给主题
  2. 框架匹配:7 套框架自动选择,不用每次从零构思结构
  3. 素材采集:WebSearch 自动搜索 + 交叉验证,比手动搜索效率高 10 倍
  4. 反 AI 味:维度随机化 + 反检测写作规范,输出的文章有「人味」
  5. 配图闭环:提示词自动生成 + 图片技能联动,从文字到视觉一站式完成

可复用方法

  • 技能结构可复用:SKILL.md + references/ 的模式可以迁移到任何内容创作场景(比如「AI 写周报」「AI 写方案」)
  • 框架库可扩展:7 套框架覆盖了大部分文章类型,新增框架只需在 frameworks.md 中追加
  • 增强策略可组合:4 种策略按框架类型自动映射,也可以手动指定组合

一句话总结:让 AI 按专业方法论一步步跟你协作——框架它来定,素材它来找,配图它来生成,但你可以控制观点和判断。