【More Than Coding】用 SOLO 打造 AI 写作技能，三步从大纲到配图完成高质量文章

用户52548 · 2026 年5 月 9 日 06:56

摘要

用 TRAE SOLO 打造了一个「AI写作」技能，只需给定主题，三步自动完成：撰写大纲 → 完成文章 → 生成配图。技能内置 7 套写作框架、4 种内容增强策略、反检测写作规范，以及配图提示词自动生成。实测用一篇 DeepSeek-V4-Pro 对比全球大模型的文章验证全流程，从选题到成稿约 4 分钟，输出 2000+ 字结构化长文 + 5 组配图提示词。

背景

内容创作者，经常需要写各类长文。痛点很明确：

结构难定：每次写文章都要从零构思框架，不同选题适合不同结构，选错框架整篇就散了
素材难找：写对比文章需要真实数据支撑，手动搜索效率低，还容易遗漏关键信息
配图难搞：文章写完了还得找配图，要么版权有问题，要么跟内容对不上
AI 味太重：直接让 AI 写文章，出来的东西四平八稳但毫无记忆点，像流水线产品

我希望用 SOLO 把这个「从零到成稿」的流程技能化——不是让 AI 替我写，而是让 AI 按照专业写作方法论，一步步跟我协作完成。

实践过程

第一步：拆解任务——把「写文章」变成可复用的技能

写文章不是一锤子买卖，我需要的是一个可复用的技能，而不是一次性的对话。所以我把任务拆成三层：

框架层：7 套写作框架（痛点型、故事型、清单型、对比型、热点解读型、纯观点型、复盘型），不同选题自动匹配不同结构
增强层：4 种内容增强策略（角度发现、密度强化、细节锚定、真实体感），解决「AI 写的东西没意思」的问题
配图层：配图提示词自动生成 + 调用图片生成技能，解决配图难题

参考了社区已有的 wewrite 技能的采集和写作逻辑，但做了大幅简化和重新设计，聚焦在「通用文章写作」这个场景。

第二步：用 SOLO 创建技能

用 SOLO 的 skill-creator 能力，创建了完整的技能目录结构：

ai-writing/
├── SKILL.md                    # 技能核心定义（三步流程、行为声明）
├── references/
│   ├── frameworks.md           # 7 套写作框架
│   ├── content-enhance.md      # 4 种内容增强策略
│   ├── writing-guide.md        # 写作规范（反检测、句式变化、禁用词）
│   └── visual-prompts.md       # 配图提示词生成规范
├── evals/
│   └── evals.json              # 测试用例
└── output/                     # 文章输出目录

关键 Prompt 设计思路：

SKILL.md 是技能的「大脑」，定义了三步流程的完整行为：Step 1 理解选题 → 选择框架 → WebSearch 采集素材 → 生成大纲；Step 2 维度随机化（叙事视角、类比域、节奏等）→ 撰写全文 → 嵌入配图提示词；Step 3 提取提示词 → 调用图片生成技能 → 插入图片 → 用户选择
维度随机化是核心创新点——每篇文章随机激活 2-3 个表达维度（如"旁观者分析 + 体育类比 + 长短急切交替"），让每篇文章的"味道"都不一样，避免 AI 写作的千篇一律
编辑锚点设计：在文章中留  标记，提示用户在关键位置补充个人经历，增强真实体感

第三步：踩过的坑

Windows 路径问题：用 mkdir -p 创建目录在 Windows 上直接报错，改用 PowerShell 的 New-Item -ItemType Directory -Force 才解决
图片生成 API Key：byted-seedream-image-generate 技能需要配置火山引擎 API Key，环境未配置时需要优雅降级——保留提示词注释，不阻塞文章输出
素材采集的时效性：WebSearch 搜到的数据有真有假，需要交叉验证。比如 DeepSeek-V4-Pro 的部分评测数据在不同来源有差异，最终以 NIST CAISI 的独立评测为基准
反检测写作规范的平衡：规范太严格会导致文章读起来不自然，太松又会有明显 AI 味。最终选择在关键维度（句长方差、词汇温度、段落节奏）做控制，而不是逐条硬套

成果展示

技能文件

完整的 ai-writing 技能已创建，包含核心定义、4 个参考文件、测试用例。

如何获得？ 下载ai-writing.zip，解压缩到 ~/.trae-cn/skills

实战验证：DeepSeek-V4-Pro 对比全球大模型

用 ai-writing 技能写了一篇完整文章，验证全流程：

Step 1 输出——大纲（对比型框架 + 真实体感增强策略）：

开头：三张牌的选择困境切入
H2：算法竞赛称王，真实工程翻车
H2：数学推理满分，但链条会断
H2：百万上下文和地板价——最锋利的两把刀
H2：闭源三巨头的反击
结尾：场景矩阵表，硬切收尾

Step 2 输出——文章（维度：旁观者分析 + 体育类比 + 长短急切交替）：

你是一个技术负责人，面前摆着三张牌。

第一张：一个做题天下第一但偶尔翻车的选手。第二张：一个稳如老狗但贵得让你肉疼的老将。第三张：一个能自己连轴转好几天但工具箱不太熟的干将。

这三张牌，分别叫 DeepSeek-V4-Pro、Claude Opus 4.7、GPT-5.5。

文章 2000+ 字，包含真实数据（LiveCodeBench 93.5%、SWE-bench Pro 55.4%、API 价格 1/70 等）、3 个编辑锚点、5 组配图提示词。

Step 3 输出——配图：

5 组配图提示词已嵌入文章，格式如：

<!-- Image prompt: 三张扑克牌分别标注DeepSeek、Claude、GPT的标志，扑克牌悬浮在深蓝色桌面上方，每张牌散发不同颜色的光芒——红、蓝、绿，赛博朋克风格，16:9横版构图，无文字无字母 -->

配置火山引擎 API Key 后即可一键生成配图，每组 4 张供选择。

完整文章见：output/2026-05-09-deepseek-v4-pro-vs-llm.md

效果与总结

提效数据

环节	手动	用 ai-writing 技能
构思框架	30-60 分钟	自动匹配，< 1 分钟
素材采集	1-2 小时	WebSearch 2 轮，约 1 分钟
撰写全文	2-3 小时	约 1 分钟（含维度随机化）
配图	30-60 分钟	自动生成提示词，配图一键生成
总计	4-7 小时	约 4 分钟

SOLO 在流程中做了什么

技能化：把「写文章」这个模糊任务变成了可复用的三步流程，每次写新文章只需给主题
框架匹配：7 套框架自动选择，不用每次从零构思结构
素材采集：WebSearch 自动搜索 + 交叉验证，比手动搜索效率高 10 倍
反 AI 味：维度随机化 + 反检测写作规范，输出的文章有「人味」
配图闭环：提示词自动生成 + 图片技能联动，从文字到视觉一站式完成

可复用方法

技能结构可复用：SKILL.md + references/ 的模式可以迁移到任何内容创作场景（比如「AI 写周报」「AI 写方案」）
框架库可扩展：7 套框架覆盖了大部分文章类型，新增框架只需在 frameworks.md 中追加
增强策略可组合：4 种策略按框架类型自动映射，也可以手动指定组合

一句话总结：让 AI 按专业方法论一步步跟你协作——框架它来定，素材它来找，配图它来生成，但你可以控制观点和判断。