# 【Skill 创作】公文/内部简报格式处理 Skill:内容不改,只把 Word 格式处理规范
## 一句话介绍
这是一个面向 Agent 的公文/内部简报 Word 格式处理 Skill。它不替用户写公文、不润色正文、不补缺失要素,而是在保留已有内容不变的前提下,完成格式诊断、规范化排版和模板套用。
## 为什么做这个 Skill
很多办公材料真正耗时的地方不是写正文,而是交付前反复调整 Word 格式。
一份材料内容可能已经定稿,但仍然要处理这些细节:
- 标题、正文、一级标题、二级标题字号不统一。
- 行距、缩进、段前段后和对齐方式不一致。
- 页边距、版心、每页行数/每行字数参考不清楚。
- 表格、页眉页脚、页码、图片和印章不敢随便动。
- 内部模板能看,但很难安全套用到新文档。
- 用户只想让 AI 调格式,却担心 AI 改写正文或补写不存在的公文要素。
所以我把这个 Skill 的定位收敛为一句话:**只处理已有内容和已有对象的格式,不碰正文内容本身。**
## 适用场景
- 已经写好一篇 `.docx`,只想按正式公文或内部简报习惯调整格式。
- 有一份 Markdown、纯文本或粘贴材料,需要生成可流转的 Word 文档。
- 不确定当前文档格式哪里不规范,希望先诊断再决定是否修改。
- 有一份内部范文,希望只学习格式,不暴露模板正文,再把新材料套成同款版式。
- 处理内部材料时,希望默认不复述敏感原文,只输出格式层面的检查和报告。
## 核心设计原则
### 1. 内容零改写
Skill 默认遵守“现有内容格式处理”原则:
- 不改写、不润色、不总结、不删减正文。
- 不调整原有段落顺序。
- 不自动补写主送机关、发文字号、落款、日期、附件、版记、印章、页码等缺失要素。
- 未检测到的元素只在报告中标记为未检测或未处理。
### 2. 参考官方格式,但不越界补内容
正式公文格式优先参考:
- 《党政机关公文处理工作条例》
- `GB/T 9704-2012`《党政机关公文格式》
Skill 会把这些规范转化为可执行的 Word 格式处理规则,例如 A4、页边距、版心、文档网格、标题和正文的字体字号、固定行距、各级标题样式等。
但这些规范只用于判断“已有元素应该如何排版”,不会让 Skill 自动补写缺失公文要素。实际单位模板、地方细则或用户明确要求与通用规范不一致时,优先按用户模板和用户要求处理。
### 3. 全 Word 格式范围
这个 Skill 不只处理标题和正文,而是把“格式”理解成完整 Word 版面:
- 页面:A4、页边距、版心、文档网格、页眉页脚距离。
- 段落:对齐、缩进、固定行距、段前段后、分页控制、大纲级别、制表位、编号/项目符号诊断。
- 文字:中文/西文字体、字号、颜色、加粗、斜体、下划线、删除线、上下标、字符间距。
- 表格:默认处理表内文字并诊断结构;明确要求时规范表格宽度、边框、单元格边距、垂直居中和跨页表头。
- 页码:默认只诊断和格式化已有页码;明确要求时才新增页码。
- 对象:图片、印章、文本框、形状、图表、公式等默认诊断并保留,避免误动。
## 三种模式
### 1. 现文格式化
适合“内容已经定稿,只要调格式”的场景。Skill 会输出格式化后的 `.docx` 和覆盖报告。
报告会包含:
- `content_preservation`:正文和表格文本是否保持不变。
- `coverage`:哪些格式已处理、哪些保留、哪些只诊断、哪些未检测或暂不支持。
- `format_changes.page`:页面、版心、文档网格等页面级变化。
- `format_changes.paragraph_controls`:分页控制、大纲级别、编号/项目符号等段落控制变化。
### 2. 现文格式诊断
这个模式只读不改,适合“先别动文件,告诉我哪里不规范”。
它会诊断:
- 页面设置、页眉页脚和页码字段。
- 段落角色:标题、正文、主送机关、附件、落款、日期、版记等已有元素。
- 字体、字号、颜色、加粗、斜体、下划线、行距、缩进、段前段后。
- 表格结构、图片对象、文本框、形状、特殊字段。
- 批注、修订、超链接、脚注尾注、书签、隐藏文字等特殊状态。
### 3. 现文模板套用
模板套用采用两阶段流程,避免一上来就错误套版。
第一阶段先提取模板格式清单:
- 页面设置。
- 标题、正文、各级标题等角色样式。
- 字体、字号、颜色、下划线、行距、缩进等格式指纹。
- 表格、对象、页眉页脚等诊断信息。
如果提供目标文档,Skill 会对比模板覆盖了哪些目标文档已有格式项,哪些没有覆盖。未覆盖项会先询问用户,是使用公文/简报推荐格式、保留目标原格式,还是指定自定义格式。确认后才生成套用模板后的 Word 文档。
## 使用方式
安装后可以显式触发:
```text
$gongwen-format-converter
模式:现文格式化
输入文件:D:\path\材料.docx
预设:formal
要求:内容不要改、不补写、不润色,只调整已有标题、正文、表格、页眉页脚等格式,并给出覆盖报告。
```
格式诊断:
```text
$gongwen-format-converter
模式:现文格式诊断
输入文件:D:\path\材料.docx
要求:先不要生成新文档,完整诊断页面、页眉页脚、段落角色、字体字号、颜色/下划线、行距缩进、表格图片、对象状态,以及与正式公文格式的差异。
```
模板套用:
```text
$gongwen-format-converter
模式:现文模板套用
模板文件:D:\path\模板.docx
目标文件:D:\path\新材料.docx
要求:先提取模板格式清单,列出模板覆盖了哪些格式、目标文档还有哪些已有格式没有覆盖。不要直接生成,等我确认后再应用。
```
## 创作过程
这个 Skill 最初的想法是做一个“公文写作助手”。但在实际讨论和测试中,我发现更真实、更高频的问题不是“让 AI 写正文”,而是“正文已经定稿,Word 格式还要反复手工调整”。
于是我把方向从内容生成收敛到格式处理,并逐步明确了几个边界:
1. 只处理现有内容格式,不自动补写缺失公文要素。
2. 正式公文参考官方规范,内部简报作为内部办公材料预设处理。
3. 对表格、页码、图片、印章、文本框等容易误动的结构,默认诊断和保留,只有用户明确要求才进一步处理。
4. 模板套用不直接复制模板正文,而是先提取样式指纹和覆盖情况,再让用户确认。
后续迭代中,我补齐了页面级格式、文档网格、段落控制、页码显式开关、表格显式结构格式化、内容保持哈希报告、覆盖状态报告等能力,让它更像一个严格的 Word 格式处理机器,而不是泛泛的提示词合集。
## 效果展示
使用前
使用后
## Skill 分享链接
GitHub 仓库:
Skill 安装路径:
## 当前边界和后续计划
当前版本已经能处理页面、段落、文字、页码字段、表格文字和显式表格结构格式化,但还有一些深水区会继续增强:
- 图片、印章、浮动文本框、复杂形状和水印的可视化诊断与显式处理。
- Word 自动编号体系的可选重建,避免默认改变显示逻辑。
- 目录、复杂域、交叉引用、脚注尾注、书签等特殊结构的更细诊断。
- 更多脱敏真实案例和自动化评测样本。
- 增加渲染截图校验,验证格式化后的 Word 页面效果。
## 隐私说明
本 Skill 默认将公文、简报、会议、经营、财务、人事等材料视为内部敏感内容。格式诊断和模板套用报告默认不输出完整正文,而是使用段落索引、角色、样式摘要和哈希辅助定位问题。模板套用只学习样式指纹,不复述模板正文。


