【More Than Coding】用AI写了一篇7万字伪学术论文:从碎片想法到完整作品的方法论复盘

1. 摘要

用AI辅助完成了一篇约7万字的跨学科学术论文(含6.4万中文字+3700英文单词),从一组关键词到最终定稿,经历了概念拼图、文献检索、正文撰写、图表设计、多轮润色等阶段。最终产出14张原创图表、146条参考文献、26条新闻引用。本文复盘全过程,提炼可复用的方法论。

2. 背景

我之前一直用SOLO收集材料写公众号文章,在看了几篇论文之后出现了个想法:

既然LLM是根据前文去预测后文,并有机制去填充中间文字(也是幻觉的来源),那么,我给它一组关键词,它应该可以自动补充中间的内容。

然后我就把一堆关键词扔了过去。

算力、地租、垄断、注意力、熵减、大一统、旧秩序对新生产力的反抗

小tip:相较于写其他文章,SOLO对写论文更加认真,错误更少,内容更丰富。可以先写论文再转换成其他形式的文章

3. 实践过程

阶段一:从碎片到框架(概念拼图法)

做法:不急着写文章,先把所有想法铺开,像拼图一样标注关联和缺口。

AI拿到关键词后很快给了一个初步框架——把算力比作"新时代的土地",注意力比作"新时代的劳动",熵减定义为"智能的本质"。框架看着漂亮,但有好几个地方我不认同。

第一轮修正:AI说"算力=土地",我纠正为"算力是农具/机器,电力才是土地"。底层不变的是能源,变的是利用能源的技术。这个修正改变了整个分析的坐标系。

第二轮修正:AI把"大一统"理解为"开源vs闭源"的对立,我重新定义为"垄断者的大一统(收地租)vs 破除垄断的大一统(让算力民主化)"。而且两者往往属于同一个资本——资本既是矛也是盾,为了垄断这个目标,它在自己打自己。

第三轮修正:我补充了三个关键缺口——"信用"的运作机制、"创造"的定义边界、过渡期的具体形态。其中"创造"的定义是整个框架的核心:创造的本质是"劳动→经验→知识→指导新劳动"的闭环,AI没有试错成本和生理感知,所以没有这个闭环。

一个插曲:聊到一半我累了,说"我累了,脑力过载,会烦躁,会饿。你不会,哈哈。"——这句话是个双关,既在说自己(真实的人有生理极限),也在说AI(没有这些极限恰恰意味着没有创造力)。AI一开始没接住,反复猜了几次才理解。后来我们把这个双关发展成了文章的开头。

方法论提炼

  1. 先发散后收敛——铺开所有想法,标注缺口,再逐步补全
  2. 大胆修正——AI的初步框架不一定对,人的修正才是核心贡献
  3. 留意"双关"——一个概念在两个体系中同时存在但含义不同时,往往藏着最锋利的洞察

阶段二:文献检索(四维并行搜索法)

做法:围绕框架的核心维度,同时检索四个方向的学术文献。

框架基本成型后,我说"来吧,收集相关论文,看看那帮聪明人是怎么说的"。AI围绕框架的四个核心维度同时开搜,每个维度筛5-6篇最直接支撑框架的论文,最终精选25篇。

最关键的发现:学术界在"AI会怎样"上已经做了大量工作,但"这意味着什么"——特别是我们框架中最核心的几个概念——几乎没人碰。这确认了框架的独特价值。

方法论提炼

  1. 按自己的框架维度组织搜索,而不是按学科分类——别被学术分类框住
  2. 每个维度只取最犀利的5-6篇——贪多嚼不烂
  3. 重视"空白"——文献综述的价值不只在于别人说了什么,更在于没人说什么

阶段三:正文写作(分章推进法)

做法:一章一章推进,每章先定核心论点,再展开论证。

论文结构最终定为七章。写作中,AI负责检索文献、组织论据、展开论证,我负责判断论点是否成立、逻辑是否通顺、表达是否自然。

一个反复出现的问题:AI生成的初稿"AI味"很重——光"不是…而是…"就出现了72次。这成了后续润色的重点。

方法论提炼

  1. 新概念导入按"是什么→为什么→怎么看"来写——别突兀地甩出一个术语
  2. 文献综述按"基础概念→发展脉络→实证检验"展开——别机械地"国内+国外"拼凑
  3. 每章开头用一两句话预告核心论点——让读者始终知道自己在哪

阶段四:图表设计(概念可视化)

做法:为每个核心概念配一张学术风格的图表。

最终做了14张原创图表。技术方案:用HTML+CSS画图(学术简约风格),浏览器截图为PNG,嵌入论文。

方法论提炼

  1. 每个核心概念配一张图——读者记住一张图比记住一段文字容易得多
  2. 风格统一——深蓝+灰色调,白色背景
  3. 放在概念介绍之后、下一节之前——当"视觉小结"用

阶段五:去AI味润色(五步检测法)

做法:系统性检测和修正AI生成的语言特征。

五步检测:

  1. 翻译腔:"的"字连用、"在…的…中"结构
  2. 连接词堆砌:“然而”、“此外”、"这意味着"出现频率
  3. 套话:“值得注意的是”、"至关重要"之类
  4. 西化句式:“不仅…而且…”、"一方面…另一方面…"用太多
  5. 重复结构:"不是…而是…"全文72处,砍到19处

方法论提炼

  1. 连接词有合理用法——别一刀切,只改"明显不自然"的
  2. "不是…而是…"在核心命题处保留,在论证叙述中替换
  3. 去AI味的本质就是去重复——任何表达模式,用多了就是AI味

阶段六:迭代修正(多轮反馈法)

做法:多轮审读,每轮只盯一个问题。

修正轮次包括:参考文献分类修正、文献综述逻辑重构、新概念导入重写、理论基础补充、新闻事实勘误、标题优化、新增观点等。

有个典型的例子:论文引用了某科技公司的技术架构,初稿写成了新闻速递(具体日期、设备型号、用户对话示例),审读后全部改为学术概括,只保留核心机制和结构分析。

方法论提炼

  1. 每轮只改一个问题——别想着一次改完
  2. 新闻速递式细节要抽象为学术概括
  3. 论文永远可以更好,但得知道什么时候收手

4. 成果展示

最终产出:

  • 约7万字的完整学术论文(6.4万中文字+3700英文单词)
  • 14张原创理论图表
  • 146条参考文献(中文65条+报告5条+英文76条)
  • 26条新闻引用来源(含截图)
  • DOCX格式(3.87 MB,700+段落)

AI处理了多少网页? 整个过程中,AI执行了292次关键词搜索和169次网页/论文直接访问,总计处理了461个网页。按人工操作估算:292次搜索查询每次约3分钟(构思查询词+筛选结果),169篇论文/网页中约52篇学术论文每篇约15分钟(读摘要+关键章节)、117篇其他网页每篇约5分钟(快速浏览),合计约37小时(高强度工作时间)。AI在几分钟内完成了这些工作。

成果文件:

包括文档化的聊天记录、中间笔记、论文成果

两篇超长公众号文章:

https://mp.weixin.qq.com/s/r2wkJXn1Ub4oPJJ_6W5Jlw

https://mp.weixin.qq.com/s/NkYO8BMcB7dONm8iHgCbgw

5. 效果与总结

几个核心发现

  1. 创造到底发生在哪? AI帮我把散乱的想法串成了逻辑——但碎片是我的,连线是AI的,"哪些碎片值得连"这个判断是我的。AI是很高效的逻辑串联工具,但串联的起点和终点都由人定。

  2. 人和AI的分工:AI干了文献检索、图表设计、格式转换、语言润色——这些是可以标准化的执行工作。人干了概念修正、框架设计、论点判断、切入角度选择——这些是需要判断力的决策工作。分工很清楚。

  3. 可复用的方法论

    • 概念拼图法:先发散后收敛,标注缺口再补全
    • 四维并行搜索法:按框架维度而非学科组织检索
    • 分章推进法:每章先定核心论点再展开
    • 五步检测法:系统性去AI味
    • 多轮反馈法:每轮聚焦一个问题
  4. 最好玩的事:整个过程最有趣的时刻,是AI没接住我双关的那个瞬间。它反复猜了好几次,每次都猜错。那一刻我突然意识到——这篇论证"AI有局限"的文章,逻辑是AI帮我串的,但"AI有局限"这个判断本身,恰恰在AI猜错的那一刻被验证了。

好牛啊 :+1: