大家好~最近在给公司低代码平台做 AI Coding 能力落地,核心卡在企业知识库的建设与治理环节,想和各位交流经验:
背景:
我们有大量低代码相关的历史代码(组件模板、DSL 脚本)、非结构化文档(产品规范、开发手册、故障排查文档),希望把这些沉淀成知识库,供大模型在 AI Coding 时调用,但遇到几个核心问题:
-
切片与向量化:历史代码该按什么粒度切片(函数 / 组件 / 文件?)、非结构化文档怎么切分更适配 AI Coding 场景?向量化用什么模型 / 维度更合适(比如 Qwen/text-embedding-3-small)?
-
知识库治理:如何给代码 / 文档打标签、做版本管理?规则迭代时(比如低代码规范更新),怎么快速同步知识库,避免大模型调用旧规则?
-
落地适配:在 TRA E IDE 的 AI Coding 能力中,如何把治理后的知识库和大模型联动,既保证调用精准性,又不额外增加 token 消耗?
想请教各位:
有没有在低代码场景落地过企业知识库治理的实战案例?
代码 / 文档切片、向量化时踩过哪些坑(比如粒度太细 / 太粗导致召回率低)?
知识库和 TRAE AI Coding 结合时,有没有轻量化的联动方案?
期待大家的经验分享~