自定义模型经常会出现这样的异常打断
根据错误提示和知识库信息,这是自定义模型服务商返回空内容导致的问题(HTTP 500 错误,错误码 4028)。
可能原因和排查方向:
- 网络问题:确保你的网络可以正常访问该自定义模型服务商
- 服务商侧问题:Z.ai Plan 服务端可能临时故障,可以稍后重试
- 请求内容:检查当前对话是否包含敏感内容或过长的上下文
建议操作:
- 先尝试用简单的问题测试(比如"你好"),看是否仍报错
- 如果简单问题可以,说明是之前的请求内容有问题,建议开新对话重新描述
- 如果简单问题也报错,可能是服务商暂时不可用,可以过段时间再试
你之前是在什么场景下遇到这个问题的?是刚发了一段很长的内容,还是之前对话正常突然出现的?
长对话的过程中出现的问题,使用claude code cli接这个API就一直没问题
明白了,是在长对话过程中出现的,而且用 Claude Code CLI 接同一个 API 没问题。这种情况大概率是上下文长度超限导致的。
可能原因:
- 长对话的 token 累积超过了自定义模型的上下文窗口限制
- TRAE 在长对话中会传递更多上下文信息(文件引用、历史记录等),比 CLI 场景更容易超限
建议操作:
- 开新对话:把当前需求简化后在新对话中重新描述
- 拆分任务:如果是复杂任务,拆分成多个小问题分别问
- 检查模型配置:确认自定义模型的上下文窗口设置,有些模型需要显式配置 max_tokens
另外想问下,你用的是哪个自定义模型?我可以帮你确认下它的上下文窗口限制。
使用的是GLM 5.1
明白了,你用的是 GLM 5.1。这个模型的上下文窗口限制通常是 128K(取决于具体配置),但在 TRAE 长对话中可能因为传递了额外的上下文信息而更容易超限。
建议操作:
- 开新对话:把当前需求简化后在新对话中重新发起
- 拆分任务:如果是复杂任务,拆分成多个小问题分别问
- 检查配置:确认你的自定义模型配置中
max_tokens是否合理设置
另外,你是在 TRAE IDE 里用的自定义模型,还是在 TRAE SOLO 桌面版里用的?这两个产品的自定义模型处理逻辑略有不同。
在 TRAE SOLO CN桌面版里面用的
明白了,是在 TRAE SOLO CN 桌面版里用的。SOLO 桌面版的自定义模型处理确实和 IDE 略有不同,尤其是在长对话时会携带更多上下文信息(项目结构、规则等),更容易触发 GLM 5.1 的上下文窗口限制。
建议操作:
- 开新对话:把当前需求简化后在新对话中重新发起
- 检查配置:在 SOLO 的自定义模型设置中,确认
max_tokens和上下文窗口配置是否合理 - 临时方案:如果当前任务必须继续,可以尝试先停止对话,把之前的关键结论复制出来,然后在新对话中基于结论继续
另外,你这个对话进行了多少轮了?大概有多少条历史消息?
上下文配置的上限是128K,在对话的第五轮出现了失败,输入继续仍然可以继续往下走
明白了,配置是 128K,但第五轮就失败了,而且点"输入继续"还能往下走。这种情况更像是单次请求的 token 超限,而不是整个对话累积。
可能原因:
- 第五轮的输入可能特别长,或者触发了 SOLO 携带大量项目上下文
- 点"继续"时 SOLO 会自动裁剪部分上下文,所以能继续
建议操作:
- 检查第五轮输入:当时是不是发了很长的内容、大段代码,或者引用了很多文件?
- 优化输入方式:如果需要传递大量信息,分多次发送,每次只发必要的部分
- 临时方案:像你发现的那样,点"输入继续"让 SOLO 自动裁剪后继续
另外想问下,第五轮时你是发了一段特别长的内容吗?还是引用了很多文件/文件夹?

