添加自定义模型服务模型教程 v4.0版本(2026.05.15更新)

时间真快,由于最新版TRAE/SOLO调整了自定义模型的界面,开放了部分参数的配置!
转眼这个教程都要v4.0了,什么时候不再需要这个教程呢?
本教程只展示自定义模型添加,不展示内置服务商添加!并且API格式只使用OpenAI协议
为了保持整洁,原版教程在文末折叠了,有需要的自行翻找展开!
教程环境:

  • Windows 11
  • TRAE国内版 v3.3.57
  • SOLO桌面端 v0.1.9

TRAE IDE配置

添加位置:

添加自定义模型


:fingerprint:
基础配置中需要注意以下几点:
其一是选择自定义配置,API格式选择OpenAI!【部分厂商只提供Anthropic协议时再换即可,其余情况小白默认OpenAI】
其二是自定义请求地址处看清楚自己的地址是否携带尾缀(例如/chat/completions),从而来灵活切换完整URL按钮,大部分厂商提供的都不含尾缀,所以默认关闭完整URL按钮即可!
其三是模型ID!!!!!无数的人都挂在ID上,请自己去查询!!!实在不会找的去问一下AI助手!!!请不要再配不上然后问了半天ID就是自信满满没错,然后最后"我以为就是这个"!!!
其四是多模态按钮,同理自己去查!!!不要让没有眼睛的模型强行开眼了,也不要硬说非多模态模型支持图片理解了,我真跪了!!!

:fingerprint:
进阶配置是最新更新出来的,为了让更多高手自定义部分参数(话说真的有高手懂参数但是不懂怎么配置么 :thinking:)
展开高级配置页面即可查看自定义参数


进阶配置同样需要关注以下几点:
其一是模型系列,官方目前内置了三个常见系列模型的参数模板,如果你添加的模型在这三类选择模板即可,剩下参数就可以不用动了,如果不在,选择默认,合理调整下方参数

其二是模型展示名称,用来给用户自定义添加模型的名称,注意和模型ID区分,模型ID是与服务商链接服务的标识(厂商规定,用户无权修改),模型展示名称是TRAE为了方便用户区分或标记的功能,例如我配置Deepseek,但是有很多供应商我都配置了,那么我可以分别配置"官方DeepSeek-V4-Pro"、"硅基流动DeepSeek-V4-Pro"等内容,这样模型列表就会显示你这里填写的名称!
其三是上下文!TRAE设置的上下文参数是计算输入+输出的总和(不要问我为啥是这样设置,我不是官方),根据你添加的模型自定义上下文,默认模板是200K,被拆分成输入184K,输出是16K
切记并不是上下文越高越好!!!最适合的是模型本身的上下文参数!我知道这个设置出了以后有部分人拉高了配置,为了不让上下文来回压缩,但是,这样做会出现很严重的降智与失忆!具体原理可以自行研究,比如GLM-5.1模型官配是200K上下文,有人就非要自己配置1M,越聊越蠢,最后崩盘,我只希望不要把这个问题乱扣在软件本身
至于每个模型的上下文到底多少,第一可以去查官方文档,第二可以直接问以下AI
其四是工具调用轮次,这个参数非专业人士推荐保持默认200次,否则大模型死循环时Token爆炸烧钱不要来找我。

以上就是目前版本TRAE IDE自定义模型添加的教程,接下来是SOLO端,其实基本一致!

SOLO桌面端配置

添加位置:

左下角头像->设置->模型->添加模型
注意如果你同时安装了IDE和SOLO,IDE的模型配置会同步过来


添加自定义模型

此处添加教程与IDE一直,不再赘述

Kimi的添加教程点击下方原版教程里有!

最后放一些常见厂商自定义地址:

  • 302.ai:https://api.302.ai/v1
  • Openrouter:https://openrouter.ai/api/v1
  • 讯飞星辰Maas:https://maas-coding-api.cn-huabei-1.xf-yun.com/v2
  • 百度千帆:https://qianfan.baidubce.com/v2
  • 小米Mimo:https://api.xiaomimimo.com/v1
  • 小米Mimo(Token Plan):https://token-plan-cn.xiaomimimo.com/v1/chat/completions
  • DeepSeek:https://api.deepseek.com
  • 火山方舟(Coding Plan):https://ark.cn-beijing.volces.com/api/coding/v3
  • 智谱(Coding Plan):https://open.bigmodel.cn/api/coding/paas/v4

点击展开原版教程

TRAE IDE的.51版本灰度了自定义base url功能(国内版v3.3.51,国际版v3.5.51),但是论坛和社群有很多人都出现了配置错误,在这里出一份简易教程,以国内版TRAE IDE为例

2026.05.09更新

省流版(TRAE内置服务商直接选即可,无内置服务商选择OpenAI协议[兼容性最好])

服务商:OpenAI
模型ID:前往自己的供应商查询,各家有不同的命名规则,确保自己输入ID名称正确
自定义请求地址:

  • 302.ai:https://api.302.ai/v1/chat/completions
  • Openrouter:https://openrouter.ai/api/v1/chat/completions
  • 讯飞星辰Maas:https://maas-coding-api.cn-huabei-1.xf-yun.com/v2/chat/completions
  • 百度千帆(这个我不确定,没有实验):https://qianfan.baidubce.com/v2/coding/chat/completions
  • 小米Mimo:https://api.xiaomimimo.com/v1/chat/completions
  • 小米Mimo(Token Plan):https://token-plan-cn.xiaomimimo.com/v1/chat/completions
  • DeepSeek:https://api.deepseek.com/chat/completions
  • 火山方舟(Coding Plan):https://ark.cn-beijing.volces.com/api/coding/v3/chat/completions
  • 智谱(Coding Plan):https://open.bigmodel.cn/api/coding/paas/v4/chat/completions

服务商:Anthropic
模型ID:前往自己的供应商查询,各家有不同的命名规则,确保自己输入ID名称正确
自定义请求地址:

  • MiniMax(Token Plan):https://api.minimaxi.com/anthropic/chat/completions

Kimi code配置参数

最特殊的供应商:Kimi(点名表扬,为啥你的服务url不跟着国际定义走?)
根据LoongWang小伙伴的分享(原帖),kimi配置如下
供应商:Anthropic
模型ID:kimi-for-coding
自定义请求地址:https://api.kimi.com/coding/v1/messages

原帖内容

报!本地自建大模型服务接入的我看到有很多人按照方法配置不上,具体原因和处理办法我也不会~提前在这里加一下提醒

注意:一切配置以当前时间节点为准,后续更新变更以最新标准为准

这里是完成教程后仍然有人犯错的部分,所以写在前面,把最容易犯错的部分说一下!!!

其一是供应商选择!!!不是选择你这个模型的供应商(举例想用GLM-5.1不是要选Bigmodel,而是选择提供服务供应商支持的base协议!!!目前最流行的只有两个!!!OpenAI协议和Anthropic协议,简而言之你想要自定义服务只能从这两中选择!!!具体去看你的供应商支持什么协议)

其二是完整的base url!!!从你的供应商处获取的base url自己在末尾加上/chat/completions !!!当然有部分供应商本身就是完整的,不要再重复添加了,例如302.ai就是完整的!

其三是阿里云百炼(Token Plan)目前不支持TRAE配置(和群友折腾了半天没成功)

有官方内置的服务就选官方内置的,这里主要为没有内置的指引
设置 → 模型 → 添加模型


根据你想添加的供应商支持协议确定这里选择的服务商,自行前往对应供应商查看(此处以讯飞星辰为例)


讯飞星辰支持openai和anthropic协议,两者任选其一!此处以OpneAI协议为例!


模型ID前往自己的供应商查询!每家供应商模型命名规则不统一!!!自己查询确定!!!
(不要问为啥配置的ID没问题还是不行,到最后一看却是我以为是这个,原来不是这个)

自定义请求地址不是供应商的单独base url
要填写完整地址,99%的添加失败问题都在这里!

即base url末尾+/chat/completions

后续官方会不会优化我不知道,一切以实际展示为准!


例如讯飞星辰的为:https://maas-coding-api.cn-huabei-1.xf-yun.com/v2/chat/completions

填写完自定义请求地址后添加API Key确认即可


我因为coding plan到期也不想续费,所以这里不演示了,但是已经确认这样添加没有问题~

7 个赞
Trae对第三方模型接入的支持非常有限
请TRAE支持kimi-code套餐
求官方增加mimo模型支持~
公司统一使用sub2api中转,trae可以做相关配置吗
自定义模型如何配置base url?
自定义模型(火山引擎 plan)GLM5.1 一直卡在思考中
为什么昨天可以用deepseek v4 pro,今天就用不了了?非trae内置的模型。
自定义大模型报错
能否支持一下联通云的coding plan
国内版3.3.52帮定自定义模型一直报错
添加自定义模型不能用
自定义模型对话报错
腾讯的token plan用不了吗?我看自定义模型有自定义请求地址了,我填入后显示404
模型服务商只能选内置这几个?像小米这种怎么接入?
支持本地部署的大模型
Trae调用本地Ollama Gemma4 E4B
华为modelarts模型接入trae
SOLO模式子任务下出现压缩行为时会导致子任务卡住
KIMI2.6无法使用
Trae 调用格式不符合Claude 的要求
关于怎么接入第三方中转商的模型?
配置模型API
【TRAE】DeepSeek-v4-pro设置
TRAE SOLO 目前不支持添加模型吗?
trae是不是不支持glm-4.7-flash啊
添加小米模型
第一次使用TRAE的第三方模型功能,但是不论怎么弄都会模型请求失败
配置三方地址和key ,不报错一直思考中
开始割了吗?才过了几天好日子?
标题:用户 860016161398 求助:自定义模型功能异常、限额频繁、智能体卡死问题
Trae CN 使用自定义模型deepseek v4 flash 一直分析问题
又让休息了,三方免费模型添加上了不让用,咋整啊??
如何在 SOLO 添加 kimi code plan
准时准点强制我防沉迷了??为什么 之前随便耍 为什么防我?!!没招了
火山的agent plan怎么添加?自定义?还是选火山引擎?
kimi code api无法使用
Trae IDE 与 Trae SOLO 均已经停止服务,请问如何处理?
关于KIMI CODE PLAN的在TRAE中的使用问题-Ver.2
【Skill 创作】TRAE 自定义模型配置Skill 帮你解决99%的配置参数问题![还会实时更新进化]
自定义模型报500怎么更改超时时间啊?
Trae无法支持腾讯云的模型
火山引擎的GLM5.1添加模型后,显示有图片理解,使用报错
Trae solo 桌面版配置第三方模型
添加自定义模型不能用
TRAE CN版本3.3.57无法接入Kimi-k2.6或kimiforcoding,请问下有没有解决的办法么
TRAE国内版如何接入 KIMI CODING PLAN
solo 桌面端的 DeepSeek v4 有成功接入的吗,请教这个请求地址怎么填的
云桌面自定义模型报错
trae国内版支持自定义自己公司搭建的大模型服务平台吗

昨天还能用本地部署的模型,今天相同的模型干相同的活,就直接卡住了。唯一变化的只有Trae(几乎日更)

2026-04-22T11:02:37.884+08:00 [info] [窗口] [TransportManager] executeRequest, ckg setup, 55c3eec2-a164-4a8e-8688-2ef72cfe3579, cost: 0

2026-04-22T11:02:37.947+08:00 [info] [窗口] [TransportManager] executeRequest success, ckg setup, 55c3eec2-a164-4a8e-8688-2ef72cfe3579, cost: 64

2026-04-22T11:02:37.947+08:00 [info] [窗口] [ckg] setupCKG {“message”:“success”,“code”:0,“data”:null}

2026-04-22T11:02:37.948+08:00 [info] [窗口] [TransportManager] executeRequest success, ckg refresh_token, cd855adf-c0d5-4fc9-ac44-d8995dbff074, cost: 65

2026-04-22T11:02:52.157+08:00 [info] [窗口] [CommandAdapter][execute_command] from: undefined, stream_id:d4c4e9ba-1bcb-48e1-9051-ca6b748127e4, command:icube.common.commands.getAppPrivacyMode timeout:2000

2026-04-22T11:03:22.163+08:00 [info] [窗口] [CommandAdapter][execute_command] from: undefined, stream_id:0dde2c12-1e14-4caa-81e2-e3ca15a82ed0, command:icube.common.commands.getAppPrivacyMode timeout:2000

2026-04-22T11:03:52.160+08:00 [info] [窗口] [CommandAdapter][execute_command] from: undefined, stream_id:c3a955b7-3056-4b26-844e-92b6ea874ac8, command:icube.common.commands.getAppPrivacyMode timeout:2000

2026-04-22T11:04:22.159+08:00 [info] [窗口] [CommandAdapter][execute_command] from: undefined, stream_id:2610c764-6771-444a-90a6-a9038442000f, command:icube.common.commands.getAppPrivacyMode timeout:2000

4 个赞

按照你的步骤成功了,是baseUrl的问题,得加上后面的v2/chat/completions。难顶

3 个赞

补充一下:DMAX中转的配置

不知道baseUrl就找提供商提工单或问客服,试了一遍就通过测试了

4 个赞

原来如此,我还以为这两个选项意味着只能使用openAI和anthropic自己的大模型呢

2 个赞

这是最大的误区,也是导致配置失败的原因之一,目前国际主流只有这两家协议,所以自定义也要走这两家才行。

3 个赞

非常感谢!非常感谢!非常感谢! 按这个好了!真的是绝了 终于搞定了 阿里这是向整那样

2 个赞

加了chat/completions还是不行呢

2 个赞

本地部署的模型的API地址应该填ollma告诉你的那个

2 个赞

有人出现这个情况吗,接的ds官方api,顺序全是乱的,solo模式下

3 个赞

还是不行。选择openrouter中trae自带的模型id没问题可以正常对话。但是添加自定义模型id时,虽然可以添加成功,对话也没有报错,但是显示的对话内容是空的 :enraged_face:

2 个赞

我这边没问题啊,openrouter配置的混元3

2 个赞

求助大佬,实在是找不到什么原因了,求指导~~

我是用的最新版Trae-cn,调用本地Ollama+Gemma4:e4b,Trae的配置如下图

发送请求后,Trae客户端接收到“返回4054错误代码”,如下图:

Ollama服务端,通过ollama ps能看到模型在run;

另外补充,自己构建Agent是可以调用Ollama+Gemma4:e4b,如下图(也就是说本地模型应该是没问题的)

2 个赞

另外补充:这是Ollama对OpenAI兼容的说明,如下图:

2 个赞

这个十分抱歉,因为我没有本地部署模型的经验,对于本地Ollama的配置我确实不熟悉,所以你的问题我看了一下,从我认知中的理论是没有问题的,但是为什么仍然不通我确实不懂的原因
4054报错码我在论坛查了查,大多数的问题源自网络问题,具体怎么办我确实也没有懂,抱歉

2 个赞

你好,我刚刚用MTC尝试分析解决了一下,他搜索到网上有一篇掘金的文章提到过此类问题,我让他总结了一下你的问题尝试给出解决方案,内容如下:
掘金原文: Trae IDE 本地调用 Gemma4:E4B 大模型全场景开发完美配置教程# Trae IDE 本地Gemma 4B - 掘金

一、问题描述

用户使用 最新版 Trae-CN,调用本地部署的 Ollama + Gemma4:E4B 模型时,Trae 客户端返回 4054 错误代码

已确认正常的部分

  • :white_check_mark: Ollama 服务端正常:通过 ollama ps 可以看到模型正在运行

  • :white_check_mark: 本地模型本身没问题:用户自己构建 Agent 可以正常调用 Ollama + Gemma4:E4b

  • :white_check_mark: Ollama 的 OpenAI 兼容接口正常:用户确认了 Ollama 提供了 OpenAI 兼容的 API 说明

  • :white_check_mark: Base URL 配置正确:经确认,用户填写的 Base URL 地址无误


二、根因分析

最可能的原因:Ollama 默认 num_ctx 太小导致上下文溢出

根据多篇 Trae + Ollama + Gemma4 的配置教程,存在一个被广泛忽视的天坑

Ollama 原生默认的 num_ctx 仅为 2048 tokens,而 Trae 的 Builder 模式光系统提示词就会占用 1000~2000 token,剩下的空间跑 2 轮就满了。

用户使用的是原始的 gemma4:e4b 模型(没有经过 Modelfile 固化参数),这意味着:

  • 默认 num_ctx = 2048

  • Trae 发送请求时,系统提示词 + 用户消息可能直接接近或超过这个上限

  • 模型无法正常处理请求,返回异常,Trae 客户端将其解读为 4054 错误

这完美解释了以下现象:

现象 解释
Ollama 服务端正常(ollama ps 显示模型在运行) 模型确实已启动,但请求处理失败
自己构建 Agent 能正常调用 Agent 模式的提示词更短,没有超过 2048 上限
Trae 的 Builder/Chat 模式报 4054 Trae 内置的系统提示词过长,直接撑爆了默认上下文窗口

其他可能原因(按概率排序)

优先级 原因 说明
:star::star::star: 默认 num_ctx 太小 Ollama 默认 2048,Trae 系统提示词就快占满了,请求直接溢出
:star::star: 服务商选择错误 选了 OpenAI 而非 Ollama。选 OpenAI 协议时 URL 需加 /v1,且 Ollama 的 OpenAI 兼容接口和原生接口行为有差异
:star::star: 模型 ID 填写问题 填的是 Gemma4:e4b,但 Ollama 中模型名可能是 gemma2:4b 或其他,大小写敏感
:star: Trae 版本兼容性 Bug 同帖另一位用户反馈"昨天能用今天不能用",可能是 Trae 更新引入的回归问题
:star: 网络/代理拦截 4054 也可能代表网络层错误,Trae 可能无法正常连接 localhost

三、解决方案

第一步(最关键):创建固化参数的自定义模型

创建一个 Modelfile 文件:


FROM gemma2:4b

# 核心防断流/防截断参数

PARAMETER num_ctx 8192

PARAMETER num_predict 2048

# 代码开发专属稳定参数

PARAMETER temperature 0.25

PARAMETER top_k 25

PARAMETER top_p 0.9

PARAMETER repeat_penalty 1.1

然后执行:


ollama create gemma:4b-trae -f ./Modelfile

在 Trae 中使用 gemma:4b-trae 这个固化后的模型名。

硬件参考:8G 显存最大安全 num_ctx 为 8192,16G+ 显存可设为 16384(需 RoPE 缩放)。

第二步:确认服务商选择

方案 服务商 Base URL 说明
方案一(推荐) Ollama http://localhost:11434 不加 /v1 后缀
方案二(兜底) OpenAI http://localhost:11434/v1 必须加 /v1 后缀

第三步:确认模型 ID

运行 ollama list 确认实际模型名称,确保 Trae 中填写的模型 ID 与 ollama list 显示的完全一致(大小写敏感)。


四、补充说明

4054 错误码的含义

帖子作者 JasonShane 在论坛中查询后表示,4054 错误码大多数源自网络问题。但结合上下文分析,在本场景中更可能是请求参数溢出导致模型无法正常响应,Trae 将其归类为网络/连接类错误。

同帖其他用户反馈

  • 用户38490:昨天还能用的本地模型,今天相同配置就不行了,唯一变化是 Trae 更新了 → 可能存在 Trae 版本回归 Bug

  • 用户16804:按照教程配置后成功,确认是 Base URL 的问题(需加 /v2/chat/completions 后缀)

  • 用户44267:OpenRouter 自定义模型添加成功但对话内容为空 → 可能是模型 ID 或协议兼容问题


五、总结

核心原因大概率是:Ollama 默认 num_ctx=2048 太小,Trae 的系统提示词直接把上下文撑爆了,导致请求失败返回 4054。 用户自己构建 Agent 能用是因为 Agent 模式的提示词更短,没有触发这个限制。解决方案是通过 Modelfile 固化一个 num_ctx=8192 的自定义模型。

2 个赞

感谢哥~

这个思路对我太有用了,太谢谢你了!

由于Ollama是在6G显存的笔记本跑的,之前一直默认的上下文大小,稍后我调整试一试~

大恩不言谢,欢迎来重庆玩~ :grin:

2 个赞

我也不确定是否正确,你可以试着尝试一下,因为自建模型接入我确实不太懂

2 个赞

大佬,为什么我的小米接入一直是报错,能不能看看我的帖子

2 个赞

已回复,检查模型id

2 个赞