ag助手怎么添加本地部署？老鸟手把手教你避开那些坑

发布时间：2026/5/1 15:13:53

干了9年大模型这行，我见过太多人为了所谓的“隐私安全”或者“省钱”，一头扎进本地部署的坑里。结果呢？显卡烧了，代码报错了，最后只能对着黑屏发呆。今天咱们不整那些虚头巴脑的概念，就聊聊 ag助手怎么添加本地部署这个具体操作。说实话，这玩意儿要是没点耐心，真容易劝退。

先说个真事儿。上周有个兄弟找我，说他买了个4090，想自己跑个7B的模型，结果配置搞了三天三夜，连个API Key都连不上。我一看他的配置，好家伙，环境变量写得比天书还乱。其实， ag助手怎么添加本地部署的核心逻辑并不复杂，难的是细节。

第一步，你得有个能跑起来的本地服务。别一上来就想着怎么接入，先把底座打好。我推荐用 Ollama 或者 vLLM，这两个对新手相对友好。如果你用的是 Ollama，启动命令很简单，在终端输入 ollama run qwen2.5 就行。这时候，你的本地就有一个地址在监听，通常是 http://localhost:11434。记住这个地址，后面要用。

第二步，配置 ag助手的 API 接口。这里有个大坑，很多人以为直接填本地地址就完事了。其实， ag助手怎么添加本地部署的关键在于“兼容性”。大多数 ag助手默认支持 OpenAI 协议的接口。所以，你要确保你的本地模型服务暴露出的是 OpenAI 格式的 API。如果用的是 Ollama，它本身就支持这个协议，不用额外折腾。如果是其他模型，可能需要写个简单的中转脚本，把请求转成 OpenAI 的格式。这一步要是搞不定，后面全是白搭。

第三步，在 ag助手里填入配置。打开 ag助手的设置页面，找到“模型管理”或者“API设置”。在“自定义模型”或者“第三方模型”那一栏，填入你刚才记下的地址，比如 http://localhost:11434。然后，API Key 那里，大部分本地服务是不需要 Key 的，你可以随便填一串字符，比如 123456，或者留空，具体看 ag助手的提示。我一般填 local，看着顺眼。

第四步，测试连接。别急着开始聊天，先点一下“测试连接”。如果提示成功，那恭喜你，第一步跨过去了。如果失败，别慌，检查三件事：一是本地服务真的在跑吗？打开浏览器访问 http://localhost:11434 看看有没有反应。二是防火墙有没有拦着？虽然本地访问一般不受影响，但有些杀毒软件会抽风。三是 ag助手的版本是不是太老？老版本可能不支持最新的 API 格式。

我为什么这么强调这些细节？因为我在行业里见过太多人，连本地服务都没跑通，就急着问 ag助手怎么添加本地部署的问题。这就像没学会走路就想跑，肯定摔跤。而且，本地部署有个好处，就是你可以完全控制数据。你的对话记录，你的敏感信息，都在你自己的硬盘里，不用上传到云端。这对于做数据分析、写代码辅助的人来说，太重要了。

当然，本地部署也有缺点。速度慢，显存占用高，模型能力不如云端的大模型。如果你只是日常闲聊，或者需要强大的逻辑推理，可能还是云端更合适。但如果你需要处理大量私有数据，或者对隐私有极致要求，那本地部署是唯一的选择。

最后，总结一下。 ag助手怎么添加本地部署其实就三步：跑通本地服务、确保 OpenAI 兼容、填入配置测试。别被那些复杂的术语吓到，动手试一次，你就明白了。要是还遇到问题，去 GitHub 上看看 Issues，大部分问题都有人遇到过。

记住，技术这东西，不是看会的，是练会的。别光看文章，去试试。哪怕搞砸了，也是经验。毕竟，在这行混了9年，我最大的收获就是：别怕出错，怕的是不敢动手。