GLM Proxy

让 Codex CLI 直接使用智谱 GLM 系列模型（glm-5 / glm-5.1 / glm-5.2）的本地代理。

Codex CLI 原生只支持 OpenAI Responses API，而智谱 GLM 提供 Chat Completions 和 Anthropic Messages 两种端点。本代理在中间做协议翻译，并处理 Codex 与 GLM 之间的工具格式差异（特别是 apply_patch）。

架构

Codex CLI ──► GLM Proxy (:9999)
                 │
                 ├─► [主路径] Responses→Messages 转换 ──► GLM Anthropic Messages 端点
                 │            (ccproxy-api)
                 │
                 └─► [备用路径] codex-relay ──► GLM Chat Completions 端点
                              (Responses→Chat Completions)

三个核心组件

组件	作用
GLM Proxy（本仓库）	主入口 `:9999`。多上游回退、密钥注入、限速、`apply_patch` 工具格式修复、流式错误拦截
ccproxy-api	Responses API ↔ Anthropic Messages 格式互转（主路径）。启动时自动 pip 安装
codex-relay	Responses API ↔ Chat Completions 翻译（备用路径）。启动时自动 pip 安装

功能

协议翻译：Codex 的 Responses API 请求转成 GLM 能理解的 Anthropic Messages 格式
多上游回退：配置多个上游（内网网关 / 中转站 / 智谱官方），按优先级和健康状态自动切换
工作时间路由：工作时间优先中转站，非工作时间走官方
apply_patch 支持：GLM 不原生支持 Codex 的 FREEFORM 工具，代理做双向转换
- 请求侧：custom/grammar 工具定义 → GLM 可调用的 function 格式
- 响应侧：GLM 的 function_call → Codex 的 custom_tool_call（含完整流式 delta 事件）
- 请求侧：Codex 的 custom_tool_call_output → GLM 的 function_call_output
流式错误拦截：GLM 流式返回 1234（上下文超限）/1305（限速）错误时，合成正常结束保留已生成内容
官方限速：令牌桶控制官方 API 请求频率，防止 1305
max_tokens 兜底：自动补全默认值，避免智谱 count_tokens 在 None 时崩溃
健康检查：定时验证内网网关模型身份，异常时飞书告警
namespace 工具名修正：处理 codex-relay 对 MCP namespace 工具的命名拼接

配置

密钥等敏感信息存在 config.json（已 gitignore，不会提交）。首次使用：

cp config.example.json config.json
# 编辑 config.json 填入真实密钥

配置结构见 config.example.json：

{
  "feishu_webhook": "https://...",            // 健康检查告警 webhook（可选）
  "upstreams": [
    {
      "name": "official",                      // 上游名称
      "openai_url": "...",                     // Chat Completions 端点（备用路径）
      "anthropic_url": "...",                  // Anthropic Messages 端点（主路径）
      "anthropic_auth": "x-api-key",           // 认证方式：x-api-key / bearer
      "key": "...",                            // API 密钥
      "relay_port": 4446,                      // codex-relay 端口
      "interceptor_port": 14446,               // 拦截器端口
      "model": "glm-5.2",                      // Chat Completions 模型名
      "messages_model": "glm-5.2",             // Messages 端点模型名（不填则回退到 model）
      "max_context_tokens": 202745             // 上下文窗口
    }
  ]
}

上游字段说明：

字段	必填	说明
`name`	是	上游标识，用于路由和日志
`key`	是	API 密钥
`model`	是	Chat Completions 路径用的模型名
`relay_port` / `interceptor_port`	是	codex-relay 子进程端口，各上游不能重复
`anthropic_url`	否	配置则走 Messages 直连主路径（推荐）
`anthropic_auth`	否	`x-api-key`（智谱官方）或 `bearer`（中转站）
`messages_model`	否	Messages 端点模型名，不填回退到 `model`
`max_context_tokens`	是	上下文窗口，用于触发 max_tokens 上限保护

使用

1. 安装依赖

pip install ccproxy-api codex-relay

（代理启动时会自动检查并安装）

2. 启动代理

python3 glm_proxy.py

默认监听 0.0.0.0:9999。

3. 配置 Codex CLI

将 Codex 的 API 端点指向本代理：

http://<代理机器IP>:9999

4. 验证

curl http://127.0.0.1:9999/v1/models

上游路由规则

未指定上游时，按以下规则自动选择：

内网网关（internal）：健康检查通过才使用
中转站（external）：工作时间优先；非工作时间也可用（临时放开）
官方（official）：工作时间跳过（除非中转站不可用），非工作时间使用

客户端可通过请求头指定上游（如 X-Upstream: official）直接走指定上游。

日志

控制台实时输出
logs/ 目录保存调试数据：
- exchange_*.json：请求+响应对（排查工具调用问题）
- debug_req_*.json：大请求体（排查上下文问题）
- proxy.log：nohup 后台运行时的完整日志

apply_patch 工作原理

Codex 的 apply_patch 是 FREEFORM 工具（grammar 格式），但：

GLM 不支持 FREEFORM 工具 → 代理把 grammar 工具定义转成普通 function，并在描述里教 GLM 生成 V4A patch 格式
GLM 返回的是 function_call → 代理转成 Codex 期望的 custom_tool_call，并补全流式 custom_tool_call_input.delta + .done 事件（否则长 patch 会被 Codex 丢弃）
Codex 返回 custom_tool_call_output → 代理转回 GLM 的 function_call_output

代理还会自动修复 GLM 常见的 patch 格式错误：补全 *** Begin/End Patch、清理带前缀的命令行。

限速与错误处理

1234（上下文超限）：流式拦截，保留已生成内容并合成正常结束
1305（限速）：令牌桶控制官方 API 频率（默认 1.5 req/s，突发 2）
上游失败：自动回退到下一个可用上游

许可

私有项目。

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.gitignore		.gitignore
README.md		README.md
config.example.json		config.example.json
glm_proxy.py		glm_proxy.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GLM Proxy

架构

三个核心组件

功能

配置

使用

1. 安装依赖

2. 启动代理

3. 配置 Codex CLI

4. 验证

上游路由规则

日志

apply_patch 工作原理

限速与错误处理

许可

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

GLM Proxy

架构

三个核心组件

功能

配置

使用

1. 安装依赖

2. 启动代理

3. 配置 Codex CLI

4. 验证

上游路由规则

日志

apply_patch 工作原理

限速与错误处理

许可

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages