[2025年8月更新,Poe修改了API计费方式,回复不再按条收费。准备切换到https://bigmodel.cn/claude-code]

之前我写了一篇文章:在MacBook Pro上离线运行gpt-oss-120b驱动Claude Code,但实际使用中发现了几个限制。

首先,MacBook Pro上运行gpt-oss-120b时只能跑一个模型实例,无法同时运行多个Claude Code实例来并行处理不同的编码任务。另外,对于复杂的编程任务,开源模型的能力不够用。

最近,Poe推出了兼容OpenAI的Poe API,提供了几个性价比不错的模型选择。从计费方式看,Poe API的输入费用按token数量计算,输出费用则是固定的。相比其他API服务,当输出token较长的时候价格更经济。相当于提供了另一种访问GPT-5和Claude Opus 4.1模型的渠道。

图片来自Poe Blog
图片来自Poe Blog

Poe的订阅价格梯度为:20美元100万积分、50美元250万积分、100美元500万积分、250美元1250万积分,平均下来每1万积分约0.2美元。

GPT-5价格相对便宜
GPT-5价格相对便宜
Claude Opus 4.1比GPT-5贵了大约20倍
Claude Opus 4.1比GPT-5贵了大约20倍

但是,Poe API有个明显的缺点:目前不支持tool use功能。这意味着Claude Code的工具调用都无法正常执行。

为了解决这个问题,我给claude-code-router添加了tooluse-router功能,用本地的gpt-oss-120b模型执行tool use功能。我提交的功能PR GitHub Pull Request #592 目前还在等待合并,如果想试用,需要先克隆我的仓库安装。

下面是我目前使用的Claude Code Router配置:用LM Studio运行的本地gpt-oss-120b模型为Poe提供tool use功能,主要功能则由GPT-5 (Poe)提供。由于GPT-5 (Poe)的上下文窗口目前最大只有400k,所以通过Gemini 2.5 Pro (Poe)来处理需要1M长上下文的情况。最后,web搜索功能则由Gemini API提供。

cat > ~/.claude-code-router/config.json << EOF
{
  "LOG": false,
  "API_TIMEOUT_MS": 600000,
  "HOST": "127.0.0.1",
  "PORT": 7890,
  "APIKEY": "",
  "PROXY_URL": "",
  "NON_INTERACTIVE_MODE": false,
  "Transformers": [],
  "Providers": [
    {
      "name": "lmstudio",
      "api_base_url": "http://localhost:1234/v1/chat/completions",
      "api_key": "not_needed",
      "models": [
        "gpt-oss-120b"
      ],
      "transformer": {
        "use": [
          ["maxtoken", {"max_tokens": 131072}],
          "enhancetool"
        ]
      }
    },
    {
      "name": "poe",
      "api_base_url": "https://api.poe.com/v1/chat/completions",
      "api_key": "YOUR_POE_API_KEY",
      "models": [
        "gpt-5",
        "gemini-2.5-pro",
        "gemini-2.5-flash",
        "claude-opus-4.1"
      ],
      "transformer": {
        "use": [
          "cleancache",
          ["tooluse-router", {"toolUseModel": "lmstudio,gpt-oss-120b"}]
        ]
      }
    },
    {
      "name": "gemini",
      "api_base_url": "https://generativelanguage.googleapis.com/v1beta/models/",
      "api_key": "YOUR_GEMINI_API_KEY",
      "models": [
        "gemini-2.5-flash",
        "gemini-2.5-pro"
      ],
      "transformer": {
        "use": [
          "gemini"   
        ]
      }
    }
  ],
  "Router": {
    "default": "poe,gpt-5",
    "background": "poe,gpt-5",
    "think": "poe,gpt-5",
    "longContext": "poe,gemini-2.5-pro",
    "longContextThreshold": 400000,
    "webSearch": "gemini,gemini-2.5-flash"
  }
}
EOF

记得定期更新Claude Code Router:

npm install -g @musistudio/claude-code-router@latest

使用这个配置已经一周了,我发现GPT-5的编程能力确实有明显提升,生成的代码更加精准,特别是gpt-5-high reasoning版本。