VPS部署FreeLLMAPI — 聚合白嫖16家LLM免费API

FreeLLMAPI — 把16家免费大模型API聚合到一个端点

项目地址:tashfeenahmed/freellmapi

把 Google、Groq、Cerebras、Mistral、OpenRouter 等 16 家 LLM 提供商的免费额度聚合到一个兼容 OpenAI 的 /v1 端点,自带智能路由、自动故障转移、速率追踪,月均可用约 1.7B tokens。

部署

前提:服务器装好 Docker + Docker Compose。

一键安装:

1
2
# 一键安装:拉镜像、生成密钥、启动容器
curl -fsSL https://freellmapi.co/install.sh | bash

这会自动拉镜像、生成加密密钥、启动容器。装好之后服务跑在 localhost:3001

如果要从外网访问,加个环境变量重新启动:

1
2
# 绑定所有网卡,允许外网访问
HOST_BIND=0.0.0.0 docker compose up -d

然后浏览器打开 http://<服务器IP>:3001,注册账号,在 Keys 页面添加各家的免费 API key,从页面顶栏复制 unified API key 即可使用。

使用

任何 OpenAI 兼容客户端,换一下 base_urlapi_key 就行:

1
2
3
4
5
6
7
8
9
10
11
12
from openai import OpenAI

client = OpenAI(
base_url="http://你的服务器IP:3001/v1", # 换成你的服务器地址
api_key="freellmapi-你的unified-key", # 网页上复制的 unified key
)

resp = client.chat.completions.create(
model="auto", # 自动选最佳模型,也可指定如 "gemini-2.5-flash"
messages=[{"role": "user", "content": "你好"}],
)
print(resp.choices[0].message.content)

model="auto" 让路由器自动选当前可用的最佳模型,也可以指定具体模型如 "gemini-2.5-flash"。响应头 X-Routed-Via 会告诉你实际走了哪家。

支持 streaming、tool calling、vision 图片输入,基本覆盖日常 LLM 调用场景。

安装成功后的预览图

几点注意

  • 没有最强模型 — 没有 Claude、GPT 这类顶尖模型
  • 越往后越菜 — 高级大模型额度用完,路由器自动降级到小模型
  • 延迟看运气 — Cerebras/Groq 飞快,有的家慢
  • 免费额度可能变动 — 厂商随时可能收紧免费层
  • 本地自用 — 单用户设计,别直接暴露到公网

维护

1
2
3
4
5
6
7
8
# 拉取最新镜像并重启
cd /root/freellmapi && docker compose pull && docker compose up -d

# 实时查看日志(排查问题用)
cd /root/freellmapi && docker compose logs -f

# 停止容器、删除数据、清理文件,一套卸载干净
cd /root/freellmapi && docker compose down -v && cd .. && rm -rf /root/freellmapi

相比之前用的 new-api 需要自己填各家模型参数,FreeLLMAPI 的自动发现和故障转移体验好很多,一劳永逸的配置体验。