VPS部署FreeLLMAPI — 聚合白嫖16家LLM免费API

clover2026-06-142026-06-30

FreeLLMAPI — 把16家免费大模型API聚合到一个端点

把 Google、Groq、Cerebras、Mistral、OpenRouter 等 16 家 LLM 提供商的免费额度聚合到一个兼容 OpenAI 的 /v1 端点，自带智能路由、自动故障转移、速率追踪，月均可用约 1.7B tokens。

部署

前提：服务器装好 Docker + Docker Compose。

一键安装：

1 2	# 一键安装：拉镜像、生成密钥、启动容器 curl -fsSL https://freellmapi.co/install.sh \| bash

这会自动拉镜像、生成加密密钥、启动容器。装好之后服务跑在 localhost:3001。

如果要从外网访问，加个环境变量重新启动：

1 2	# 绑定所有网卡，允许外网访问 HOST_BIND=0.0.0.0 docker compose up -d

然后浏览器打开 http://<服务器IP>:3001，注册账号，在 Keys 页面添加各家的免费 API key，从页面顶栏复制 unified API key 即可使用。

使用

任何 OpenAI 兼容客户端，换一下 base_url 和 api_key 就行：

from openai import OpenAI

client = OpenAI(
    base_url="http://你的服务器IP:3001/v1",  # 换成你的服务器地址
    api_key="freellmapi-你的unified-key",     # 网页上复制的 unified key
)

resp = client.chat.completions.create(
    model="auto",  # 自动选最佳模型，也可指定如 "gemini-2.5-flash"
    messages=[{"role": "user", "content": "你好"}],
)
print(resp.choices[0].message.content)

model="auto" 让路由器自动选当前可用的最佳模型，也可以指定具体模型如 "gemini-2.5-flash"。响应头 X-Routed-Via 会告诉你实际走了哪家。

支持 streaming、tool calling、vision 图片输入，基本覆盖日常 LLM 调用场景。

安装成功后的预览图

几点注意

没有最强模型 — 没有 Claude、GPT 这类顶尖模型
越往后越菜 — 高级大模型额度用完，路由器自动降级到小模型
延迟看运气 — Cerebras/Groq 飞快，有的家慢
免费额度可能变动 — 厂商随时可能收紧免费层
本地自用 — 单用户设计，别直接暴露到公网

维护

# 拉取最新镜像并重启
cd /root/freellmapi && docker compose pull && docker compose up -d

# 实时查看日志（排查问题用）
cd /root/freellmapi && docker compose logs -f

# 停止容器、删除数据、清理文件，一套卸载干净
cd /root/freellmapi && docker compose down -v && cd .. && rm -rf /root/freellmapi

相比之前用的 new-api 需要自己填各家模型参数，FreeLLMAPI 的自动发现和故障转移体验好很多，一劳永逸的配置体验。