免费大模型 API
收录国内外最全的免费大模型 API 平台和开源推理项目。从云平台到自部署方案,帮你找到最合适的免费 LLM 调用方式。
🆕 最新发现每周自动更新
云平台 API16 个平台
OpenRouter
免费额度 + 按量付费最大的 LLM API 聚合平台,统一接口调用 300+ 模型。提供免费额度用于测试,按用量付费,无需单独注册各厂商。
可用模型
- 统一 API 格式,切换模型只需改参数
- 免费额度可测试所有模型
- 内置模型对比和价格计算器
Cloudflare Workers AI
每天 10,000 次免费 + 超额按量Cloudflare 推出的边缘 AI 推理服务,在全球 300+ 数据中心部署。免费 tier 包含每天 10,000 次推理请求。
可用模型
- 全球低延迟(最近的边缘节点)
- 免费额度慷慨
- 与 Cloudflare 生态无缝集成
Groq
免费额度 + 按量付费全球最快的 LLM 推理平台,基于自研 LPU 芯片。提供免费 API 额度,推理速度是传统 GPU 的 10 倍以上。
可用模型
- 极致推理速度(1000+ tokens/s)
- 免费额度足够个人开发
- 兼容 OpenAI API 格式
Together AI
注册送 $25 免费额度专注于开源模型推理的云平台,提供免费积分用于测试。支持主流开源模型的快速部署和微调。
可用模型
- 开源模型最全
- 支持 LoRA 微调
- 提供专用推理端点
DeepSeek API
注册送 500万 token + 极低价格国产最强开源大模型官方 API,价格不到 GPT-5 的 1/10。新用户注册赠送 500 万 token 免费额度。
可用模型
- 极致性价比
- 中文最强
- 兼容 OpenAI API 格式
Google AI Studio (Gemini API)
免费 tier 每天 1500 次请求Google 官方 Gemini API 免费使用入口。提供慷慨的免费额度,支持文本、图像、音频多模态调用。
可用模型
- 完全免费 tier
- 多模态能力最强
- 200万 token 上下文
Mistral API (La Plateforme)
免费试用 + 按量付费欧洲最强 AI 公司 Mistral 的官方 API 平台。提供免费试用额度,模型在推理和代码生成方面表现出色。
可用模型
- 欧洲数据合规(GDPR)
- 代码模型 Codestral 极强
- 开源权重可自部署
SiliconFlow (硅基流动)
注册送免费额度 + 按量付费国内一站式开源大模型 API 平台,聚合 Qwen、DeepSeek、Llama 等主流开源模型。注册送免费额度。
可用模型
- 国内访问低延迟
- 开源模型覆盖全
- 微信小程序可直接体验
Hugging Face Inference API
免费 tier(速率限制)+ Pro $9/月全球最大的 AI 模型社区 Hugging Face 提供的免费推理 API。50 万+ 模型可直接调用,免费 tier 限速使用。
可用模型
- 模型数量全球第一
- 社区活跃
- 可一键部署到自己的空间
NVIDIA NIM API
注册送 1000 积分免费试用NVIDIA 官方推理微服务 API,提供优化的开源模型部署。注册即送 1000 积分,可用于调用各种优化模型。
可用模型
- NVIDIA 优化推理性能
- 企业级可靠性
- 支持私有化部署
Lambda Labs API
按量付费(成本定价)GPU 云计算服务商 Lambda 推出的 LLM API。以成本价提供开源模型推理,价格远低于主流厂商。
可用模型
- 价格极低(成本价)
- 无速率限制
- 适合大批量推理
Free LLM API (freellmapi)
完全免费(开源项目)开源项目,一键部署免费 LLM API 聚合服务。整合多个免费大模型接口,提供统一的 OpenAI 兼容 API 端点,无需 API Key 即可调用。
可用模型
- 零成本部署
- 无需任何 API Key
- OpenAI SDK 兼容
- Docker 一键启动
OpenAI-Compatible Free APIs (集合)
完全免费(社区资源)社区维护的免费 LLM API 资源合集,包含多个兼容 OpenAI 格式的免费 API 端点和自部署方案。
可用模型
- 持续更新的社区资源
- 包含自部署方案
- 兼容 OpenAI SDK
GroqCloud (国内镜像)
免费额度充足Groq 提供全球免费 API 访问,国内可通过代理或直连使用。LPU 推理芯片让速度和成本都极具优势。
可用模型
- 推理速度极快
- 免费额度大
- 开发者友好文档
ZhiPuAI API (智谱AI)
注册赠送免费 token + 按量付费智谱 AI 官方 API 平台,GLM 系列模型。新用户注册赠送大量免费 token,支持企业级调用。
可用模型
- 国产模型中文最强之一
- 多模态全覆盖
- 企业级 SLA
Qwen API (通义千问开放平台)
注册送百万 token + 按量付费阿里通义千问官方 API 平台。新用户赠送百万 token 免费额度,支持文本、图像、语音多模态调用。
可用模型
- 与阿里云生态集成
- 免费额度充足
- 中文场景优化
自部署 / 开源 API 服务器6 个项目
vLLM
最快的开源 LLM 推理引擎,支持 PagedAttention 和连续批处理。一行命令部署兼容 OpenAI 的 API 服务。
Ollama
最易用的本地 LLM 运行工具。一条命令下载并运行任何开源模型,自动暴露兼容 OpenAI 的 API 端点。
LocalAI
开源、自托管的 OpenAI API 替代方案。支持在消费级硬件上运行 LLM、图像生成、TTS 等,完全离线可用。
LM Studio
图形化的本地 LLM 运行工具。下载即用,内置模型浏览器,一键启动 API 服务器,开发者友好。
Text Generation Inference (TGI)
HuggingFace 官方推理服务器。专为生产环境设计的 LLM 部署方案,支持量化、张量并行和流式输出。
Xinference
国产开源 LLM 推理平台。支持 100+ 模型一键部署,Web UI 管理,自动暴露 API 端点。适合企业和个人部署。
快速开始建议
🚀 想尝鲜体验?
用 Google AI Studio 或 DeepSeek API,免费额度最充足,注册即用,无需绑卡。
⚡ 想要最快速度?
用 Groq,LPU 推理芯片提供 1000+ tokens/s 的极致速度,免费额度够日常开发。
🔧 想自己部署?
用 Ollama 或 vLLM,一条命令即可在本地启动兼容 OpenAI 格式的 API 服务,完全免费。