⚡ 免费 · 精选 · 每周更新

免费大模型 API

收录国内外最全的免费大模型 API 平台和开源推理项目。从云平台到自部署方案,帮你找到最合适的免费 LLM 调用方式。

🆕 最新发现每周自动更新

Replicate

免费账户每月100次预测

云端运行开源AI模型

模型部署云服务开发者

可用模型

Stable DiffusionWhisperLLaMA
  • 易于集成
  • 速度快
  • 支持多种框架

Cohere

免费层每月100次调用

企业级NLP与生成API

NLP生成企业

可用模型

CommandEmbedRerank
  • 中文支持好
  • 文档清晰
  • 性能稳定

AI21 Labs

免费层每月1000次调用

高级文本生成与理解API

文本生成理解NLP

可用模型

Jurassic-2Jamba
  • 创意生成强
  • 上下文长
  • 中文支持

智谱AI开放平台

注册送100万tokens

国产大模型API平台

国产大模型中文

可用模型

GLM-4GLM-3CodeGeeX
  • 中文优化
  • 国内访问快
  • 免费额度高

百度文心一言API

免费层每月50万tokens

百度大模型开放接口

国产对话搜索

可用模型

ERNIE-4ERNIE-3.5
  • 中文理解强
  • 生态完善
  • 国内稳定

Perplexity API

免费层每月100次查询

实时搜索增强AI问答

搜索问答实时

可用模型

SonarLlama-3
  • 引用来源
  • 信息新
  • 回答准确

Fireworks AI

免费层每月100万tokens

快速推理与微调平台

推理微调开发者

可用模型

Llama-3MixtralQwen
  • 速度优化
  • 支持微调
  • 价格透明

云平台 API16 个平台

OpenRouter

免费额度 + 按量付费

最大的 LLM API 聚合平台,统一接口调用 300+ 模型。提供免费额度用于测试,按用量付费,无需单独注册各厂商。

聚合平台多模型统一API

可用模型

GPT-5Claude 4Gemini 3DeepSeek V4Llama 4+2 more
  • 统一 API 格式,切换模型只需改参数
  • 免费额度可测试所有模型
  • 内置模型对比和价格计算器

Cloudflare Workers AI

每天 10,000 次免费 + 超额按量

Cloudflare 推出的边缘 AI 推理服务,在全球 300+ 数据中心部署。免费 tier 包含每天 10,000 次推理请求。

边缘计算免费tierServerless

可用模型

Llama 4MistralStable DiffusionWhisperBGE Embeddings
  • 全球低延迟(最近的边缘节点)
  • 免费额度慷慨
  • 与 Cloudflare 生态无缝集成

Groq

免费额度 + 按量付费

全球最快的 LLM 推理平台,基于自研 LPU 芯片。提供免费 API 额度,推理速度是传统 GPU 的 10 倍以上。

高速推理LPU芯片免费API

可用模型

Llama 4MixtralGemma 3DeepSeek R1
  • 极致推理速度(1000+ tokens/s)
  • 免费额度足够个人开发
  • 兼容 OpenAI API 格式

Together AI

注册送 $25 免费额度

专注于开源模型推理的云平台,提供免费积分用于测试。支持主流开源模型的快速部署和微调。

开源模型模型微调推理平台

可用模型

Llama 4DeepSeek V4MixtralQwen 3Stable Diffusion
  • 开源模型最全
  • 支持 LoRA 微调
  • 提供专用推理端点

DeepSeek API

注册送 500万 token + 极低价格

国产最强开源大模型官方 API,价格不到 GPT-5 的 1/10。新用户注册赠送 500 万 token 免费额度。

国产高性价比开源

可用模型

DeepSeek V4DeepSeek R1DeepSeek Coder
  • 极致性价比
  • 中文最强
  • 兼容 OpenAI API 格式

Google AI Studio (Gemini API)

免费 tier 每天 1500 次请求

Google 官方 Gemini API 免费使用入口。提供慷慨的免费额度,支持文本、图像、音频多模态调用。

免费多模态Google官方

可用模型

Gemini 3.1 ProGemini FlashGemini 3 Ultra
  • 完全免费 tier
  • 多模态能力最强
  • 200万 token 上下文

Mistral API (La Plateforme)

免费试用 + 按量付费

欧洲最强 AI 公司 Mistral 的官方 API 平台。提供免费试用额度,模型在推理和代码生成方面表现出色。

欧洲开源免费试用

可用模型

Mistral LargeCodestralMixtral 8x22BMistral Nemo
  • 欧洲数据合规(GDPR)
  • 代码模型 Codestral 极强
  • 开源权重可自部署

SiliconFlow (硅基流动)

注册送免费额度 + 按量付费

国内一站式开源大模型 API 平台,聚合 Qwen、DeepSeek、Llama 等主流开源模型。注册送免费额度。

国产开源模型聚合高性价比

可用模型

DeepSeek V4Qwen 3Llama 4Yi LargeGLM 4
  • 国内访问低延迟
  • 开源模型覆盖全
  • 微信小程序可直接体验

Hugging Face Inference API

免费 tier(速率限制)+ Pro $9/月

全球最大的 AI 模型社区 Hugging Face 提供的免费推理 API。50 万+ 模型可直接调用,免费 tier 限速使用。

开源社区50万+模型免费tier

可用模型

50 万+ 开源模型,含 Llama、Mistral、Stable Diffusion 等
  • 模型数量全球第一
  • 社区活跃
  • 可一键部署到自己的空间

NVIDIA NIM API

注册送 1000 积分免费试用

NVIDIA 官方推理微服务 API,提供优化的开源模型部署。注册即送 1000 积分,可用于调用各种优化模型。

NVIDIA官方优化推理企业级

可用模型

Llama 4 NIMMixtral NIMSDXL NIMWhisper NIM
  • NVIDIA 优化推理性能
  • 企业级可靠性
  • 支持私有化部署

Lambda Labs API

按量付费(成本定价)

GPU 云计算服务商 Lambda 推出的 LLM API。以成本价提供开源模型推理,价格远低于主流厂商。

低成本开源模型GPU云

可用模型

Llama 4DeepSeek V4Qwen 3Mixtral
  • 价格极低(成本价)
  • 无速率限制
  • 适合大批量推理

Free LLM API (freellmapi)

完全免费(开源项目)

开源项目,一键部署免费 LLM API 聚合服务。整合多个免费大模型接口,提供统一的 OpenAI 兼容 API 端点,无需 API Key 即可调用。

开源免费API无需Key自部署

可用模型

GPT-4o MiniGemini FlashDeepSeekLlama 4Claude Haiku
  • 零成本部署
  • 无需任何 API Key
  • OpenAI SDK 兼容
  • Docker 一键启动

OpenAI-Compatible Free APIs (集合)

完全免费(社区资源)

社区维护的免费 LLM API 资源合集,包含多个兼容 OpenAI 格式的免费 API 端点和自部署方案。

社区维护资源合集自部署

可用模型

多种开源模型 API 端点
  • 持续更新的社区资源
  • 包含自部署方案
  • 兼容 OpenAI SDK

GroqCloud (国内镜像)

免费额度充足

Groq 提供全球免费 API 访问,国内可通过代理或直连使用。LPU 推理芯片让速度和成本都极具优势。

免费高速LPU

可用模型

Llama 4 系列MixtralGemma
  • 推理速度极快
  • 免费额度大
  • 开发者友好文档

ZhiPuAI API (智谱AI)

注册赠送免费 token + 按量付费

智谱 AI 官方 API 平台,GLM 系列模型。新用户注册赠送大量免费 token,支持企业级调用。

国产GLM模型免费token

可用模型

GLM 4 PlusCogView 4CogVideoXCodeGeeX
  • 国产模型中文最强之一
  • 多模态全覆盖
  • 企业级 SLA

Qwen API (通义千问开放平台)

注册送百万 token + 按量付费

阿里通义千问官方 API 平台。新用户赠送百万 token 免费额度,支持文本、图像、语音多模态调用。

国产阿里出品多模态

可用模型

Qwen 3 MaxQwen VLQwen Audio通义万相
  • 与阿里云生态集成
  • 免费额度充足
  • 中文场景优化

自部署 / 开源 API 服务器6 个项目

快速开始建议

🚀 想尝鲜体验?

用 Google AI Studio 或 DeepSeek API,免费额度最充足,注册即用,无需绑卡。

⚡ 想要最快速度?

用 Groq,LPU 推理芯片提供 1000+ tokens/s 的极致速度,免费额度够日常开发。

🔧 想自己部署?

用 Ollama 或 vLLM,一条命令即可在本地启动兼容 OpenAI 格式的 API 服务,完全免费。