返回模型列表
Google: Gemini 3.1 Flash Lite Preview
google/gemini-3.1-flash-lite-previewMar 3, 20261.0M 上下文65.5K 最大输出$0.25/M in · $1.50/M out推理
描述
Gemini 3.1 Flash Lite Preview 是 Google 面向高吞吐场景优化的高效模型。在整体质量上优于 Gemini 2.5 Flash Lite,在多项关键能力上接近 Gemini 2.5 Flash。在音频输入/ASR、RAG 片段排序、翻译、数据提取和代码补全方面均有提升。支持完整的 thinking 级别(minimal、low、medium、high),可在成本与性能之间进行细粒度权衡。定价为 Gemini 3 Flash 的一半。
技术规格
供应商
google
上下文长度
1.0M
最大输出
65.5K
模态类型
输入textimagevideofileaudio
输出text
定价
| 类型 | 价格 / 百万 Token |
|---|---|
| 输入 | $0.25 |
| 输出 | $1.50 |
| 缓存读取 | $0.03 |
| 缓存写入 | $0.08 |
| 音频输入 | $0.50 |
| 音频缓存 | $0.05 |
| 推理 | $1.50 |
| 图像输入 | $0.25 |
| 网络搜索 | $0.01 / 次 |
快速开始
curl https://api.ominigate.ai/v1/chat/completions \
-H "Authorization: Bearer sk-omg-your-api-key" \
-H "Content-Type: application/json" \
-d '{
"model": "google/gemini-3.1-flash-lite-preview",
"messages": [{"role": "user", "content": "Hello!"}]
}'