- 语言大模型
- 图片生成
- 统一接口
- GPT-Image-1
- DALL.E
- Stability.ai
- Midjourney
- Midjourney-Relax
- 302.AI
- SDXL(图片生成)
- SDXL-Lora(图片生成-Lora)
- SDXL-Lightning(快速图片生成)
- SDXL-Lightning-V2(快速图片生成V2)
- SD3(图片生成-SD3)
- Aura-Flow(图片生成)
- Kolors(图片生成-可灵)
- Kolors(参考图片生成-可灵)
- QRCode(艺术二维码生成)
- Lora(图片生成-Lora)
- Lora(获取任务结果)
- SD-3.5-Large(图片生成)
- SD-3.5-Large-Turbo(图片生成)
- SD-3.5-Medium(图片生成)
- Lumina-Image-V2(图片生成)
- Playground-v25(图片生成)
- Omnigen-V1(图片生成)
- Glif
- Flux
- Ideogram
- Recraft
- Luma
- Doubao即梦
- Minimax海螺
- 智谱
- Baidu百度
- Hidream
- Bagel
- 硅基流动
- 图片处理
- 302.AI-ComfyUI
- 302.AI
- Upscale(图片放大)
- Upscale-V2(图片放大V2)
- Upscale-V3(图片放大V3)
- Upscale-V4(图片放大V4)
- Super-Upscale(超级图片放大)
- Super-Upscale-V2(超级图片放大V2)
- Face-upscale(人像照片放大)
- Colorize(黑白照片上色)
- Colorize(黑白照片上色V2)
- Removebg(背景消除)
- Removebg-V2(背景消除V2)
- Removebg-V3(背景消除V3)
- Inpaint(图片修改)
- Erase(物体消除)
- Face-to-many(人像照片风格化)
- Llava(图像识别)
- Relight(二次打光)
- Relight-background(二次打光背景合成)
- Relight-V2(二次打光-V2)
- Face-swap-V2(AI换脸V2)
- Fetch(获取任务结果)
- HtmltoPng(HTML转PNG格式)
- SvgToPng(SVG转PNG格式)
- image-translate(图片翻译)
- image-translate-query(图片翻译结果)
- image-translate-redo(图片翻译修改)
- Flux-selfie(自拍照片风格化)
- Trellis(图片转3D模型)
- Pose-Transfer(人物姿态变换)
- Pose-Transfer(人物姿态变换结果)
- Virtual-Tryon(虚拟穿衣)
- Virtual-Tryon(虚拟穿衣结果)
- Denoise(AI降噪)
- Deblur(AI去模糊)
- SAM(AI生成MASK图)
- Vectorizer
- Stability.ai
- Fast Upscale(快速图片放大)
- Creative Upscale(创意图片放大)
- Conservative Upscale(保守图片放大)
- Fetch Creative Upscale(超级图片放大)
- Erase(物体消除)
- Inpaint(图片修改)
- Outpaint(图片扩展)
- Search-and-replace(内容替换)
- Search-and-recolor(内容重着色)
- Remove-background(背景消除)
- Sketch(草图转图片)
- Structure(以图生图)
- Style(风格一致性)
- Replace-Background(更换背景)
- Stable-Fast-3D(图片转3D模型)
- Stable-Point-3D(图片转3D模型新版)
- Glif
- Clipdrop
- Recraft
- BRIA
- Remove Background(背景消除)
- Blur Background(背景模糊)
- Generate Background(背景生成)
- Erase Foreground(擦除前景)
- Eraser(物体擦除)
- Expand Image(图片扩展)
- Increase Resolution(图片放大)
- Crop(图片裁切)
- Cutout(产品图裁剪)
- Packshot(产品图特写)
- Shadow (产品图阴影)
- Scene (产品图场景生成)
- Caption(图片描述)
- Register(图片上传)
- Mask(图片分割)
- Presenter info (人脸分析)
- Modify Presenter(人脸修改)
- Delayer Image(图片转PSD)
- Flux
- Hyper3D
- Tripo3D
- FASHN
- Ideogram
- Doubao即梦
- Kling可灵
- 阶跃星辰
- Bagel
- 视频生成
- 统一接口
- 302.AI
- Stable Diffusion
- Luma AI
- Runway
- Kling可灵
- 302格式
- Txt2Video(文生视频1.0-快速-5秒)
- Txt2Video_HQ(文生视频1.5-高清-5秒)
- Txt2Video_HQ(文生视频1.5-高清-10秒)
- Image2Video(图生视频1.0-快速-5秒)
- Image2Video(图生视频1.0-快速-10秒)
- Image2Video(图生视频1.5-快速-5秒)
- Image2Video(图生视频1.5-快速-10秒)
- Image2Video_HQ(图生视频1.5-高清-5秒)
- Image2Video_HQ(图生视频1.5-高清-10秒)
- Txt2Video(文生视频1.6-标准-5秒)
- Txt2Video(文生视频1.6-标准-10秒)
- Txt2Video(文生视频1.6-高清-5秒)
- Image2Video(图生视频1.6-标准-5秒)
- Txt2Video(文生视频1.6-高清-10秒)
- Image2Video(图生视频1.6-标准-10秒)
- Image2Video(图生视频1.6-高清-5秒)
- Image2Video(图生视频1.6-高清-10秒)
- Txt2Video(文生视频2.0-高清-5秒)
- Image2Video(图生视频2.0-高清-5秒)
- Image2Video(图生视频2.0-高清-10秒)
- Image2Video(图生视频2.1-5秒)
- Image2Video(图生视频2.1-10秒)
- Image2Video(图生视频2.1-高清-5秒)
- Image2Video(图生视频2.1-高清-10秒)
- Txt2Video(文生视频2.1-大师版-5秒)
- Txt2Video(文生视频2.1-大师版-10秒)
- Image2Video(图生视频2.1-大师版-5秒)
- Image2Video(图生视频2.1-大师版-10秒)
- Image2Video(多图参考)
- Extend_Video(视频扩展)
- Fetch(获取任务结果)
- 官方格式
- 302格式
- CogVideoX智谱
- Minimax海螺
- Pika
- PixVerse
- Genmo
- Hedra
- Haiper
- Sync.
- Lightricks
- Hunyuan混元
- Vidu
- 通义万相
- 即梦
- 硅基流动
- 昆仑万维
- Higgsfield
- 音视频处理
- 统一接口
- 302.AI
- OpenAI
- Azure
- Suno
- 豆包
- Fish Audio
- Minimax
- Dubbingx
- Udio
- Elevenlabs
- Mureka
- 硅基流动
- Google
- 信息处理
- 统一搜索接口
- 302.AI
- 管理后台
- 信息搜索
- Xiaohongshu_Search(小红书搜索笔记)
- Xiaohongshu_Note(小红书获取笔记)
- Tiktok_Search(Tiktok搜索视频)
- Douyin_Search(抖音搜索视频)
- Twitter_Search(X搜索内容)
- Twitter_Post(X获取用户帖子)
- Twitter_User(X获取用户信息)
- Weibo_Post(微博获取用户帖子)
- Search_Video(Youtube搜索视频)
- Youtube_Info(Youtube获取视频信息)
- Youtube_Subtitles(Youtube获取字幕)
- Bilibili_Info(B站获取视频信息)
- MP_Article_List(获取微信公众号文章列表)
- MP_Article(获取微信公众号文章)
- Zhihu_AI_Search(知乎AI搜索)
- Zhihu_AI_Search(获取知乎AI搜索结果)
- Zhihu_Hot_List(知乎热榜)
- Video_Data(获取视频数据)
- 文件处理
- 代码运行
- 远程浏览器
- Tavily
- SearchAPI
- Search1API
- Exa
- 博查AI
- Doc2x
- Glif
- Jina
- DeepL
- RSSHub
- 流光卡片
- 有道
- Mistral
- Firecrawl
- RAG相关
- 工具API
- 帮助中心
gemini-2.5-pro-preview-tts
正式环境
https://api.302.ai
正式环境
https://api.302.ai
POST
https://api.302.ai
voiceName支持列表参照:https://ai.google.dev/gemini-api/docs/speech-generation#voices
请求参数
Query 参数
response_format
string
可选
示例值:
url
Header 参数
Authorization
string
可选
示例值:
Bearer {{YOUR_API_KEY}}
Body 参数application/json
contents
array [object {1}]
必需
parts
array [object {1}]
可选
generationConfig
object
必需
responseModalities
array[string]
必需
speechConfig
object
必需
model
string
必需
示例
{
"contents": [
{
"parts": [
{
"text": "Say cheerfully: Have a wonderful day!"
}
]
}
],
"generationConfig": {
"responseModalities": [
"AUDIO"
],
"speechConfig": {
"voiceConfig": {
"prebuiltVoiceConfig": {
"voiceName": "Kore"
}
}
}
},
"model": "gemini-2.5-pro-preview-tts"
}
示例代码
Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.302.ai/google/v1/models/gemini-2.5-pro-preview-tts?response_format=url' \
--header 'Authorization: Bearer ' \
--header 'Content-Type: application/json' \
--data-raw '{
"contents": [
{
"parts": [
{
"text": "Say cheerfully: Have a wonderful day!"
}
]
}
],
"generationConfig": {
"responseModalities": [
"AUDIO"
],
"speechConfig": {
"voiceConfig": {
"prebuiltVoiceConfig": {
"voiceName": "Kore"
}
}
}
},
"model": "gemini-2.5-pro-preview-tts"
}'
返回响应
🟢200成功
application/json
Body
candidates
array [object {3}]
必需
content
object
可选
finishReason
string
可选
index
integer
可选
modelVersion
string
必需
responseId
string
必需
usageMetadata
object
必需
candidatesTokenCount
integer
必需
candidatesTokensDetails
array [object {2}]
必需
promptTokenCount
integer
必需
promptTokensDetails
array [object {2}]
必需
totalTokenCount
integer
必需
示例
{
"candidates": [
{
"content": {
"parts": [
{
"inlineData": {
"data": "https://file.302.ai/gpt/imgs/20250616/75412091b9ef451a99eb70c08f387381.wav",
"mimeType": "audio/L16;codec=pcm;rate=24000"
}
}
],
"role": "model"
},
"finishReason": "STOP",
"index": 0
}
],
"modelVersion": "gemini-2.5-pro-preview-tts",
"responseId": "TPBPaOzJEdaY1MkPy5fzkQ0",
"usageMetadata": {
"candidatesTokenCount": 48,
"candidatesTokensDetails": [
{
"modality": "AUDIO",
"tokenCount": 48
}
],
"promptTokenCount": 8,
"promptTokensDetails": [
{
"modality": "TEXT",
"tokenCount": 8
}
],
"totalTokenCount": 56
}
}
修改于 2025-06-17 09:36:53