音频人声分离与转录
POST
/302/vt/subtitle/extract使用我们自己优化过的whisper模型,将音频转录成word级别的文本数据
只分离人声价格:0.001PTC/min
分离+转录+对齐价格:0.003PTC/min
请求参数
Header 参数
Authorization
string
可选
示例值:
Bearer {{YOUR_API_KEY}}
Body 参数application/json
audio_url
string
音频链接
language
string
音频的语言
eg: zh, en
demucs
boolean
是否开启人声分离
默认值:
true
is_only_demucs
boolean
是否只分离人声不执行转录
默认值:
false
示例1
{
"audio_url": "https://file.302ai.cn/gpt/imgs/tts_demo_minimax_male-qn-qingse_en.mp3",
"language": "en",
"demucs": true
}
示例代码
返回响应
成功(200)
HTTP 状态码: 200
内容格式: JSONapplication/json
数据结构
task_id
string
必需
示例
{
"task_id": "string"
}
最后修改时间: 2 个月前