vc(音视频字幕生成)
POST
/doubao/vc/submit来自豆包的音视频字幕生成
官方文档:https://www.volcengine.com/docs/6561/80909
价格:0.01 PTC/ 分钟
请求参数
Query 参数
words_per_line
string
可选
每行最多展示字数 默认值 46 。
max_lines
string
可选
每屏最多展示行数 默认 1 行。
use_itn
string
可选
是否使用数字转换功能 默认关闭(False)。
如果设置为开启(True),会将识别结果中的中文数字自动转成阿拉伯数字。
language
string
字幕语言类型
caption_type
string
可选
字幕识别类型 默认值为auto(同时识别说话和唱歌部分) 。
可以选择speech(只识别说话部分),
可以选择singing(只识别唱歌部分)。
use_punc
string
可选
增加标点 默认False, 如果设置为True,则会将识别结果中增加标点符号。
当且仅当(caption_type=speech的时候生效)
use_ddc
string
可选
使用顺滑标注水词 默认 False,如果设置为 True,则会在返回的 utterances 里增加 text 为空的静音句子,其 attribute 的 event 是 silent。且 words 中可能需要被顺滑的词会被标注出来,如"extra": { "smoothed": "repeat" },smoothed 的值可能为 repeat(重复词)或 filler(口水词)。
boosting_table_id
string
可选
自学习平台热词 ID id 与 name 二选一,只需要提供其中一个即可。同时需要传 asr_appid(与 appid 值一样)。
boosting_table_name
string
可选
自学习平台热词的文件名称
asr_appid
string
可选
传给 ASR 的 APPID 使用自学习平台热词时必填,与 appid 值一致即可。
with_speaker_info
string
可选
返回说话人信息 默认 False,如果设置为 True,则会在 utterance 和 workd 的 attribute 中增加 speaker 信息如"attribute": {"speaker": "1"}
Header 参数
Authorization
string
API Key
示例值:
Bearer {{YOUR_API_KEY}}
Body 参数application/json
url
string
文件url
示例1
{
"url": "https://file.302.ai/gpt/imgs/20241204/361bca5886e844dfac39fb861ea3f3ac.mp3"
}
示例代码
返回响应
成功(200)
HTTP 状态码: 200
内容格式: JSONapplication/json
数据结构
object {0}
示例
{}
最后修改时间: 3 个月前