public class CreateRecTaskRequest extends AbstractModel
Constructor and Description |
---|
CreateRecTaskRequest() |
CreateRecTaskRequest(CreateRecTaskRequest source)
NOTE: Any ambiguous key set via .set("AnyKey", "value") will be a shallow copy,
and any explicit key, i.e Foo, set via .setFoo("value") will be a deep copy.
|
Modifier and Type | Method and Description |
---|---|
String |
getCallbackUrl()
Get 回调 URL,用户自行搭建的用于接收识别结果的服务URL。如果用户使用轮询方式获取识别结果,则无需提交该参数。回调格式&内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
|
Long |
getChannelNum()
Get 识别声道数。1:单声道(非电话场景,直接选择单声道即可,忽略音频声道数);2:双声道(仅支持8k_zh电话场景,双声道应分别对应通话双方)。注意:双声道的电话音频已物理分离说话人,无需再开启说话人分离功能。
|
Long |
getConvertNumMode()
Get 是否进行阿拉伯数字智能转换(目前支持中文普通话引擎)。0:不转换,直接输出中文数字,1:根据场景智能转换为阿拉伯数字,3: 打开数学相关数字转换。默认值为 1。
|
String |
getCustomizationId()
Get 自学习模型 id。如设置了该参数,将生效对应的自学习模型。
|
String |
getData()
Get 语音数据base64编码,当SourceType 值为1时必须填写,为0可不写。音频数据要小于5MB。
|
Long |
getDataLen()
Get 数据长度,非必填(此数据长度为数据未进行base64编码时的数据长度)。
|
String |
getEngineModelType()
Get 引擎模型类型。注意:非电话场景请务必使用16k的引擎。
电话场景:
• 8k_en:电话 8k 英语;
• 8k_zh:电话 8k 中文普通话通用;
非电话场景:
• 16k_zh:16k 中文普通话通用;
• 16k_zh_video:16k 音视频领域;
• 16k_en:16k 英语;
• 16k_ca:16k 粤语;
• 16k_ja:16k 日语;
• 16k_zh_edu 中文教育;
• 16k_en_edu 英文教育;
• 16k_zh_medical 医疗;
• 16k_th 泰语;
|
String |
getExtra()
Get 附加参数(该参数无意义,忽略即可)
|
Long |
getFilterDirty()
Get 是否过滤脏词(目前支持中文普通话引擎)。0:不过滤脏词;1:过滤脏词;2:将脏词替换为 * 。默认值为 0。
|
Long |
getFilterModal()
Get 是否过滤语气词(目前支持中文普通话引擎)。0:不过滤语气词;1:部分过滤;2:严格过滤 。默认值为 0。
|
Long |
getFilterPunc()
Get 是否过滤标点符号(目前支持中文普通话引擎)。 0:不过滤,1:过滤句末标点,2:过滤所有标点。默认值为 0。
|
String |
getHotwordId()
Get 热词表id。如不设置该参数,自动生效默认热词表;如设置了该参数,那么将生效对应的热词表。
|
Long |
getResTextFormat()
Get 识别结果返回形式。0: 识别结果文本(含分段时间戳); 1:词级别粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(不含标点,含语速值);2:词级别粒度的详细识别结果(包含标点、语速值);3: 标点符号分段,包含每段时间戳,特别适用于字幕场景(包含词级时间、标点、语速值)。
|
Long |
getSourceType()
Get 语音数据来源。0:语音 URL;1:语音数据(post body)。
|
Long |
getSpeakerDiarization()
Get 是否开启说话人分离,0:不开启,1:开启(仅支持8k_zh,16k_zh,16k_zh_video,单声道音频),默认值为 0。
注意:8k电话场景建议使用双声道来区分通话双方,设置ChannelNum=2即可,不用开启说话人分离。
|
Long |
getSpeakerNumber()
Get 说话人分离人数(需配合开启说话人分离使用),取值范围:0-10,0代表自动分离(目前仅支持≤6个人),1-10代表指定说话人数分离。默认值为 0。
注:话者分离目前是beta版本,请根据您的需要谨慎使用
|
String |
getUrl()
Get 语音的URL地址,需要公网可下载。长度小于2048字节,当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写。注意:请确保录音文件时长在5个小时之内,否则可能识别失败。请保证文件的下载速度,否则可能下载失败。
|
void |
setCallbackUrl(String CallbackUrl)
Set 回调 URL,用户自行搭建的用于接收识别结果的服务URL。如果用户使用轮询方式获取识别结果,则无需提交该参数。回调格式&内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)
|
void |
setChannelNum(Long ChannelNum)
Set 识别声道数。1:单声道(非电话场景,直接选择单声道即可,忽略音频声道数);2:双声道(仅支持8k_zh电话场景,双声道应分别对应通话双方)。注意:双声道的电话音频已物理分离说话人,无需再开启说话人分离功能。
|
void |
setConvertNumMode(Long ConvertNumMode)
Set 是否进行阿拉伯数字智能转换(目前支持中文普通话引擎)。0:不转换,直接输出中文数字,1:根据场景智能转换为阿拉伯数字,3: 打开数学相关数字转换。默认值为 1。
|
void |
setCustomizationId(String CustomizationId)
Set 自学习模型 id。如设置了该参数,将生效对应的自学习模型。
|
void |
setData(String Data)
Set 语音数据base64编码,当SourceType 值为1时必须填写,为0可不写。音频数据要小于5MB。
|
void |
setDataLen(Long DataLen)
Set 数据长度,非必填(此数据长度为数据未进行base64编码时的数据长度)。
|
void |
setEngineModelType(String EngineModelType)
Set 引擎模型类型。注意:非电话场景请务必使用16k的引擎。
电话场景:
• 8k_en:电话 8k 英语;
• 8k_zh:电话 8k 中文普通话通用;
非电话场景:
• 16k_zh:16k 中文普通话通用;
• 16k_zh_video:16k 音视频领域;
• 16k_en:16k 英语;
• 16k_ca:16k 粤语;
• 16k_ja:16k 日语;
• 16k_zh_edu 中文教育;
• 16k_en_edu 英文教育;
• 16k_zh_medical 医疗;
• 16k_th 泰语;
|
void |
setExtra(String Extra)
Set 附加参数(该参数无意义,忽略即可)
|
void |
setFilterDirty(Long FilterDirty)
Set 是否过滤脏词(目前支持中文普通话引擎)。0:不过滤脏词;1:过滤脏词;2:将脏词替换为 * 。默认值为 0。
|
void |
setFilterModal(Long FilterModal)
Set 是否过滤语气词(目前支持中文普通话引擎)。0:不过滤语气词;1:部分过滤;2:严格过滤 。默认值为 0。
|
void |
setFilterPunc(Long FilterPunc)
Set 是否过滤标点符号(目前支持中文普通话引擎)。 0:不过滤,1:过滤句末标点,2:过滤所有标点。默认值为 0。
|
void |
setHotwordId(String HotwordId)
Set 热词表id。如不设置该参数,自动生效默认热词表;如设置了该参数,那么将生效对应的热词表。
|
void |
setResTextFormat(Long ResTextFormat)
Set 识别结果返回形式。0: 识别结果文本(含分段时间戳); 1:词级别粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(不含标点,含语速值);2:词级别粒度的详细识别结果(包含标点、语速值);3: 标点符号分段,包含每段时间戳,特别适用于字幕场景(包含词级时间、标点、语速值)。
|
void |
setSourceType(Long SourceType)
Set 语音数据来源。0:语音 URL;1:语音数据(post body)。
|
void |
setSpeakerDiarization(Long SpeakerDiarization)
Set 是否开启说话人分离,0:不开启,1:开启(仅支持8k_zh,16k_zh,16k_zh_video,单声道音频),默认值为 0。
注意:8k电话场景建议使用双声道来区分通话双方,设置ChannelNum=2即可,不用开启说话人分离。
|
void |
setSpeakerNumber(Long SpeakerNumber)
Set 说话人分离人数(需配合开启说话人分离使用),取值范围:0-10,0代表自动分离(目前仅支持≤6个人),1-10代表指定说话人数分离。默认值为 0。
注:话者分离目前是beta版本,请根据您的需要谨慎使用
|
void |
setUrl(String Url)
Set 语音的URL地址,需要公网可下载。长度小于2048字节,当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写。注意:请确保录音文件时长在5个小时之内,否则可能识别失败。请保证文件的下载速度,否则可能下载失败。
|
void |
toMap(HashMap<String,String> map,
String prefix)
Internal implementation, normal users should not use it.
|
any, fromJsonString, getBinaryParams, getMultipartRequestParams, set, setParamArrayObj, setParamArraySimple, setParamObj, setParamSimple, toJsonString
public CreateRecTaskRequest()
public CreateRecTaskRequest(CreateRecTaskRequest source)
public String getEngineModelType()
public void setEngineModelType(String EngineModelType)
EngineModelType
- 引擎模型类型。注意:非电话场景请务必使用16k的引擎。
电话场景:
• 8k_en:电话 8k 英语;
• 8k_zh:电话 8k 中文普通话通用;
非电话场景:
• 16k_zh:16k 中文普通话通用;
• 16k_zh_video:16k 音视频领域;
• 16k_en:16k 英语;
• 16k_ca:16k 粤语;
• 16k_ja:16k 日语;
• 16k_zh_edu 中文教育;
• 16k_en_edu 英文教育;
• 16k_zh_medical 医疗;
• 16k_th 泰语;public Long getChannelNum()
public void setChannelNum(Long ChannelNum)
ChannelNum
- 识别声道数。1:单声道(非电话场景,直接选择单声道即可,忽略音频声道数);2:双声道(仅支持8k_zh电话场景,双声道应分别对应通话双方)。注意:双声道的电话音频已物理分离说话人,无需再开启说话人分离功能。public Long getResTextFormat()
public void setResTextFormat(Long ResTextFormat)
ResTextFormat
- 识别结果返回形式。0: 识别结果文本(含分段时间戳); 1:词级别粒度的[详细识别结果](https://cloud.tencent.com/document/api/1093/37824#SentenceDetail)(不含标点,含语速值);2:词级别粒度的详细识别结果(包含标点、语速值);3: 标点符号分段,包含每段时间戳,特别适用于字幕场景(包含词级时间、标点、语速值)。public Long getSourceType()
public void setSourceType(Long SourceType)
SourceType
- 语音数据来源。0:语音 URL;1:语音数据(post body)。public Long getSpeakerDiarization()
public void setSpeakerDiarization(Long SpeakerDiarization)
SpeakerDiarization
- 是否开启说话人分离,0:不开启,1:开启(仅支持8k_zh,16k_zh,16k_zh_video,单声道音频),默认值为 0。
注意:8k电话场景建议使用双声道来区分通话双方,设置ChannelNum=2即可,不用开启说话人分离。public Long getSpeakerNumber()
public void setSpeakerNumber(Long SpeakerNumber)
SpeakerNumber
- 说话人分离人数(需配合开启说话人分离使用),取值范围:0-10,0代表自动分离(目前仅支持≤6个人),1-10代表指定说话人数分离。默认值为 0。
注:话者分离目前是beta版本,请根据您的需要谨慎使用public String getCallbackUrl()
public void setCallbackUrl(String CallbackUrl)
CallbackUrl
- 回调 URL,用户自行搭建的用于接收识别结果的服务URL。如果用户使用轮询方式获取识别结果,则无需提交该参数。回调格式&内容详见:[录音识别回调说明](https://cloud.tencent.com/document/product/1093/52632)public String getUrl()
public void setUrl(String Url)
Url
- 语音的URL地址,需要公网可下载。长度小于2048字节,当 SourceType 值为 0 时须填写该字段,为 1 时不需要填写。注意:请确保录音文件时长在5个小时之内,否则可能识别失败。请保证文件的下载速度,否则可能下载失败。public String getData()
public void setData(String Data)
Data
- 语音数据base64编码,当SourceType 值为1时必须填写,为0可不写。音频数据要小于5MB。public Long getDataLen()
public void setDataLen(Long DataLen)
DataLen
- 数据长度,非必填(此数据长度为数据未进行base64编码时的数据长度)。public Long getConvertNumMode()
public void setConvertNumMode(Long ConvertNumMode)
ConvertNumMode
- 是否进行阿拉伯数字智能转换(目前支持中文普通话引擎)。0:不转换,直接输出中文数字,1:根据场景智能转换为阿拉伯数字,3: 打开数学相关数字转换。默认值为 1。public Long getFilterDirty()
public void setFilterDirty(Long FilterDirty)
FilterDirty
- 是否过滤脏词(目前支持中文普通话引擎)。0:不过滤脏词;1:过滤脏词;2:将脏词替换为 * 。默认值为 0。public String getHotwordId()
public void setHotwordId(String HotwordId)
HotwordId
- 热词表id。如不设置该参数,自动生效默认热词表;如设置了该参数,那么将生效对应的热词表。public String getCustomizationId()
public void setCustomizationId(String CustomizationId)
CustomizationId
- 自学习模型 id。如设置了该参数,将生效对应的自学习模型。public String getExtra()
public void setExtra(String Extra)
Extra
- 附加参数(该参数无意义,忽略即可)public Long getFilterPunc()
public void setFilterPunc(Long FilterPunc)
FilterPunc
- 是否过滤标点符号(目前支持中文普通话引擎)。 0:不过滤,1:过滤句末标点,2:过滤所有标点。默认值为 0。public Long getFilterModal()
public void setFilterModal(Long FilterModal)
FilterModal
- 是否过滤语气词(目前支持中文普通话引擎)。0:不过滤语气词;1:部分过滤;2:严格过滤 。默认值为 0。Copyright © 2022. All rights reserved.