字符串qq多人语音

qq多人语音  时间:2021-05-24  阅读:()
ICS35.
240.
99A90GA中华人民共和国公共安全行业标准GA/TXXXXX—XXXX警务智能语音服务平台接口规范Specificationsforinterfaceofintelligentvoiceserviceplatformforthepolice点击此处添加与国际标准一致性程度的标识(报批稿)XXXX-XX-XX发布XXXX-XX-XX实施中华人民共和国公安部发布I目次目次I前言II警务智能语音服务平台接口规范11范围12规范性引用文件13术语和定义14数据对象15语音识别服务接口26语音合成服务接口117文本处理服务接口15附录A(资料性附录)语音消息结果示例.
20参考文献27GA/TXXXXX—XXXXII前言本标准按照GB/T1.
1-2009给出的规则起草.
本标准由安徽省公安厅提出.
本标准由公安部计算机与信息处理标准化技术委员会归口.
本标准起草单位:智能语音技术公安部重点实验室、安徽省公安厅、讯飞智元信息科技有限公司、合肥市公安局、公安部第三研究所、公安部第一研究所、苏州思必驰信息科技有限公司.
本标准主要起草人:祝占魁、冯祥、刘琼、胡先锋、刘磊、查飞、戎玲、孔耀晖、周伟达、李伟、李磊、吴波、王伟、储明丽、吴鹏、程彪、刘韫韬、余洪祥、游寒旭.
GA/TXXXXX—XXXX1警务智能语音服务平台接口规范1范围本标准规定了警务智能语音服务平台提供服务的数据对象、语音识别服务接口、语音合成服务接口、文本处理服务接口等.
本标准适用于警务智能语音服务平台接口设计、开发和应用.
2规范性引用文件下列文件对于本要求的应用是必不可少的.
凡是注日期的引用文件,仅注日期的版本适用于本文件.
凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件.
GB/T21023-2007中文语音识别系统通用技术规范GB/T34083-2017中文语音识别互联网服务接口规范GB/T34145-2017中文语音合成互联网服务接口规范GA/TXXXXX-XXXX警务智能语音服务平台技术要求3术语和定义GB/T34083-2017、GB/T34145-2017和GA/TXXXXX-XXXX界定的术语和定义适用于本文件.
4数据对象4.
1基本数据类型平台数据对象采用的基本数据类型见表1.
表1基本数据类型类型名称说明范围Byte字节-128~127Int整型-2147483648~2147483647Long长整型-9223372036854774808~9223372036854774807String字符串任意可变长度Float浮点数3.
402823e+38~1.
401298e-45(e+38表示是乘以10的38次方,同样,e-45表示乘以10的负45次方)Bool布尔型true或false4.
2JSON数据交换格式平台采用JSON数据交换格式来存储和表示数据对象.
GA/TXXXXX—XXXX25语音识别服务接口5.
1接口请求调用关系接口请求调用关系见图1.
注1:虚线框内定义的热词流程,为非必要流程.
注2:"For0,N,1"表示起始值为0、上限值为N、步长为1的循环.
图1语音识别服务接口请求调用关系5.
2连续语音识别接口5.
2.
1初始化连续语音识别服务行为描述:初始化连续语音识别服务客户端组件.
本接口应和逆初始化连续语音识别服务(见5.
2.
6)配对使用.
如果连续语音识别服务系统不是通过客户端组件提供服务,则本接口可省略.
输入参数:不做定义.
输出参数:返回值等.
5.
2.
2创建连续语音识别会话行为描述:创建一路连续语音识别会话,可设置会话参数,参数有效范围应为设置成功时起至本路会话结束.
输入参数:参数见表2.
GA/TXXXXX—XXXX3输出参数:返回值等.
5.
2.
3设置连续语音识别会话参数行为描述:设置一路连续语音识别会话参数,参数有效范围应为设置成功时起至本路会话结束.
输入参数:参数见表2.
输出参数:返回值等.
表2设置连续语音识别会话输入参数序号参数取值默认值功能1session-type/sst字符串,取值包括continuous和command,continuous表示连续语音识别,command表示命令字识别continuous指明会话类型2net-timeout/ntt整数,单位毫秒(ms)取值范围为-1和1~30000的整数,-1表示无超时限制10000指明网络交互超时间隔3speek-timeout/stt整数,单位毫秒(ms)取值范围为-1和1~30000的整数,-1表示无超时限制10000指明语音写入超时间隔4confidence-threshold/cfd浮点数,取值范围为0.
0~100.
090.
0指明置信度阈值5result-format字符串,取值包括plain和json,应支持plain和jsonjson指明识别结果格式6result-encode/rse字符串,取值包括GB18030、GB13000等.
应支持GB18030,宜支持GB13000GB18030指明识别结果字符编码格式7vad-enable布尔值,取值包括true和falsetrue表示开启,false表示关闭true开启音频端点检测8audio-format/auf字符串,取值包括audio/L16;rate=8000、audio/L16;rate=16000等.
应支持audio/L16;rate=8000和audio/L16;rate=16000audio/L16;rate=16000指明识别音频数据格式9audio-encode/aue字符串,取值格式规范同RFC2045的Content-Type参数,其中的type取值为audio,subtype取值包括raw、pcma、pcmu、amr、amr-wb、speex、speex-wb、mp3等,其中raw表示不压缩.
对于支持可变码率编码的压缩算法,使用子参数level(或简写为lvl)指定压缩等级.
如取值为"audio/amr-wb;lvl=7"时,语音识别服务系统在网络传输中使用amr-wb算法的等级7压缩识别音频.
subtype的取值除raw外,宜支持以上音频压缩算法中的一种或多种audio/raw指明识别音频压缩算法10language/lang字符串,取值规范符合RFC5646,应支持中文zh-CN、宜支持en-US,缺省值为zh-CNzh-CN指明识别音频所属语种GA/TXXXXX—XXXX4表2(续)序号参数取值默认值功能11dialect字符串,取值规则满足RFC5646规范,应支持zh_cmn,宜支持zh_yue等方言zh_cmn指明识别音频所属方言12vad-timeout整数,单位毫秒(ms).
取值范围为-1和1~60000的整数,-1表示无超时限制10000指明语音等待超时时长13vad-incomplete-timeout整数,单位毫秒(ms).
取值范围为-1和1~60000的整数,-1表示无超时限制10000指明语音尾部静音长度14denoise-enable布尔值,取值包括true和false,true表示开启,false表示关闭true启用噪声抑制15result-type/rst字符串,取值包括word(字或词)、sentence(整句)和paragraph(段落)应支持word和sentenceword指明识别结果类型16progressive-mode布尔值,取值包括true和false,true表示进阶模式,false表示非进阶模式false指明会话是否为进阶模式17punctuation布尔值,取值包括true和false,true表示自动添加标点符号,false表示不添加true指明是否自动添加标点符号18result-info字符串,取值为表3中所列参数或其组合,参数之间用"|"表示分割,参数取值见表3获取完整的识别结果指明识别结果中的信息种类19vendor-x字符串,json格式无自定义参数表3result-info参数集合序号参数参数描述1confidence-threshold/cfd置信度阈值2language/lang语种3dialect方言4gender性别5age年龄6role角色7SNR信噪比8error-reason错误原因9pinyin拼音10score得分11user-word热词5.
2.
4写入连续语音识别音频数据行为描述:写入一路连续语音识别会话所用识别音频.
本接口可以被反复调用,待识别音频流为空时表示音频写入结束.
输入参数:语音数据.
输出参数:见表4.
GA/TXXXXX—XXXX5表4连续语音识别输出参数序号参数取值默认值功能1version/ver字符串,当前值为0.
10.
1协议版本号2sentence-number/sn整数,从1开始,递增加11句子序号3last-sentence/ls布尔值,取值为true或falsefale是否为最后一句4begin正整数,单位毫秒(ms)0开始识别时间5end正整数,单位毫秒(ms)0结束识别时间6result-type/rst字符串,取值包括word(字或词)、sentence(整句)和paragraph(段落)word结果类型7error-code整数,0表示成功,非0表示失败,不同非0值对应不同的错误原因0错误码8word字符串无一段音频识别结果的文字内容9score浮点数,取值范围为0.
0~100.
00.
0识别结果内容对应的匹配得分,得分越高越可信10instance字符串无匹配到的语法中的词条,用于命令字识别中11user-input字符串无用户说话内容,用于命令字识别中12error-reason字符串无在error-code为非0值时,error-reason描述发生错误的原因13confidence-threshold/cfd浮点数,取值范围为0.
0~100.
0无识别的置信度阈值,用于命令字识别中14language/lang字符串,取值规则满足RFC5646规范,应支持zh_CN,宜支持en_US等zh_CN识别音频所属语种15dialect字符串,取值规则满足RFC5646规范,应支持zh_cmn,宜支持zh_yue等方言zh_cmn识别音频所属方言16gender字符串,取值包括male(男)或female(女)无说话者性别17age字符串,取值包括child(少年)、youth(青年)、adult(成年)、elder(老人)youth说话者年龄18role整数,取值范围大于等于1,序数含义1指明在多人说话的场景中,当前识别结果是哪个人说的内容19progressive-type字符串,取值包括append(附加)、overwrite(盖写)、insert(插入)和delete(删除)append进阶类型GA/TXXXXX—XXXX6表4(续)序号参数取值默认值功能20progressive-range对象,两个整数组成的范围,单位均为字节(B).
第一个整数表示起点,第二个整数表示从起点算起的长度,例如:[0,6]无进阶范围21SNR浮点数,单位分贝(dB)取值规则符合GB/T21023—2007中4.
6的规范无信噪比22pinyin字符串,描述的文本为中文字符时,取值为每一个字符对应的汉语拼音按字符先后顺序拼接起来的字符串,中间不加分隔符.
每一个字符对应的汉语拼音声韵组合规律符合《汉语拼音方案》,声调中的阴平、阳平、上声、去声和轻声分别用1、2、3、4和0表示,如"北京"的普通话汉语拼音表示为"bei3jing1"无识别结果拼音23user-word布尔值,取值包括true或falsefale是否为用户自定义热词24vendor-x字符串,json格式无厂商自定义参数5.
2.
4结束连续语音识别会话行为描述:结束一路连续语音识别会话.
输入参数:会话句柄.
输出参数:返回值等.
5.
2.
5逆初始化连续语音识别服务行为描述:释放资源.
如果连续语音识别服务系统不是通过客户端组件提供服务,则本接口可省略.
输入参数:不做定义.
输出参数:返回值等.
5.
3语音识别服务接口5.
3.
1初始化语音识别服务行为描述:初始化语音识别服务客户端组件,本接口应和逆初始化语音识别服务(见5.
3.
6)配对使用.
如果语音识别服务系统不是通过客户端组件提供服务,则本接口可省略.
输入参数:不做定义.
输出参数:返回值等.
5.
3.
2创建语音识别会话行为描述:创建一路语音识别会话,可以同时设置会话参数,参数有效范围应为设置成功时起至本路会话结束.
输入参数:可一次设置多个会话参数.
输出参数:返回值等.
GA/TXXXXX—XXXX75.
3.
3设置语音识别会话参数行为描述:设置一路语音识别会话参数,参数有效范围应为设置成功时起至本路会话结束.
输入参数:参数见表5,示例参见附录A.
1.
输出参数:返回值等.
表5设置语音识别会话输入参数序号参数取值默认值功能1session-id/ssid字符串,必填,建议取值uuid无会话id应唯一2business-id/bizid字符串,必填,如未设置,将默认与session_id相同无业务id3business-name/biznm字符串无业务名称4audio-format/auf字符串,取值包括audio/L16;rate=8000、audio/L16;rate=16000等.
应支持audio/L16;rate=8000和audio/L16;rate=16000audio/L16;rate=16000指明识别音频数据格式5result-format字符串,取值包括plain、json,应支持plain和jsonjson指明识别结果格式6result-encode/rse字符串,取值包括GB18030、GB13000等,应支持GB18030,宜支持GB13000GB18030指明识别结果字符编码格式7audio-encode/aue字符串,取值格式规范同RFC2045的Content-Type参数,其中的type取值为audio,subtype取值包括raw、pcma、pcmu、amr、amr-wb、speex、speex-wb、mp3等,其中raw表示不压缩.
对于支持可变码率编码的压缩算法,使用子参数level(或简写为lvl)指定压缩等级.
如取值为"audio/amr-wb;lvl=7"时,语音识别服务系统在网络传输中使用amr-wb算法的等级7压缩识别音频.
subtype的取值除raw外,宜支持以上音频压缩算法中的一种或多种audio/raw指明识别音频压缩算法8dialect字符串,取值规则满足RFC5646规范,应支持zh_cmn,宜支持zh_yue等方言zh_cmn指明识别音频所属方言9language/lang字符串,取值规范符合RFC5646,应支持中文zh-CN、宜支持en-US,缺省值为zh-CNzh-CN指明识别音频所属语种10vendor-x字符串,json格式无自定义参数GA/TXXXXX—XXXX85.
3.
4写入识别音频数据行为描述:写入一路语音识别会话所用识别音频.
本接口可被反复调用.
输入参数:参数见表6.
输出参数:通过回调接口返回语音识别结果或实时返回语音识别结果,见表7,示例参见附录A.
1.
表6写入识别音频数据输入参数序号参数取值默认值功能1session-id/ssid字符串,必填,建议取值uuid无会话id2business-id/bizid字符串,必填,如未设置,将默认与session-id相同无业务id3audio-file-uri/afu字符串,必填无待识别的音频文件链接地址4spkn布尔类型,true是,false否true是否景分离5audio-encoding/aed字符串,取值PCM、ALAW、G729、AMR_NB、GSM_HR、GSMEFR、SILK等PCM语音的编码格式6call-back可选,有值通过回调方式返回结果,空实时返回结果无回调地址表7语音识别输出参数序号参数取值默认值功能1session-id/ssid字符串,必填,与输入的会话id一致输入的会话id会话id2business-id/bizid字符串,必填,与输入的业务id一致输入的业务id业务id3begin正整数,单位毫秒(ms)0开始识别时间4end正整数,单位毫秒(ms)0结束识别时间5result-type/rst字符串,取值包括word(字或词)、sentence(整句)和paragraph(段落)word结果类型6error-code整数,0表示成功,非0表示失败,不同非0值对应不同的错误原因0错误码7word字符串无一段音频识别结果的文字内容8score浮点数,取值范围为0.
0~100.
00.
0识别结果内容对应的匹配得分,得分越高越可信9error-reason字符串无在error-code为非0值时,error-reason描述发生错误的原因GA/TXXXXX—XXXX9表7(续)序号参数取值默认值功能10language/lang字符串,取值规则满足RFC5646规范,应支持zh_CN,宜支持en_US等zh_CN识别音频所属语种11dialect字符串,取值规则满足RFC5646规范,应支持zh_cmn,宜支持zh_yue等方言zh_cmn识别音频所属方言12gender字符串,取值包括male(男)或female(女)无说话者性别13age字符串,取值包括child(少年)、youth(青年)、adult(成年)、elder(老人)youth说话者年龄14role整数,取值范围大于等于1,序数含义1指明在多人说话的场景中,当前识别结果是哪个人说的内容15SNR浮点数,单位分贝(dB),取值规则符合GB/T21023—2007中4.
6的规范无信噪比16pinyin字符串,描述的文本为中文字符时,取值为每一个字符对应的汉语拼音按字符先后顺序拼接起来的字符串,中间不加分隔符.
每一个字符对应的汉语拼音声韵组合规律符合《汉语拼音方案》,声调中的阴平、阳平、上声、去声和轻声分别用1、2、3、4和0表示,如"北京"的普通话汉语拼音表示为"bei3jing1"无识别结果拼音17user-word布尔值,取值包括true或falsefale是否为用户自定义热词18vendor-x字符串,json格式json厂商自定义参数GA/TXXXXX—XXXX105.
3.
5结束语音识别会话行为描述:结束一路语音识别会话.
输入参数:会话句柄.
输出参数:返回值等.
5.
3.
6逆初始化语音识别服务行为描述:释放资源.
如果语音识别服务系统不是通过客户端组件提供服务,则本接口可省略.
输入参数:不做定义.
输出参数:返回值等.
5.
4语音文件质量检测服务接口5.
4.
1初始化语音文件质量检测服务行为描述:初始化语音文件质量检测服务客户端组件.
本接口应和逆初始化组件(见5.
4.
3)配对使用.
如果语音文件质量检测服务系统不是通过客户端组件提供务,则本接口可省略.
输入参数:不做定义.
输出参数:返回值等.
5.
4.
2创建语音文件质量检测会话行为描述:创建一路语音文件质量检测会话.
输入参数:可一次设置多个会话参数,见表8,示例参见附录A.
4.
输出参数:返回处理结果,见表10,示例参见附录A.
4.
表8语音文件质量检测会话输入参数序号参数取值默认值功能1session-id/ssid字符串,必填,建议取值uuid无会话id2business-id/bizid字符串,必填,如未设置,将默认与session-id相同无业务id3audiosAudio类型,必填,参数取值见表9无语音基本信息4vendor-x字符串,json格式无厂家自定义参数表9Audio类型定义序号参数取值默认值功能1audio-id/aid字符串,必填语音资源的id2uri字符串,必填语音链接地址3chnl整数,单声道取1、双声道取21语音信道4encoding布字符串,取值pcm、ALaw、G729、AMR_NB、GSM_HR、GSMEFR、SILK等pcm语音的编码格式GA/TXXXXX—XXXX11表9(续)序号参数取值默认值功能5audio-format/auf字符串,取值包括audio/L16;rate=8000、audio/L16;rate=16000等.
应支持audio/L16;rate=8000和audio/L16;rate=16000audio/L16;rate=16000指明识别音频数据格式6offset整数,单位毫秒(ms)0偏移量,如果是有效值,就做静音处理;应用场景:过滤DTMF按键片段表10结果定义表序号参数取值默认值功能1business-id/bizid字符串,必填,与业务id一致无业务id2error-code整数,0表示成功,非0表示失败,不同非0值对应不同的错误原因0错误码3error-reason字符串无在error-code为非0值时,error-reason描述发生错误的原因4clipping-ratio/cr浮点数,取值0.
0到1.
00.
0截幅比例6mos-score/ms整数,取值按照5分制定义:1分是基本单位,2分不及格,3分中等,4分良好,5分优秀1平均主观意见得分7aver-energy/aey浮点数0.
0音频平均能量8SNR浮点数,单位是分贝,信噪比越大,混在信号里的噪声越小,声音的音质量越高无信噪比9detail字符串,json格式无语音质量检测的详细信息5.
4.
3逆初始化语音识别服务行为描述:释放资源.
如果语音文件质量检测服务系统不是通过客户端组件提供服务,则本接口可省略.
输入参数:不做定义.
输出参数:返回值等.
6语音合成服务接口GA/TXXXXX—XXXX126.
1语音合成输入服务行为描述:语音合成客户端发起一个请求,传入参数.
输入参数:参数见表11,示例参见附录A.
5.
表11语音合成服务输入参数序号参数取值默认值功能1net-timeout/ntt整数,单位毫秒(ms).
取值范围为-1和1~30000的整数,-1表示无超时限制10000指明网络交互超时间隔2text-type/ttp字符串,取值包括plain和CSSML,plain表示纯文本,CSSML表示中文语音合成置标语言格式的文本.
应支持plain,宜支持CSSMLplain指明合成文本类型3text-info/tif字符串,必填无待识别的文本内容4text-encode/tte字符串,取值包括GB18030、GB13000等.
应支持GB18030,宜支持GB13000GB18030指明合成文本字符编码格式5audio-format/auf字符串,取值包括audio/L16;rate=8000、audio/L16;rate=16000等应支持audio/L16;rate=8000和audio/L16;rate=16000audio/L16;rate=16000指明合成音频格式6audio-encode/aue字符串,取值格式规范同RFC2045的Content-Type参数,其中的type取值为audio,subtype取值包括raw、pcma、pcmu、amr、amr-wb、speex、speex-wb、mp3等,其中raw表示不压缩.
对于支持可变码率编码的压缩算法,使用子参数level(或简写为lvl)指定压缩等级.
如取值为"audio/amr-wb;lvl=7"时,语音识别服务系统在网络传输中使用amr-wb算法的等级7压缩识别音频.
subtype的取值除raw外,宜支持以上音频压缩算法中的一种或多种audio/raw指明合成音频压缩算法7output-encode字符串,取值格式规范同参数audio-encodeaudio/raw指明输出合成音频压缩算法GA/TXXXXX—XXXX13表11(续)序号参数取值默认值功能8voice-name/vcn字符串,取值包括语音合成引擎内置音色库名称和用户个性化音色库名称由语音合成服务提供商自定义指明合成音色库名称9language/lang字符串,取值规范符合RFC5646.
应支持中文zh-CNzh-CN指明合成音频所属语种10dialect字符串,取值规则满足RFC5646规范,应支持zh_cmn,宜支持zh_yue等方言zh_cmn指明合成音频所属方言11speed类型、取值范围及各值含义和使用规范见SSML1.
1的3.
2.
4中的ratedefault指明合成音频语速12pitch类型、取值范围及各值含义和使用规范见SSML1.
1的3.
2.
4中的pitchdefault指明合成音频音高13volume/vol类型、取值范围及各值含义和使用规范见SSML1.
1的3.
2.
4中的volumedefault指明合成音频音量14number-read字符串,取值包括ordinal(按数值发音)、digits(按数字串发音)、score(按比分读法发音)和fraction(按分数读法发音),应支持ordinal和digitsordinal指明数字字符串读法15audio-info-format字符串,json格式json指明合成音频描述信息文本格式16audio-info-encode字符串,取值包括GB18030、GB13000等.
应支持GB18030,宜支持GB13000GB18030指明合成音频描述信息字符编码格式17mark-info布尔值,取值包括true和false,true表示返回标注信息,false表示不返回true指明是否返回合成音频的标注信息18vendor-x字符串,json格式无厂商自定义参数6.
2语音合成输出服务行为描述:返回语音合成的结果.
输出参数:语音合成服务输出的音频数据,至少应支持表12定义的音频数据格式,输出参数见表13,示例参见附录A.
5.
GA/TXXXXX—XXXX14表12合成音频数据格式音频数据格式音频数据格式描述audio/L16;rate=8000无音频头8kHz采样率16位单声道小端次序PCMaudio/L16;rate=16000无音频头16kHz采样率16位单声道小端次序PCM表13合成服务输出参数序号参数取值默认值功能1version/ver字符串,当前取值为0.
10.
1协议版本号3serial-number/sn整数,从1开始,每次递增加11音频序列号4out-flag/ofg整数,取值包括1和2,1表示还有后继的合成音频,2表示当前音频是最后一块1音频状态标志5current-end/ced整数,单位字节(B),取值范围大于等于零,小于合成文本总长度0当前文本合成位置6text字符串无标注信息所对应的文本内容7phrase字符串无短语信息8words字符串无句子中各个字或词的标注信息9word字符串无信息对应的字或词文本内容10pinyin字符串,描述的文本为中文字符时,取值为每一个字符对应的汉语拼音按字符先后顺序拼接起来的字符串,中间不加分隔符.
每一个字符对应的汉语拼音声韵组合规律符合《汉语拼音方案》,声调中的阴平、阳平、上声、去声和轻声分别用1、2、3、4和0表示,如"北京"的普通话汉语拼音表示为"bei3jing1"无文本对应的拼音11audio–uri字符串,必填无合成音频的完整链路地址12syllable字符串无音节13audio-begin浮点数,单位毫秒(ms)0.
0音频起始时间14audio-end浮点数,单位毫秒(ms)0.
0音频终止时间15text-begin整数,单位字节(B)0文本起始位置16text-end整数,单位字节(B)0文本终止位置17vendor-x字符串,json格式无厂商自定义参数GA/TXXXXX—XXXX157文本处理服务接口7.
1语义理解服务行为描述:语义理解客户端发起一个请求,传入参数,返回结果.
输入参数:参数见表14,示例参见附录A.
6.
输出参数:参数见表16,示例参见附录A.
6.
表14语义理解服务输入参数序号参数取值默认值功能1session-id/ssid字符串,必填,建议取值uuid无会话id2business-id/bizid字符串,必填,如未设置,将默认与session-id相同无业务id3resources-group/rg字符串,必填无资源分组名称,具体名称资源制作过程中定义(bizid)4text字符串,必填无解析的语义文本5paramsMap类型,参数取值见表15无解析参数,根据场景决定表15params参数集合序号参数功能示例1date当前日期2019-04-162time当前时间20:33:333location当前位置中国北京海淀区增光路4datetime-normal是否开启时间规整on:开启;off:不开启;默认为on5location-normal是否开启地点规整on:开启;off:不开启;默认为on6confidence是否输出置信度on:开启;off:不开启;默认为off7input-encode指定输入文本编码utf-88output-encode指定输出文本编码utf-89topn指定最多输出个数1010language指定语种zh_CN11normal-text是否规整输入文本on:开启;off:不开启;默认为on表16语义理解服务输出参数序号参数取值默认值功能1error-code整数,0表示成功,非0表示失败,不同非0值对应不同的错误原因0错误码GA/TXXXXX—XXXX16表16(续)序号参数取值默认值功能2error-reason字符串无在error-code为非0值时,error-reason描述发生错误的原因3text字符串,必填无原始输入的文本4confidence-threshold/cfd浮点数,取值范围为0.
0~100.
00.
0语义解析置信度5semantic字符串,json格式,json内容各厂家自己定义无语义结构化信息6language/lang字符串,取值规则符合RFC5646规范,应支持zh_CN宜支持en_US等zh_CN语义解析支持的语种7version/ver字符串,当前值为0.
10.
1语义解析版本号8normal-text字符串无经过系统规整处理后的输入7.
2要素提取服务行为描述:要素提取客户端发起一个请求,传入参数,返回结果.
输入参数:参数见表17,示例参见附录A.
7.
输出参数:参数见表18,示例参见附录A.
7.
表17要素提取服务输入参数序号参数取值默认值功能1session-id/ssid字符串,必填,建议取值uuid无会话id2business-id/bizid字符串,必填,如未设置,将默认与session-id相同无业务id3text-id/tid字符串,必填无文本id4text字符串,必填无待提取要素的文本表18要素提取服务输出参数序号参数取值默认值功能1business-id/bizid字符串,必填,与输入的业务id一致无业务id2text-id/tid字符串,必填,与输入的文本id一致无文本idGA/TXXXXX—XXXX17表18(续)序号参数取值默认值功能3error-code整数,0表示成功,非0表示失败,不同非0值对应不同的错误原因0错误码4error-reason字符串无在error-code为非0值时,error-reason描述发生错误的原因5resultsResult类型见表19,必填,复杂数据类型无要素抽取结果信息表19Result类型定义序号参数取值取值功能1org-text字符串,必填无原始输入的文本2org-wildchar字符串,必填无原始宽字符:"#"表示对应汉字不是要素;"-"表示是要素3confidence-threshold/cfd浮点数,取值范围为0.
0~100.
00.
0置信度4keysKey类型见表20,必填,复杂数据类型无抽取出的要素信息表20Key类型定义序号参数取值默认值功能1type字符串,取值见表21无要素类别2word字符串无提取出的词3begin整数,单位毫秒(ms)0提取出的词在句子中的开始位置4end整数,单位毫秒(ms)0提取出的词在句子中的结束位置5confidence-threshold/cfd浮点数,取值范围为0.
0~100.
00.
0置信度表21type参数集合序号参数描述1state-leader国家领导人2democracy-activist民运人员3religion-name民族宗教人名GA/TXXXXX—XXXX18表21(续)序号参数描述4foreign-name外国人名5name一般人名6crowd群体性人群7place国省市县区乡镇村名称8site地点名称9street街道名称10hotel宾馆名称11traffic交通站点12government-unit政府单位13foreign-media境外媒体14domestic-media境内重点媒体15domestic-media境内重点媒体16hostile-organization敌对非法维稳对象组织17general-organization一般组织18enterprise企事业单位19festival节假日20sensitive-date敏感日期21datetime时间22vehicle交通工具23dangerous-goods危害物品24general-item一般物品25harmful-behavior危害行为26id-number身份证号27phone-number手机号28bank-card-umber银行卡号29qq-umberQQ号30train-umber车次号31flight-umber航班号32platen-umber车牌号33email邮箱34entity一般实体35sensitive-entitie敏感实体7.
3要素纠正服务行为描述:要素纠正客户端发起一个请求,传入参数,返回结果.
输入参数:参数见表22,示例参见附录A.
8.
输出参数:参数见表23,示例参见附录A.
8.
GA/TXXXXX—XXXX19表22要素纠正服务输入参数序号参数取值默认值功能1topn整数,范围1~101返回匹配度最高的样本个数2confidence-threshold浮点数,取值范围为0.
0~100.
070.
0置信度阈值3type字符串,取值范围应支持表21类型无要素类型4phrase字符串,最大长度支持1024个字节无查询的词语表23要素纠正服务输出参数序号参数取值默认值功能1outnum整数,范围1~101实际匹配到的样本个数2resultsResult类型,见表24无匹配到的结果3srcstr字符串无原查询词语表24Result类型定义表序号参数取值默认值功能1confidence-threshold/cfd浮点数,取值范围为0.
0~100.
00.
0置信度阈值,值越高,匹配度越高2stdrslt字符串无字符串匹配样本对应的标准样本GA/TXXXXX—XXXX20附录A(资料性附录)语音消息结果示例A.
1一般语音识别结果消息示例一个简单的识别结果为"你涉嫌殴打他人"的消息示例如下:{"version":"0.
1","sentence-number":1,"last-sentence":true,"begin":0,"end":4000,"result-type":"word","error-code":0,"recognition-result":[{"candidate-words":[{"word":"你","begin":100,"end":800}]},{"candidate-words":[{"word":"涉嫌","begin":1000,"end":1900}]},{"candidate-words":[{"word":"殴打","begin":2400,"end":2900}]},{"candidate-words":[{"word":"他人","begin":3000,"end":3600}]GA/TXXXXX—XXXX21}]}A.
2自定义热词消息示例如果用户自定义了一个新词"市局",假设识别结果为"北京市公安局",识别结果消息示例如下:{"version":"0.
1","sentence-number":1,"last-sentence":true,"begin":0,"end":2000,"result-type":"word","error-code":0,"recognition-result":[{"candidate-words":[{"word":"北京","begin":100,"end":800,"user-word":false}]},{"candidate-words":[{"word":"市公安局","begin":1000,"end":1900,"user-word":false},{"word":"市局","begin":1000,"end":1900,"user-word":true}]}]GA/TXXXXX—XXXX22}A.
3命令字识别消息示例如果用户激活了一个包含词条"110"的语法"http://www.
example.
com/contacts",用户说话内容是"打电话给110",则识别结果消息示例如下:{"version":"0.
1","sentence-number":1,"last-sentence":true,"begin":0,"end":2000,"confidence-threshold":90,"error-code":0,"recognition-result":[{"grammar":"http://www.
example.
com/contacts","candidate-words":[{"instance":"110","score":92}],"user-input":"打电话给110"}]}A.
4语音质量检测消息示例如果用户需要检测某个音频文件的语音质量,输入音频文件地址:http://192.
168.
84.
190:36105/Kvhv21AfXsYh1f1BTFs3yhqpav.
wav,则检测结果消息示例如下:输入消息示例:{"bizid":"Vtk1fmX8tgVFd2ukjSrj6ivx2z","audios":[{"aid":"Kvhv21AfXsYh1f1BTFs3yhqpav","auf":"audio/L16;rate=8000","chnl":1,"encoding":1,"offset":0,GA/TXXXXX—XXXX23"spkn":2,"uri":"http://192.
168.
84.
190:36105/Kvhv21AfXsYh1f1BTFs3yhqpav.
wav"}],"vendor-x":{}}输出消息示例:{"bizid":"Vtk1fmX8tgVFd2ukjSrj6ivx2z","status":"true","error-code":null,"detail":{},"aver_energy":37886.
703,"clipping_ratio":0.
003502,"p563_score":1.
39113,"cluster":[{"segs":[{"type":1,"end":3070,"begin":2070}]],"aid":"Kvhv21AfXsYh1f1BTFs3yhqpav","dnn_Score":3.
917278}A.
5语音合成消息示例如果用户输入文本片段"我们是通州分局新华派出所的民警",合成结果以音频流的形式返回,消息示例如下:输入消息示例:{"params":{"3":60020,"6":2},"text":"我们是通州分局新华派出所的民警"}输出消息示例:带头16k16bit语音流注:返回HTTP状态码:GA/TXXXXX—XXXX24200=成功;400=传入的参数错误;500=服务内部错误A.
6语义理解消息示例如果用户想检索"北京4月17日天气",假设语义理解结果为"北京市4月17号是晴天",语义理解结果消息示例如下:输入消息示例:{"group":"car_autofly2","text":"北京市4月17号是晴天","params":{"date":"2018-04-16","time":"20:33:33","loc":"中国安徽省合肥市蜀山区望江西路","datetime_normal":"on","loc_normal":"on","confidence":"on"},"dicts":["singer_name","telephone_name"]}输出消息示例:{"state":{"success":true,"ok":1},"body":{"rc":0,"text":"北京市4月17号是晴天","service":"weather","operation":"QUERY","pk_score":1,"semantic":{"slots":{"datetime":{"date":"2018-04-17","dateOrig":"4月17号","type":"DT_BASIC"},GA/TXXXXX—XXXX25"subfocus":"晴天","location":{"cityAddr":"北京","city":"北京市","type":"LOC_BASIC"},"queryType":"确认","questionWord":"是"}},"language":"zh_cn_mandarin","version":"1.
0-1001","normal_text":""}}A.
7要素提取消息示例假设识别结果为"我在去市公安局的路上",如果用户想从一段话中提取"市公安局",要素提取结果消息示例如下:输入消息示例:{"text-id":"123","text":"我在去市公安局的路上"}输出消息示例:{"state":{"success":true,"ok":1},"key":[{"begin":"3","end":"8","type":"place","cfd":"0.
000000","text":"市公安局"}],"org_text":"我在去市公安局的路上"}GA/TXXXXX—XXXX26A.
8要素纠正消息示例假设识别结果为"安徽合肥",用户需要纠正为"安徽省合肥市",要素纠正结果消息示例如下:输入消息示例:{"cfd":"5","minsim":"0.
5","type":"0","phrase":"安徽合肥"}输出消息示例:{"outnum":"2","results":[{"cfd":"1.
0","stdrslt":"安徽省合肥市"},{"cfd":"0.
5","stdrslt":"安徽省芜湖市"}],"srcstr":"安徽省合肥市"}GA/TXXXXX—XXXX27参考文献[1]RFC2045多用途互联网邮件扩展第1部分:互联网消息体格式[2]RFC5646语言标识标签[3]SSML1.
1语音合成置标语言[4]GB13000信息技术通用多八位编码字符集(UCS)[5]GB18030信息技术中文编码字符集

提速啦:美国多IP站群云服务器 8核8G 10M带宽 7IP 88元/月

提速啦(www.tisula.com)是赣州王成璟网络科技有限公司旗下云服务器品牌,目前拥有在籍员工40人左右,社保在籍员工30人+,是正规的国内拥有IDC ICP ISP CDN 云牌照资质商家,2018-2021年连续4年获得CTG机房顶级金牌代理商荣誉 2021年赣州市于都县创业大赛三等奖,2020年于都电子商务示范企业,2021年于都县电子商务融合推广大使。资源优势介绍:Ceranetwo...

UCloud:全球大促降价,云服务器全网最低价,1核1G快杰云服务器47元/年

ucloud:全球大促活动降价了!这次云服务器全网最低价,也算是让利用户了,UCloud商家调低了之前的促销活动价格,并且新增了1核1G内存配置快杰型云服务器,价格是47元/年(也可选2元首月),这是全网同配置最便宜的云服务器了!UCloud全球大促活动促销机型有快杰型云服务器和通用型云服务器,促销机房国内海外都有,覆盖全球20个城市,具体有北京、上海、广州、香港、 台北、日本东京、越南胡志明市、...

可抵御99%的攻击中国单域版cdn:9元/月7T防御 cloudsecre

官方网站:点击访问CDN客服QQ:123008公司名:贵州青辞赋文化传媒有限公司域名和IP被墙封了怎么办?用cloudsecre.com网站被攻击了怎么办?用cloudsecre.com问:黑客为什么要找网站来攻击?答:黑客需要找肉鸡。问:什么是肉鸡?答:被控的服务器和电脑主机就是肉鸡。问:肉鸡有什么作用?答:肉鸡的作用非常多,可以用来干违法的事情,通常的行为有:VPN拨号,流量P2P,攻击傀儡,...

qq多人语音为你推荐
伺服器chrome计划ipad支持ipad支持ipad支持ipadx-router思科路由器有线端无法上网,而无线段却可以,用的是PPPOE拨号上网,一开始两种方法都不可以,检查宽ms17-010win10华为 slatl10是什么型号google图片搜索如何使用google图片搜索引擎?联通iphone4联通iphone4合约迅雷快鸟迅雷快鸟这种强盗软件不违规吗?
美国和欧洲vps 免费com域名申请 kvmla highfrequency 台湾服务器 美国主机推荐 xfce 嘟牛 京东商城0元抢购 Updog 环聊 空间租赁 百度云加速 申请免费空间 万网主机 后门 云销售系统 免备案jsp空间 数据湾 国外免费网盘 更多