輸入
形式:已录制音频
聲道:单声道&多声道
支持格式:wav,flac,opus,m4a,mp3
擁有領先的語音識別技術,核心技术达到国际领先水平,语音识别准确率已经超过98%,在业界遥遥领先。
用戶可將一些非常見的詞彙上傳至識別引擎,当实时转写的音频流中出现该词汇时,引擎可将其识别出来,提高专业用语识别准确率。
運用超大規模的語言模型,智能预测语境,提供智能断句和标点符号的预测。
對結果中出現數字、日期、时间等内容格式化成规整的文本。
形式:已录制音频
聲道:单声道&多声道
支持格式:wav,flac,opus,m4a,mp3
形式:json格式字符串
編碼:UTF-8
結果:分词形式&完整句子形式,词&句置信息度词&句时间戳,词属性,多候选词,文法格式智能转换,多发音人分离
將坐席通話轉成文字,帮助电话质检和信息同步,也为数据挖掘提供原料基础。
將會議和訪談的音頻轉換成文字存稿,让后期的信息检索和整理更方便快捷。
將視頻中音頻文件進行語音轉寫,轻松生成与视频相对应的字幕文件。
可以從轉寫出的文字結果中搜索匹配相關詞類,对黄暴/涉政内容进行高效鉴别。