新闻资讯
j9九游会官方收受非自追忆掩码生成Transformer-九游娱乐(中国)有限公司-官方网站
10月24日,趣丸科技通知与香港汉文大学(深圳)聚会研发的语音大模子“MaskGCT”庄重在Amphion系统中开源j9九游会官方,面向行家用户灵通使用。分袂于传统TTS模子,该模子收受掩码生成模子与语音表征解耦编码的立异范式,在声息克隆、跨语种合成、语音放置等任务中展现出不凡遵守。
贵寓流露,MaskGCT(Masked Generative Codec Transformer)是一个大范围的零样本TTS模子,收受非自追忆掩码生成Transformer,无需文本与语音的对都监督和音素级抓续时候展望。其手艺随意性在于收受掩码生成模子与语音表征解耦编码的立异范式。实验标明,MaskGCT在语音质料、雷同度和可意会性方面优于刻下起始进的TTS模子,况兼在模子范围和考研数据量加多时发达更佳,同期草率放置生谚语音的总时长。MaskGCT已在香港汉文大学(深圳)与上海东说念主工智能实验室聚会开辟的开源系统Amphion发布。
趣丸科技方面暗示,相较于现存的TTS大模子,MaskGCT在语音的雷同度、质料和安谧性上进一步随意,尤其在语音雷同度方面处于率先水平。据先容,MaskGCT在三个TTS基准数据集上都达到了SOTA遵守,跨越刻下起始进的同类模子。
现在,MaskGCT在短剧出海、数字东说念主、智能助手、有声读物、赞成教学等鸿沟领有丰富的哄骗场景。为了加速落地哄骗,在安全合规下,趣丸科技打造了多语种速译智能视听平台“趣丸千音”。一键上传视频即可快速翻译成多语种版块,并齐备字幕设置与翻译、语音翻译、唇音同步等功能。该居品进一步阅兵视频翻译制作经由,大幅缩小过往上流的东说念主工翻译资本和冗长的制作周期,成为影视、游戏、短剧等执行出海的理念念平台。
南边+记者 叶丹j9九游会官方