极目新闻客户端

科大讯飞多语种智能语音技术,让听障群体“看见”声音

极目新闻 2024-05-09 18:31:54 阅读量:

极目新闻记者 吴汉

5月9日,记者从科大讯飞了解到,今年是“听见AI的声音”关爱听障人士公益行动的第五个年头。在承诺终身免费提供相关服务的基础上,“科技助残”也在持续升级,如讯飞听见App新增快捷卡片启动、听障模式文本对话等功能等,通过多语种智能语音技术,让更多听障人士“看见”声音,共享美好生活,实现自身价值。

自2019年起,科大讯飞联合中国聋协、中国残疾人艺术团发起“听见AI的声音”关爱听障人士公益行动。以多语种智能语音技术为支撑,围绕讯飞听见系列、讯飞智能助听器等软硬件产品,为听力障碍人士提供免费的实时语音转文字服务、捐赠产品或者免费时长服务。产品形式多元化,覆盖听障群体的日常生活、工作、学习等场景,构建了完整的公益生态场景。

其中,讯飞听见App和智能助听器应用到听障和视障人士日常交流中,“让盲人听得见文字,让聋人看得见声音”;讯飞输入法无障碍模式为视障人群铺设了通向互联网世界的“盲道”等;讯飞开放平台也在创建无障碍环境,截至2023年年底,累计创建了近3万个无障碍应用,累计服务1269万名视听障人群;“听见AI的声音”关爱行动累计为听障人士提供超1亿分钟的免费转写服务,并承诺终身免费提供相关服务。

近几年,科大讯飞在多语种智能语音语言技术系统性创新中不断取得突破,有力支撑了讯飞翻译机、讯飞智能录音笔、讯飞听见等智能软硬件产品不断创新。这些AI产品也一直在助力国际沟通和无障碍交流。

星火语音大模型首批覆盖语种中,24个主要语种识别率达到了90%(已超过实用门槛);13个重点语种识别率更是超过了94%。在多语种语音合成能力方面,27个主要语种MOS(Mean Opinion Score)评分达到了4.4(普通人口语水平为4),13个重点语种MOS评分高达4.6(地方播音员水平)。

今年4月26日,讯飞星火大模型V3.5春季上新。面向用户高效准确知识获取的痛点,科大讯飞发布业界首个长文本、长图文、长语音大模型,不仅能够对各种信息来源的海量文本、图文资料、会议录音等进行快速学习,还能够在各种行业场景给出专业、准确回答。在AI语音交互方面,科大讯飞发布了多情感超拟人合成,进一步提升了情绪表达的可感知度,对高兴、抱歉、安慰、撒娇、困惑等情绪表达的可感知度达到85%以上,AI语音更加生动、真实。除了超拟人对话,科大讯飞还推出“一句话声音复刻”功能,一句话就可以定制AI助手的声音。

责任编辑:刘明 值班主任:魏曦