600字范文,内容丰富有趣,生活中的好帮手!
600字范文 > 可信AI年度观察 | 智能语音产业需求不断升级 评测重点由技术转向产品

可信AI年度观察 | 智能语音产业需求不断升级 评测重点由技术转向产品

时间:2023-03-18 21:14:22

相关推荐

可信AI年度观察 | 智能语音产业需求不断升级 评测重点由技术转向产品

自《新一代人工智能发展规划》发布以来,人工智能发展已上升为国家战略,在“十四五”规划中,更是将人工智能列为科技前沿领域的“最高优先级”,国家政策支持为人工智能产业发展提供良好环境。同时,各行业逐渐重视改善价值链、追求降本增效,企业数智化转型需求为人工智能产业发展提供强劲动力。智能语音作为人工智能最为成熟的技术领域之一,其应用价值及落地成效尤为凸显。

一、行业观察

智能语音作为人机智能交互的关键接口,在各个行业中的普及程度逐渐提高,其应用领域正在呈现多元化的发展趋势,据德勤数据统计,2030年智能语音市场规模将超过千亿,智能客服中心、车载语音及智慧家居助手等产品的市场需求位居前列。

1、智能语音应用规模化落地,产业与实体经济加速融合

在车载领域,智能语音已成为车内车外人机交互关键环节,随着智能车载前装渗透率逐渐走高,消费群体和需求的规模化涌现,车载助手将迎来进一步市场增长点。在文娱领域,随着有声阅读的兴起,用户对听书产品功能的依赖度逐渐提高,有声读物在欧美市场近年来形势一片大好,在中国也面临巨大增值空间,业内人士认为,到 2030 年,全球市场价值可能超过 350 亿美元。在金融领域,智能语音与对话式AI在优化客服与运营业务及精准营销等业务场景发挥重要作用,据艾瑞统计测算,预计到2026年,智能语音与对话式AI核心产品市场规模将达到108亿元。

2、语音单点技术同质化明显,多模融合交互为突破方向

据艾瑞咨询发布的中国智能语音产品成熟度曲线表明,语音识别已进入稳步上升期,单一技术的产品及服务的差异化竞争大多体现在一些细节上,比如区分说话人、专业领域的词库等,但目前复杂场景下的语音识别难题,仍无法通过单一技术解决。多模融合交互是通过融合多种不同的信息,如听觉、视觉、触觉等,去增强感知的能力,通过分析多维数据,提高复杂场景下语音识别可用性。

3、AIGC迎来发展新契机,为智能语音产业注入新活力

被称为AIGC的元年,AIGC成为全球关注的焦点和热议话题,国内外大企业纷纷在AIGC领域进行布局。AIGC在文本、视频、音频、视频等数据生成方面表现出巨大应用潜力,据Gartner测算,预计2025年超10%的数据将由“生成式AI”创造。AIGC与智能语音技术的进一步结合及应用场景的创新落地,有望将智能语音产业市场推向新一轮高点,如AIGC+语音合成,可在媒体、金融、教育、文旅等领域赋能内容生产创作和业务服务。

二、评测观察

语音合成

从多款产品评估结果来看,音频合成质量持续提升,定制化能力基本具备,合成情感拟人度表现有明显突破,但情绪表现层次仍有进一步提升空间,同时多音字、专有名词、中英混读等评测点表现参差不齐。

语音识别

技术发展已相对成熟,通用测试集识别准确率平均高于95%,但在远场识别、噪声环境识别中各家产品性能表现存在差异,针对吞字、拖音等错误类型需加强纠正功能,在对话重叠场景下的识别准确率仍面临挑战。

声纹识别

技术已经有较多应用落地场景,声纹识别准确率依赖内容及音频时长,克服防攻击、抗时变、抗干扰等干扰因素的能力有待进一步提升。

对话式AI平台

建设进程较为快速,平台及工具的工程化水平相对成熟,对话搭建和快速调优部署等能力已基本完备,但复杂语义理解及对话生成等能力仍有进一步提升空间。

其他智能语音交互类技术产品

全双工交互系统多表现出良好理解能力,但在断句拼接成功率上还有很大提升空间;车载语音助手评测中,参评产品均具备较为完备的交互系统,但唤醒响应时间及环境影响下的识别效果与期待结果仍有较大差距;智慧助手解决方案评测中,位置和信息感知能力、多模融合、情绪识别、多设备协同唤醒等方面体现技术不足,仍需进一步突破。

三、中国信通院智能语音方向标准研制及评测项目总览

截至底,围绕智能语音技术及产品我院牵头研制国内标准9篇,国际标准1篇,并组织展开多轮评测,参评单位及评测结果如下:

标准方面,截至,我院围绕智能语音领域已完成4项团体标准发布,4项行业标准已进入最后报批阶段,预计重点围绕智慧车舱操作系统展开标准研制工作。

评测方面,将持续投入评测工作力度,上半年评测报名时间为2-6月,下半年评测报名时间定在为7-11月,评测内容包括:

技术类产品评测:语音识别、语音合成、声纹识别及全双工语音交互四类技术基础及专项能力评测

应用类产品评测:推动智能语音端侧产品、智慧助手(全场景/语音助手专项)、车载语音交互系统(首轮评估)、智能对话平台产品服务能力(全平台/能力模块-首轮评估)

评测基础设施方面:建设智能语音语义实验室,搭建评测数据集平台。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。