2024年IEEE声学、语音与信号处理国际会议ICASSP 2024宣布录用奇富科技关于语音情感计算的最新研究成果论文。

奇富科技介绍,此次被录用的论文研究方向聚焦在语音情感计算,团队提出了一种名为MS-SENet的新型网络结构,通过高效提取、选择和加权空间和时间多尺度特征,并将这些特征与原始信息相融合,获得更强的语音情绪表征向量。
情感计算领域是一个涉及计算机科学、心理学和语言学等多学科的交叉研究领域,它的主要目的是通过分析和处理语音信号中的情感信息,使计算机能够识别和理解人类的情感状态。
奇富科技团队认为可以从减少提取大量无关紧要的声学特征和针对局部频率和长期时间特征进行融合两方面去提升语音信号的情感表征学习,并基于此提出了MS-SENet框架。
另外,奇富科技团队在论文中评估了六个不同场景的多语种的数据集。和SOTA相比,MS-SENet将UA和WA提高了1.31%和1.61%,同时MS-SENet在具有更多情感类别和较低数据量的情况下,仍然保持着出色的情感识别能力。
据介绍,奇富科技的语音情感计算研究不止于理论突破,更是有成功的实际应用。例如,在贷后降投诉项目中,异常情绪监测首次被应用在实景业务当中。