度小满语音技术研究成果获世界顶级学术会议认可

2022-05-10 17:47:50 和讯 

  近日,由度小满博士后科研工作站朱文静、李祥两位博士后共同撰写的GLAM论文:Speech Emotion Recognition with Global-Aware Fusion on Multi-scale Feature Representation(“基于多尺度特征表示的全局感知融合语音情感识别”)入选了国际音频顶级会议ICASSP。


  ICASSP是全球最大、最全面的信号处理及应用方面的顶级会议,已经拥有几十年的历史。作为IEEE(电子技术与信息科学工程师协会) 的一个重要会议,其论文还经常被三大检索工具检索。该会议对于信号处理方面的学术人士有着重要意义。它涵盖了音频和声学信号处理,图像、视频和多维信号处理,物联网的信号处理等至少十六个方向。

  在本论文中,朱文静提出了全新的神经网络GLobal-Aware Multi-scale(GLAM),GLAM网络是根据语音独有的特征形式设计出的模型,在IEMOCAP基准数据集上,超越了当前最新技术。通过全局感知的融合模块来学习多尺度特征表征,并将此加入到情感信息中,这就解决了以往卷积神经网络(CNN)方法在SER上的局限性,即不同尺度的丰富情感特征和重要的全局信息无法被很好地捕捉。该模型有望应用到客服场景中,降低人工客服的沟通成本的同时,提升用户体验。


  据悉,朱文静、李祥两位博士后在进站后的研究均聚焦在情感计算,探索其在用户情绪感知、情绪原因溯源和情绪合理应对这三个方面的研究价值。

  目前,情感计算在金融领域的应用,已经起到了保驾护航、提高效率的作用。例如在动态对话过程中,观察出用户关键标签信息:所处领域、职业,以及借款用途等,在这样一张用户画像之下,预测出客户的还款、续保意愿或者对商品购买意向等。也可以通过对用户表情、语音、语速、行文、文本等信息,综合判断出贷款的客户是否存在欺诈行为,对减少坏账提供了不少便利。

(责任编辑:张萌 )

   【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。

看全文
写评论已有条评论跟帖用户自律公约
提 交还可输入500

最新评论

查看剩下100条评论

热门阅读

    和讯特稿

      推荐阅读