近日,华南理工大学-优必选科技“类人情感智能”联合实验室最新的语音副语言任务通用模型(SpeechFormer++)已发表在语音领域顶级期刊TASLP(论文名:《SpeechFormer++: A Hierarchical Efficient Framework for Paralinguistic Speech Processing》)。
相比于时下最热门的自然语言理解模型Transformer,SpeechFormer++能够在语言理解的基础上,对语音信号进行进一步的分析和处理,从而能够更好地理解语言背后所传达出来的情感信息,提升语言理解的准确性。这一模型未来有望在语言情感分析及神经认知障碍分析等方面发挥更重要的作用。

情感是人类最基本、最复杂、最深刻的体验之一,也是人类与一般动物或其他无机体最根本的区别所在。人工智能之父马文·明斯基就曾经表示:“如果机器不能够很好地模拟情感,那么人们可能永远也不会觉得机器具有智能。”
对于人形机器人而言,其重要价值之一就在于与人类进行更频繁的互动;而是否能够真实识别人类情感,则是决定其能否实现这一价值的重要前提。本次华南理工大学-优必选科技“类人情感智能”联合实验室所提出的SpeechFormer++模型,便有望在未来进一步提升人形机器人对于人类语言情感识别的能力,从而让人形机器人距离“走进千家万户”这一目标更进一步。