人工智能与可穿戴技术结合 实时检测人类情绪变化

人工智能与可穿戴技术结合实时检测人类情绪变化

Original 2017-02-03 John IntelligentThings

导读

一次谈话，会让人们产生不同情绪，例如高兴、悲伤、压抑、兴奋等。美国科研人员发明一种结合人工智能和可穿戴技术的系统，它能够基于个人的言语方式和生命体征，判断出谈话是愉快的、悲伤的或是中性的。

（图片来源于：MIT）

简介

该系统由麻省理工学院计算机科学和人工智能实验室（CSAIL）和医学工程和科学研究所（IMES）联合开发。研究生 Tuka Alhanai 与博士生 Mohammad Ghassemi 合著了一篇相关的论文，并且将在下周于旧金山召开的美国人工智能协会（AAAI）的会议上发表。

对于这个研究的意义，我们先看看研究的领头人Tuka Alhanai 怎么说：

“我们可以想象，在对话结束时，如果你能够回顾整个过程，就会看到周围的人感到十分焦虑的时刻。我们的工作在此方向上已迈出一步，可能离人们在口袋中拥有人工智能教练的那一天不远了。”

当实验参与者讲述一个故事时，系统会分析讲话的语音、文字、以及心理信号，从而得出故事的整体基调，准确率可达83%。系统通过使用深度学习技术，每隔五秒钟提供一次“情绪分”。

隐私保护

研究人员称，人们通过使用智能手表上的人工智能系统，在多人谈话中创造出更多可由算法分析的数据，进一步提高系统性能。团队指出他们已经开发了一个具有强烈隐私性的系统：可以在用户的设备上本地运行算法，保护用户的个人隐私信息（Alhanai 称消费者版本，将需要明确的协议，在争得人们的同意得基础上，加入他们的对话中。）

工作方式

许多与情绪检测相关得研究，都通过向参与者展示“高兴”和“悲哀”的视频，或者让他们表现出特殊的情绪状态。但是为了引起更多自然的情绪，相反地，团队让受测试者自己选择讲述一个“高兴”或者“悲伤”的故事。

受测试者佩戴三星智能手环 Simband ，该设备可以捕捉高分辨率的生理波形，测量运动、心率、血压、血流和皮肤温度。系统也可捕捉音频数据和文字内容，从而分析讲话者的语调、音高、音量和词汇。

（图片来源于：MIT）

团队捕捉了31种为时几分钟谈话内容，训练两种数据算法：一种将整个对话分为高兴或者悲哀，而第二种将每五秒钟的谈话分为积极、消极、或者中性。

Alhanai 注意到，在传统的神经网络中，所有数据相关特征都提供给基础网络算法。相对而言，她的团队发现他们可以让网络的不同层，组织不同的特征，从而提高算法。

结论

算法的发现和人类的观察一致。例如，长时间停顿或者单调的语调，和令人悲伤的故事相关，而精力充沛的各种讲话和高兴的故事相关。考虑到肢体语言，悲伤的故事和坐立不安以及心血管活动相关，也和某些特定的姿势，例如把手放在脸上相关。

平均来说，这个模型可以区分每五秒间隔的讲话情绪，准确率比随机水平高18%，比目前的方案要高7.5%。

（图片来源于：MIT）

未来

作为社交教练，这种算法目前还不够可靠，但是 Alhanai 称他们正在向这个目标迈进。未来，团队计划更大范围的搜集数据，使用例如 Apple Watch 等商用设备，让他们可以在现实世界中更好地实现该系统。

另外，这款产品有望能用于帮助埃斯博格综合征或自闭症患者。

Alhanai 说：

“我们的下一步，就是提高算法的情感粒度，这样可以更加精确地检测出厌烦、紧张和激动的时刻，比那种‘积极’或者‘消极’的标签更加准确。开发这项技术可以利用人类情感脉冲，动态地提高我们之间的相互交流。”

参考资料

【1】http://news.mit.edu/2017/wearable-ai-can-detect-tone-conversation-0201

相关阅读

需要咨询或者讨论，可以评论留言，也可以联系微信：JohnZh1984。

如果您想了解更多的前沿

技术文章，直接点击“阅读原文”。

一把短刀，怎么就让他连捅18人？！

向杨大市长道歉

向不容妄议的杨市长道歉

以色列搞大了：伊朗说要直接出兵参战

黄晓菁，这位杭州泰隆银行女员工自爆视频火了，带给我们那些思考？