转述自 CAAI认知系统与信息处理专委会
作者:王冲 方斌
随着人工智能技术的飞速发展,机器人逐渐具备了强大的理解和互动能力。近年来,学者们开始深入探索这些机制,以期机器人在真实环境中能够长期理解并与人类互动,从而揭示了个性化人机交互中的机遇与挑战。
人机交互是一个跨学科领域,致力于开发和理解支持机器人与人类共存的技术。基于人文主义价值观,该领域的一个子集专注于研究提升个人生活质量的机器人。此类研究涵盖了医疗触觉、康复机器人以及社会辅助机器人(SAR)。SAR的目标是结合工程、计算机科学和社会科学,协助教育工作者、父母、护理者和临床医生的工作。研究表明,人与机器人的伙伴关系可以缓解关键的健康挑战,如特殊教育需求、老人护理和康复等,这些挑战需要社会调解和个性化的长期支持。人类的学习、发展和关怀都遵循着每个人的独特非线性轨迹。因此,个性化计算在HRI中显得尤为重要,它针对个人用户不断变化的需求展现了现实世界的复杂性,而机器人和机器学习研究团队往往忽略了这种复杂性。
幸运的是,在大数据时代,人机交互异常丰富。人们经常与计算模型交互,无论是隐藏在他们最喜爱的数字媒体网站之后,还是在家中与AI助手交流。21世纪的用户,无论是自愿还是不知情,都会用自己的个人数据换取“免费”服务。因此,提升生活质量的个性化机器人和虚拟代理服务正在行业中成为现实——商业实例包括基于认知行为疗法的治疗性聊天机器人Woebot等。然而,在利用这些数据以更好地了解人类用户并与之交互时,仍有许多开放性的挑战,包括现实世界数据固有的噪音、个人的广泛需求和偏好、意外的模型偏差、隐私和安全障碍,以及在学习更多个性化或更具普遍性的HRI模型之间进行权衡。为了应对这些挑战,将多模态、交互式和多任务机器学习的范例应用于实际环境并进行评估至关重要。
人与人之间的互动本质上是多模态的:在互动时,我们会不断产生和解释丰富的数据组合。根据可用的数据来源和形式,人们可以从声音信号(如笑声)、朋友的视觉图像、显示朋友富有表现力的肢体语言的视频或朋友发送的快乐表情等符号信息中识别出朋友的喜悦。多模态机器学习的范例整合了多种模态的特征,以建立更全面的人类交流模型,使它们对个人差异和现实世界的噪音更具鲁棒性。在研究中,多模态机器学习已成功应用于情感识别、各种心理障碍的预测,以及更经典的计算机视觉任务,如图像分类。然而,今天的大多数会话和交互代理(例如,AI助手和聊天机器人)都是单一模态的,只依赖于语音。尽管多模态的联合表示带来了许多技术挑战,但包含一系列通信特征的模型对于理解和个性化真实世界环境中的人类交互非常有利。
机器学习模型考虑的模式或特征越多,就需要更多的示例、计算能力和内存来学习如何区分这些特征。深度学习的最新进展接受了这种“维度诅咒”,并对大量数据进行了训练。例如,谷歌DeepMind推出的深度强化学习(RL)算法AlphaGo Zero接受了2900万个示例游戏的训练,通过数百万次的试错来学习掌握战略游戏。尽管这是RL求解高复杂度问题的一个重要实例,但围棋的复杂性与真实世界中的人与人之间的交互的复杂性相差甚远,它具有多模态、噪声、不完全、随机性、情境性以及难以获得大规模数据的特点。交互式机器学习(IML)范式提供了一种解决方案:利用人类用户和领域专家的输入来进一步为机器学习过程提供信息、指导和加速。在交互式强化学习(IRL)或策略形成方面的研究表明,直接的人工反馈,即使不频繁和不一致的,也能改善策略优化。此外,HRI的研究表明,透明性(例如,机器人承认自己的无能或寻求建议)可以通过Pratfall效应来提高机器人的可爱程度和人机关系。因此,通过应用IML的“人在回路中”方法,机器人可以同时利用和促进他们的人际关系。
图1.个性化人机交互。摘自science robotics发表的"Robots for the people,by the people: personalizing human-machine interaction"
解决复杂问题的另一个机器学习范式是多任务学习(MTL)。许多机器学习应用程序针对单个问题或任务进行了优化,而MTL针对多个问题进行了优化,保留了一个任务所学知识的各个方面,并将其传输到相关的任务。MTL已被广泛应用于从个性化情感计算到机器人对象操作等问题领域。MTL可以类似地应用于许多不同用户的个性化HRI。机器人对如何与一个用户进行交互的知识可以转移到与相似用户进行的交互中,也可以在其与相似用户的交互之间共享。HRI的MTL可以使机器人更轻松、更智能地与新用户进行交互,即使使用诸如强化学习这样的数据密集型方法,也可以避免社交交互失败的不利影响。MTL和多模态ML已用于自动识别自闭症谱系障碍(ASD)儿童。自闭症是一种发育障碍,由多种症状组合和与社交和沟通技能相关的严重程度所定义。因此,在儿童之间诱导性地转移HRI策略必须特别敏感。除了传统的MTL应用程序之外,仔细定义用户之间的关联性或可转移性非常重要,以避免对个性化HRI产生不利的归纳或模型偏差。
随着机器人技术和AI的进步,人与机器人的关系也在发生着变化。多模态、交互式和多任务机器学习的范例有望通过包含广泛的通信模式、交互式用户反馈和跨用户共享知识来解决人机交互和个性化人机交互方面的开放挑战。这也需要机器学习和HRI领域之间的更好合作,只有通过这种多学科交叉,人与机器人共存的未来社会才会更加美好。
转载请注明来自广州玛斯顿影音有限公司,本文标题:《学术分享丨个性化人机交互 》