光华思想力
光华思想力
《研究简报》第148期 人工智能时代的人机交互(下)——关注人工智能落地过程中的算法厌恶问题

 

 

人工智能算法在很多方面正在达到甚至超越人类的水平,而人工智能技术的使用可以带来极大的效率提升,例如医学诊断、简历筛选、智能推荐、机器人流程自动化等。[1]在现实中,人类与人工智能的交互形式非常复杂。在很多决策中,人类掌握着许多人工智能不知道的信息,因此人工智能只能提供一部分的辅助,最终决策仍然由人来完成。例如,在地图语音导航的场景中,人工智能会给人类提供最优行车路线,但是人类可以观察到更多的路况信息,驾驶仍然由司机本人完成。

因此,在企业数字化转型和技术升级的浪潮中,人们是否能够理智地看待、有效地利用算法所带来的技术红利相当关键。人类对待人工智能的态度将会决定人工智能技术的应用和效率提升程度。

上篇中笔者通过决策实验的方法研究引入人工智能辅助人类决策的过程中对劳动力市场效率和平等的影响。这里我们进一步分析在人机合作的框架下是否存在算法厌恶,并解析其背后的机制。本课题提供了如下发现:

第一,在预测“人脸”可信度的任务中,人工智能的效率比人类更高。

第二,人类对人工智能建议存在“算法厌恶”的现象。

第三,“算法厌恶”的现象可以用人类广泛存在的过度自信现象来解释。

一、人工智能打败了人类

漫长的进化历史使得人类非常善于处理视觉信息。大量的社会性交互使得人脸信息对于人类决策有重要影响。人工智能是否可以在“看脸”的任务上打败人类呢?

我们发现,机器学习算法预测的人脸“还款分”比人类决策者预测的更为准确,偏误更少。我们的样本中共有1103位违约者和3792位履约者。图1表明,在10分制的还款分下,人类决策者对违约者的平均打分是5.22,对履约者的平均打分是5.44。而机器学习算法对违约者的平均打分是3.21,对履约者的平均打分是6.94。在平均意义上,机器学习算法对还款概率的预测,比人类所做的预测更为准确。

图表, 条形图描述已自动生成

1 人类决策者(左)和机器学习算法(右)的人脸还款分比较

 

是否部分有优秀的“看脸”才能的人,可以超越人工智能呢?我们用统计学上的一个指标AUCarea under the receiver operating characteristic curve)来量化衡量还款分的质量,取值越大代表质量越高。图2展示了每个决策者的AUC值的分布和人工智能的AUC值,可以看到,即使是人脸还款分预测质量最高的那部分人类决策者,也无法超越人工智能(右侧虚线代表算法的预测质量)。

图表, 直方图描述已自动生成

2 人类决策者的还款分质量分布

 

二、人类对人工智能存在“算法厌恶”

虽然人工智能在很多任务上可以超越人类,但是人类很多时候并不愿意采用人工智能的建议,造成了效率的损失。现有的一些案例和研究表明,即使算法建议的质量更高,人们往往更倾向于使用人类的建议,而不愿意采纳算法的建议。这种现象被称为“算法厌恶(Algorithm aversion。最近一项关于语音推销机器人的研究可以生动地说明,现实中人们对人工智能存在着较为回避的态度。当顾客不知道与自己对话的推销员是机器人时,语音机器人和人工推销员的推销效果一样好;但是当顾客知道与自己对话的是机器人的时候,语音机器人的推销效果相比人工推销员下降了79.7%[2]

本研究关心人们是否会在借贷领域做出类似的非理性决策。我们估计了人类决策中对人工智能提供的“人脸分”所赋予的权重,并将其与最优权重进行对比。图3表明,大部分决策者对人工智能的权重误差都小于0。在回归分析中,算法给出的人脸分每上升1分(满分为10分),决策者认为还款概率将上升6.7个百分点,而实际上还款概率上升了8.9个百分点,这说明决策者对人工智能的权重误差为-2.2个百分点。这一结果说明,大部分决策者都倾向于低估人工智能提供的信息的重要性,即,他们存在算法厌恶。这是首次在人机交互的场景下使用权重的方式进行算法厌恶进行估计。


课题组成员:陈泽阳、刘玉珍、孟涓涓、王曾

作者单位:bat365在线平台网站光华管理学院

如需获取完整简报,请联系我们