深度学习中的公平性

2024-02-19 23:43:46

介绍

深度学习十分流行，在许多领域有着不错的表现。然而，深度学习算法中的公平性(fairness) 亦是重要的研究方向。这次，我们以Du的一篇文章为例，给大家介绍一下深度学习中的公平性。

Fairness in Deep Learning: A Computational Perspective

如何度量公平性？

这里介绍几种比较常见的度量指标：

人口学平等性 (Demographic Parity)
机会平等性 (Equality of Opportunity)
预测质量平等性 (Predictive Quality Parity)

人口学平等性

该度量指标能够保证算法的决策对于不同群体而言是相似的。比如：
p ( y ^ = 1 ∣ z = 0 ) p ( y ^ = 1 ∣ z = 1 ) ≥ τ \frac{p(\hat{y}=1|z=0)}{p(\hat{y}=1|z=1)}\geq \tau p(y^=1∣z=1)p(y^=1∣z=0)≥τ
其中 τ \tau τ 是一个给定的阈值，通常设置成0.8。 z z z 代表需要保护的属性，比如种族、性别等。

机会平等性

该度量指标考虑了不同群体当中，标签 y y y 的分布是有差异的。具体形式为：
p ( y ^ = 1 ∣ z = 0 , y = 1 ) − p ( y ^ = 1 ∣ z = 1 , y = 1 ) p(\hat{y}=1|z=0,y=1)-p(\hat{y}=1|z=1,y=1) p(y^=1∣z=0,y=1)−p(y^=1∣z=1,y=1)
以及
p ( y ^ = 1 ∣ z = 0 , y = 0 ) − p ( y ^ = 1 ∣ z = 1 , y = 0 ) p(\hat{y}=1|z=0,y=0)-p(\hat{y}=1|z=1,y=0) p(y^=1∣z=0,y=0)−p(y^=1∣z=1,y=0)
类似于真阳性 (true positive) 以及假阳性 (false positive) 的概念。

预测质量平等性

该度量指标主要是不同群体下的正确率或者精度。

与可解释性之间的联系

如图所示，由于人类的造成的偏差，我们的数据集会产生偏差，在神经网络训练的时候，就会放大这个偏差。我们可以通过可解释性来发现数据中可能产生的偏差并且减轻这种偏差。

举个例子，比如贷款系统，如下图所示：

我们可以通过可解释性，发现拒绝贷款的原因反映在输入的哪一些方面上，进而发现这种歧视。

更为细粒度地，我们可以通过神经元来进行解释，如下图所示：

通过神经元的激活状态，我们判断其预测的依据，比如低语义的眼球颜色，以及高语义的种族等。

对偏差进行检测和修复

如上图所示，将女性医生和男性医生的照片输入网络，判别是否是医生，结果出现了明显的差异。我们通过构建不同的输入集合，可以发现一些决定性的因素，而这些因素，有可能反映了模型中的歧视。

我们可以参照对抗训练 (Adversarial Training) 的方式对模型中的偏差进行修复，比如：

我们通过模型输出，构建一个输出对敏感属性的预测器，反向地回传梯度，使得我们没有办法通过模型输出去预测那些敏感的属性。

同时，我们可以直接在数据的源头上进行公平的标注，然后再在这些数据上进行训练。

研究上的挑战

Benchmark Dataset

目前仍然是需要一个比较完备的数据集平台来评估不同的去偏差方法。

属性交集的公平性 (Intersectional Fairness)

比如一系列敏感属性的组合的公平性等，目前的工作仍然比较少

公平性和可用性的取舍

如何在保持高的可用性下，做到公平性，仍然是个开放性的问题。

公平性的形式化

比如公平度量指标的形式化，可能需要一些更加精细的指标来度量深度学习里面的偏差。

大规模训练下的公平性

现如今，训练数据的规模越来越大。如何在大规模的训练数据下，保证公平性或者检查出其中的偏差，也是一个开放性的问题。

码农公寓

深度学习中的公平性

介绍

分类

如何度量公平性？

与可解释性之间的联系

对偏差进行检测和修复

相关数据集

研究上的挑战

码农公寓

介绍

分类

如何度量公平性？

与可解释性之间的联系

对偏差进行检测和修复

相关数据集

研究上的挑战

相关文章