MSU的Arun Ross教授讲解了Privacy Preserving Biometrics
隐私的重要性
- privacy is the right to be let alone#
- the right of ppl to conceal info.
- is different from security
Biometrics
- 基于生物和行为的识别
- 要有区分度
Identity vs Recogniation
- biometric 不会显式揭露身份
- 只是识别一个人的trait
- biometric 只是判断是不是同一个人啦
Privacy of the biometric data
- Age gender 等等信息,可以从人脸照片自动得到
- 一个分类器可以用来拿到一些soft biometric 属性
- 这就是为啥我们的隐私如此重要
Iris 也可以泄露信息
- 除了iris本身信息,有其他的信息可以被揭露么
- 虹膜也可以提取到包括性别等生物学信息,生理学的一些东西,
- 环境的信息, 什么设备采集的图片呀,光照, 室内还是室外
- pathological e.g. stomal
- other contact lens, pupil dilation level
Biometric + Forensics
- 这个人是男还是女
- 白人黑人
- 光照条件
- 这是联系了人和机器的数据描述?还是隐私的泄露呢?privacy compromise
Face2Gen
拍一张照片,就可以判断是不是有遗传病,这样的一个应用软件。
医生需要16年去学会如何判断,但是机器只需要一分钟左右。
Identify ppl on web
- 人脸识别,云计算,社交媒体 三个的汇聚
- 2009 Alessandro 结合人脸识别,从公开数据中预测SSN, 也就是美国的社会安全码。
GDPR
- 数据: 收集数据的目的是什么,收集之后不能用于其他目的
- 数据最小侵犯
- 准确度:确保数据必须要准确无误
- 存储多长时间,不能保存比预计的还要长的时间
可控隐私
Semi-Adversarial networks
- 设计一个转换
- age 不可以被model区分到
- 人脸对比还是可以进行
- 2018 ICB 发表的文章
- loss function: pixel level loss, gender attr, identity
- Sequence of SANs
PrivacyNet
-
3 soft biometric attrs: gender, age, race
-
privacynet:
cycleGAN: transforms images to a target label vector on Generator. Disctiminator:
Matcher -
loss function: 可以看原文
就是一个可以模糊属性的模型啦。设计不同的loss就行。 -
IEEE TIP 2020
-
rankone
-
arcface
summary
- semi-adv. network
- results: matching 还挺好的,多个属性可以调整
- 还有很多需要做 譬如说cross-linig across applications
最主要就是ICB和IEEE TIP这俩个文章。
问答QA
问: 在semi-adv. network, discriminator 和 matcher
- 使用discriminator, 在视觉上,保持
- matcher就是维持identity信息
- 他们都很重要
问: 什么是target lable
- 原始的数据是 0 1 1 ,我改到 111 就是女生到男生。
- [gender, mid-age, afric]
问: disentanglement vs your research
- disentanglement 你可以把identity和其他的一些属性区分开
- 但是很具有挑战,你怎么把他们组合回来呢?怎么去生成一个新的图像
- 我们主要是在图像上做 不是在特征上做
- 所以这个和disen. 不大一样
问: 怎么balance 这么多attr
- 越多的attr, 那么越多的attr 对身份有贡献
- 我们输入一个图像,转换到另外一个domain,图像看起来不一样,attr也不一样了,但是还是可以使用做匹配
- 即使有一些attr 丢失,还是可以做匹配