2021WSB-day3-1 - Arun Ross 老师讲解Privacy Preserving Biometrics



听百家之言,集百家智慧,站在巨人肩上攀登


MSU的Arun Ross教授讲解了Privacy Preserving Biometrics

隐私的重要性

  • privacy is the right to be let alone#
  • the right of ppl to conceal info.
  • is different from security

Biometrics

  • 基于生物和行为的识别
  • 要有区分度

Identity vs Recogniation

  • biometric 不会显式揭露身份
  • 只是识别一个人的trait
  • biometric 只是判断是不是同一个人啦

Privacy of the biometric data

  • Age gender 等等信息,可以从人脸照片自动得到
  • 一个分类器可以用来拿到一些soft biometric 属性
  • 这就是为啥我们的隐私如此重要

Iris 也可以泄露信息

  • 除了iris本身信息,有其他的信息可以被揭露么
  • 虹膜也可以提取到包括性别等生物学信息,生理学的一些东西,
  • 环境的信息, 什么设备采集的图片呀,光照, 室内还是室外
  • pathological e.g. stomal
  • other contact lens, pupil dilation level

Biometric + Forensics

  • 这个人是男还是女
  • 白人黑人
  • 光照条件
  • 这是联系了人和机器的数据描述?还是隐私的泄露呢?privacy compromise

Face2Gen

拍一张照片,就可以判断是不是有遗传病,这样的一个应用软件。
医生需要16年去学会如何判断,但是机器只需要一分钟左右。

Identify ppl on web

  • 人脸识别,云计算,社交媒体 三个的汇聚
  • 2009 Alessandro 结合人脸识别,从公开数据中预测SSN, 也就是美国的社会安全码。

GDPR

  • 数据: 收集数据的目的是什么,收集之后不能用于其他目的
  • 数据最小侵犯
  • 准确度:确保数据必须要准确无误
  • 存储多长时间,不能保存比预计的还要长的时间

可控隐私

Semi-Adversarial networks

  • 设计一个转换
  • age 不可以被model区分到
  • 人脸对比还是可以进行
  • 2018 ICB 发表的文章
  • loss function: pixel level loss, gender attr, identity
  • Sequence of SANs

PrivacyNet

  • 3 soft biometric attrs: gender, age, race

  • privacynet:
    cycleGAN: transforms images to a target label vector on Generator. Disctiminator:
    Matcher

  • loss function: 可以看原文
    就是一个可以模糊属性的模型啦。设计不同的loss就行。

  • IEEE TIP 2020

  • rankone

  • arcface

summary

  • semi-adv. network
  • results: matching 还挺好的,多个属性可以调整
  • 还有很多需要做 譬如说cross-linig across applications

最主要就是ICB和IEEE TIP这俩个文章。

问答QA

问: 在semi-adv. network, discriminator 和 matcher

  • 使用discriminator, 在视觉上,保持
  • matcher就是维持identity信息
  • 他们都很重要

问: 什么是target lable

  • 原始的数据是 0 1 1 ,我改到 111 就是女生到男生。
  • [gender, mid-age, afric]

问: disentanglement vs your research

  • disentanglement 你可以把identity和其他的一些属性区分开
  • 但是很具有挑战,你怎么把他们组合回来呢?怎么去生成一个新的图像
  • 我们主要是在图像上做 不是在特征上做
  • 所以这个和disen. 不大一样

问: 怎么balance 这么多attr

  • 越多的attr, 那么越多的attr 对身份有贡献
  • 我们输入一个图像,转换到另外一个domain,图像看起来不一样,attr也不一样了,但是还是可以使用做匹配
  • 即使有一些attr 丢失,还是可以做匹配
上一篇:Fortify Audit Workbench 笔记 Privacy Violation 隐私泄露


下一篇:Python给照片换底色(蓝底换红底)