差分隐私java_差分隐私(一)DifferentialPrivacy简介

更新时间:2023-05-24 07:22:40 阅读: 评论:0

差分隐私java_差分隐私(⼀)DifferentialPrivacy简介
最近⼀直在学习差分隐私,刚开始学的时候由于对这⽅⾯的知识不太清楚,⼀直处于模模糊糊的理解状态。现在学习了⼀段时间后开始有了⼀些初步的认识,所以把学习过程中的⼀些知识总结⼀下,⽅便以后复习,也为其他的⼩伙伴提供⼀些思路。由于我也是初学者,所以难免会出现⼀些错误,希望各位⼤佬可以指出。
本⽂的主要内容是按照Dwork在2013年写的The Algorithmic Foundations of Differential Privacy
整体的逻辑是按照三部分展开:什么是差分隐私,利⽤⼀个简单例⼦形象说明
差分隐私的第⼀种形式,严格差分隐私
差分隐私的第⼆种形式,松弛差分隐私
海拉尔要塞附:符号的⼀些说明
1 - 什么是差分隐私
差分隐私顾名思义就是⽤来防范差分攻击的,我最早接触到差分攻击的概念是数据库课上⽼师介绍的。
举个简单的例⼦,假设现在有⼀个婚恋数据库,2个单⾝8个已婚,只能查有多少⼈单⾝。刚开始的时候查询发现,2个⼈单⾝;现在张三跑去登记了⾃⼰婚姻状况,再⼀查,发
现3个⼈单⾝。所以张三单⾝。图1-1 差分攻击⽰意图
这⾥张三作为⼀个样本的的出现,使得攻击者获得了奇怪的知识。⽽差分隐私需要做到的就是使得攻击者的知识不会因为这些新样本的出现⽽发⽣变化。
那怎么做到呢?加⼊随机噪声。⽐如刚才的例⼦,本来两次查询结构是确定的2和3,现在加⼊随机噪声后,变成了两个随机变量,画出它
们概率分布图。图1-2 概率分布图
现在,如果张三不在数据库的话,得到结果可能是2.5;张三在的话,得到的结果也可能是2.5;两个数据集查询得到某⼀个结果的概率很接近,以⾄于我们根本分不清这个结果来⾃于哪⼀个数据集,这样也就实现了攻击者的知识不会因为张三这个样本的出现与否⽽发⽣变化。
捐款倡议书
这些只是概念上的理解,总结⼀下就是对查询的结果加⼊噪声,使得攻击者⽆法辨别某⼀样本是否在数据集中。⼀个形象的说法就是,双兔傍地⾛安能辨我是雄雌。
2 - 公式化的理解
田七的作用与功效
刚才只是讲到概念上的理解,现在从数学上理解⼀下。上⾯的查询函数可以⽤
表⽰,最终得到的查询结果就是
大便不成形的原因有哪些
,应该有:图2-1 差分隐私定义
这是很多博客⼀上来就直接给出的定义公式,很少有解释是怎么来的,我在看了The Algorithmic Foundations of Differential Privacy 这本书⾥⾯的3.5.1才明⽩。
⾸先还是得回到图1-2,我们的⽬的是使的这两个分布尽可能地接近,那么衡量两个分布
占据英语但是我们并不关⼼这两个分布的整体差异,我们只需要两个分布在差距最⼤的情况下能够被bound住,所以引⼊了MAX-Divergence,并且使得它⼩于
化简⼀下,利⽤
指数运算将
刚开始读的时候,我容易把集合
和元素
越⼩,隐私保护越好,但是加⼊的噪声就越⼤,数据可⽤性就下降了,如下图2-3,数据相对于正确的中⼼值更加分散。对于应⽤差分隐私的算法,⾸先会设定整体的隐私预算,每访问⼀次数据,就会扣除⼀些预算,当预算⽤完,数据就⽆法再访问,图2-3 更⼤噪声⽔平下的
概率分布图
3 - 差分隐私的松弛
古诗凉州词
2中定义的差分隐私太过严格,在实际的应⽤中需要很多的隐私预算。因此为了算法的实⽤性,Dwork后⾯引⼊了松弛版本的差分隐私:
还是从对应的Max-Divergence来理解:
相⽐较于原始的式⼦,对分⼦减去了⼀个
直观形式如下图,像图中标注的位置,本来
是⽆法bound住,但是我们考虑松弛项
除了Dwork这⾥定义的松弛差分隐私,后⾯有许多⼯作都在围绕着如何定义出松弛的差分隐私,⽐如利⽤ Rényi Differential Privacy, privacy-loss的矩
4 总结
这篇主要讲的差分隐私概念的来源和形式定义,但是对于差分隐私中的噪声怎么加没有讲,下⾯应该会去学习差分隐私中Laplace, Exponential, Gaussian三中噪声机制以及对应的证明。
对关羽的评价
表⽰⼀个随机噪声,可以服从⾼斯分布或者指数分布。
兄弟数据及
得到的最终结果。
表⽰⼀个很⼩的值,⽤来衡量隐私预算。
取不同值得时候代表不同的Divergence,⽐如KL-Divergence,Max-Divergence,是衡量两个分布的⼀种推⼴形式的表达,下⼀篇会
匹多莫德口服液讲到。

本文发布于:2023-05-24 07:22:40,感谢您对本站的认可!

本文链接:https://www.wtabcd.cn/fanwen/fan/89/926300.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:差分   分布   攻击者   样本   结果
相关文章
留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 专利检索| 网站地图