CSDN泄漏数据完整分析

CSDN泄漏数据完整分析

2011-12-22 08:59:26 53391 次阅读 0 条评论
CSDN泄漏数据完整分析

感谢mayee的投递

昨天CSDN的用户数据库被人在网上公布。我下载分析了下里面的数据,得出了一些很有意思的现象。泄漏出来的数据只有三列:用户名、密码和邮箱。先来看看密码:

1.最常用的前50个密码

数量           密码

235037    123456789 

212761    12345678 

76349    11111111 

46054    dearbook 

34953    00000000 

20010    123123123 

17794    1234567890 

15033    88888888 

6995    111111111 

5966    147258369 

5890    aaaaaaaa 

5555    987654321 

5145    1111111111 

5026    66666666 

4686    a123456789 

4096    11223344 

3968    1qaz2wsx 

3650    password 

3649    xiazhili 

3610    789456123 

3505    qwertyuiop 

3491    qqqqqqqq 

3297    iloveyou 

3287    qq123456 

3282    87654321 

3175    000000000 

3100    asdfghjkl 

3063    31415926 

2985    12344321 

2943    1q2w3e4r 

2886    0000000000 

2770    QAZWSXEDC 

2752    123456abc 

2613    abcd1234 

2578    0123456789 

2573    123654789 

2540    12121212 

2437    asdasdasd 

2380    12341234 

2348    110110110 

2338    abc123456 

2298    aa123456 

2245    a12345678 

2243    22222222 

2219    a1234567 

2218    1234qwer 

2178    123456 

2166    123321123 

2165    qwertyui 

2113    123456123

看看里面有没有你常用的?

2.密码类型

我按 全部是数字;全部是字母;字母和数字;含特殊符号 为密码归了下类:

纯数字密码:2894567  (1)

纯字母密码:795778    (2)

字母和数字:2506714  (3)

含特殊符号:231572    (4)

另外还有一条数据密码是空

密码越复杂就越安全,但是采用字母数字加特殊符号高强度密码的只有231572,约占总共6428632个用户的 三十分之一

3.密码长度

数量         长度

2337895    8 

1550730    9 

929948    10 

627736    11 

368567    12 

167302    13 

154473    14 

84292    6 

74882    15 

49085    16 

33951    5 

18952    7 

7448    4 

6981    17 

5852    18 

5014    20 

2278    19 

1350    2 

1336    3 

559    1 

1    0

程序员的安全意识还是比较强的,密码普遍长度在8-14位。但是奈何不了明文存储,也奈何不了数据库泄漏哇

4.有多少程序员用手机号做密码

大约有189307个密码是以手机号形式存在的,按照号码前三位分类:

号码前三位 数量     

139    21171 

138    20996 

135    20248 

136    18444 

137    15876 

159    14347 

158    12455 

134    11076 

130    11004 

131    9441 

150    8074 

151    6737 

133    6068 

132    5880 

152    3356 

189    1102 

155    1082 

187    544 

153    528 

156    422 

186    238 

147    77 

157    45 

188    43 

145    24 

180    18 

185    9 

1349    2

看来程序员们还是最钟爱中国移动啊

5.有多少程序员用纪念日做密码

大约有437296个密码是以日期形式存在的,按数量排序如下

时间     数量

1987    43307 

1986    38670 

1988    37917 

1985    33117 

1984    32219 

1989    30284 

1983    28630 

1982    28432 

1981    18052 

1990    14514 

1980    12691 

1979    10528 

1978    9251 

1991    6391 

1977    6343 

1976    5186 

1975    4083 

2008    3923 

1974    3523 

1992    3260 

2006    3158 

2005    2978 

2004    2909 

2002    2815 

1973    2815 

2009    2691 

2003    2539 

1972    2504 

1993    2373 

2007    2290

如果认为密码就是该用户的生日,那么可以看出一些有意思的事情:80后是程序员的主力,85后已经崛起。

以200X为年份的,有可能是有了宝宝的程序员,以宝宝的生日为密码。

6.程序员们都用什么邮箱

下面是排名前30的邮箱提供商:

邮箱后缀    数量

qq.com    1976001 

163.com    1766935 

126.com    807818 

sina.com    351750 

yahoo.com.cn    205486 

hotmail.com    202965 

gmail.com    186809 

sohu.com    104756 

yahoo.cn    87040 

tom.com    72353 

yeah.net    53312 

21cn.com    50795 

vip.qq.com    35115 

139.com    29201 

263.net    24830 

sina.com.cn    19169 

live.cn    18918 

sina.cn    18599 

yahoo.com    18454 

foxmail.com    16430 

163.net    15279 

msn.com    14217 

eyou.com    13387 

yahoo.com.tw    10809 

huiseo.cn    8492 

csoftmail.cn    7121 

citiz.net    6617 

vip.sina.com    5379 

189.cn    5004 

etang.com    4261

网易邮箱 依旧是国内邮箱的老大,QQ正在快马追上。

上一篇:Pandas: 使用str.replace() 进行文本清洗


下一篇:【新人赛】阿里云恶意程序检测 -- 实践记录10.13 - Google Colab连接 / 数据简单查看 / 模型训练