前言
Stack Overflow的2017年程序员问卷调查[1]已在上周启动,我们(Stack Overflow的数据组)十分期待通过分析这次的调查结果来更好地了解我们的程序员群体。(译者注:Stack Overflow是一个IT技术问答网站,用户可在上面免费浏览、提交和回答问题。)我一直关注从事科技相关领域的女性群体,所以为了进一步地了解女程序员群体的现状,最近我特地去研究了去年(2016年)的程序员调查问卷的数据。(译者注:作者自己也是一位女程序员)
有多少女性参与了程序员问卷调查?
您可以在Github的R程序包中找到Stack Overflow的2016年程序员调查的结果[2]。基于Stack Overflow的用户反馈,从今年起,我们改变了性别一栏的可选项。在2017版的问卷中,参与者可以从以下几个选项中进行单选或多选:
-
男性
-
女性
-
跨性别者
-
非二元性别(译者注:拒绝接受传统性别二元区分的人),酷儿性別(译者注:“酷儿”(Queer)这个词本意是奇怪,但是最近几十年来已经成为非传统性别的代称词语之一),或非常规性别
-
其他(请注明)
首先,让我们用去年的结果(沿用去年的性别划分)来了解不同性别的人中各有多少参与了这一调查。
上图:2016年程序员问卷调查中不同性别的参与人数,从左至右分别为:女性,男性,其他,不方便透露,不适用。
总共有3202位女性参与了2016年程序员问卷调查,占所有问卷参与者的5.76%。我们都知道在IT领域,女性员工的比例要低于男性,但是这一比例(5.76%)比我们预计的还要低。根据Quantcast对Stack Overflow用户人口调查显示,女性约占其用户的10%,这要高于参与这一问卷调查得女性比例。
我们对去年这两比例的差异有些失望,因为我们希望这一问卷调查的结果能够代表各种类型的程序员群体。我们重视每一位 Stack Overflow用户的观点,所以希望在今年的问卷调查中能听到更多用户的观点。
我们为什么使用Stack Overflow?
接下来,让我们以问卷中的一个问题为例来比较一下男性和女性的回答。这是一个多选题:“你为什么使用Stack Overflow?”
上图:在“你为什么使用Stack Overflow?”这个问题上,在各选项上的男女程序员百分比(深绿色为男性,紫色为女性)。前三个选项分别为:“寻求工作上的帮助”;“因为我热爱学习”;“帮助他人”。
首先,我们注意到在各选项的选择比例上,女性的误差要大于男性;这是因为参与调查的男性数量远高于女性,从而导致了我们对女性的分析结果不如男性的精确。其次,我们发现在某些选项上男性和女性的选择百分比有所不同。比如,女性更倾向于选择和工作相关的选项,而较少选择类似“帮助他人”或者“维持网络参与度”这样的选项。
我们通过统计分析(尤其是卡方检验(chi-squared test))发现,这些男女回复的不同分布并不是一个偶然。它表明男性和女性使用Stack Overflow的目的和体验是不同的。女性使用Stack Overflow更多是源于工作需求。她们在这一问题上给出的是非常实用主义的回答,而不是选择类似“帮助”或者“学习”这样的选项。
使用的IT技术
问卷中的另一个多选题调查了参与者都使用什么IT技术。对这个问题,男性和女性的答案又有什么异同呢?
上图:男女对不同的编程语言/技术的使用比例:横轴为男性使用比例,纵轴为女性使用比例。
这张图的横轴代表各项编程技术的男性使用比例,而纵轴代表了女性使用比例。首先我们可以看到大多数编程技术在虚线(斜率为1)(译者注:对角线)附近,这表明总体而言,女性和男性在编程语言的选择上较为相似。比如,男性和女性中都有很多人使用JavaScript。
我们也注意到几乎所有的编程语言/技术都在虚线的右下方。这也就是说,对大多数技术而言,男性中使用它们的比例高于女性。由于这是一个多选题,这也表明了男性在这一问题上相对于女性选择了更多门编程语言/技术——数据显示,男性选择技术数量的中位数是4,而女性则是3。这一差异的背后可能隐藏着复杂的原因(比如男女在对自身技能的评估标准不同等等),但其中一个可能的原因是参与这一问卷调查的女性的平均年龄要低于男性[3]。
上图:在男女使用比例上差距较大的编程语言/技术:横坐标为女性/ 男性相对比例。
尽管男性和女性在使用的技术上有很多相似之处,但在对某些技术的认可上依旧存在着不小的差异:选择使用Salesforce、Matlab、R和Ruby的女性比例更高。作为一个数据科学家(和一个女性!),我也会在工作中使用R,所以我觉得这一发现十分有趣。相比之下,男性使用比例较高的编程语言和技术则包括Rust、Redis、F#和 Arduino/Raspberry Pi。
探究更多的问卷问题
以上问题只是我们程序员调查问卷的众多问题中的两个,我们想通过研究更多的问题答复来找出男性和女性程序员的异同。我用Shiny[4](译者注:Shiny是RStudio公司开发的R程序包。有了它,用户就可以使用R语言轻松开发交互式的网络应用程序。)制作了一个应用程序,这样用户就可以自己用它来探究这些问卷的答复。
上图:基于Shiny的应用程序(用户界面展示):Stack Overflow程序员问卷调查结果。通过这个应用程序,用户可以自己去查看更多问卷问题的答复和分析。
当使用这个应用程序时,您会注意到以下几件有趣的事:
-
相对于男性,更多女性重视职场中的多样性。
-
女性更容易热爱她们的老板和赞同她们所在的公司的使命。
-
相对于男性,女性更厌恶熬夜写码,她们更喜欢每天按时下班或者在家办公。
-
在一些问题上(比如:学习新技术是否重要?你是否喜欢解决问题?升职是否重要?),男女答复接近或几乎相同。
-
我们都赞同我们可不想去火星那鬼地方!
这个应用程序界面上方的版块展示了问卷结果,而下方的版块展示了与此图对应的卡方检验的结果。在这里我们比较了20个P值,虽然不是很多,但我还是为这里的多重比较的结果作了一个校正(译者注:多重比较校正是研究中常见的用来控制假阳性的一个方法。)。你可以点击注释中的GitHub链接[5]浏览我制作这个应用的代码。
这些来自男女两性的问卷答复向我们展示了男女程序员之间的异同点,帮助我们更好的了解程序员这一群体。2017年Stack Overflow程序员问卷调查现已拉开帷幕,我们想要听见你的声音来帮助我们进一步了解程序员群体。再重复一遍,我们想要得到各种类别的程序员的回复。从去年的结果来看,程序员中的少数群体的调查回复率更低,所以重要的事情重复三遍,我们想要知道你(是的,就是你)是怎么想的。今天就来参与我们的程序员问卷调查吧[6]!
原文发布时间为:2017-02-02
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号