他录制了两百万GB色情视频,只是为了测试云存储是否真的“无限”

本文讲的是他录制了两百万GB色情视频,只是为了测试云存储是否真的“无限”“无限”的数据存储是否真的存在?我们可以看到许多云存储和备份公司都会提供一个名为无限制存储的促销方式来推荐其其存储功能——但大多数时候,这个可能都不会是真正无限的。因为如果你囤积了太多内容,可能你自己就开始对你的内容大小作出限制了,也正因此大多数用户其实永远都不会需要所谓的“无限”多的存储空间。

他录制了两百万GB色情视频,只是为了测试云存储是否真的“无限”

近日,Reddit用户beaston02产生了一个想法,他想去找到亚马逊云“无限”存储计划的真正上限。当时,他决定用1PB色情片来测试它的极限。而事实上在之后的6月份亚马逊云关闭了“无限”存储计划,也正因此有些人认为亚马逊的这一决定可能与 beaston02的这一做法有关 ,但他否认这个谣言。我们必须说明一点,1PB=1百万GB。

为了收集这些数据,beaston02写了脚本,记录了来自CamSoda、Chaturbate和MyFreeCams等各种成人视频直播网站的内容。

“这几乎完全是色情的,”他在一封Reddit消息中告诉我。“自从我接触电脑以来,我发现自己学习了更多,而且对那些感兴趣的东西会学的非常快,甚至有时会让我疯狂,但是我相信,相较而言女人比互联网上的大多数其他东西都让我更感兴趣,并且它每天都有大量的数据被上传,所以很适合我的这个项目。”

他说,他花了五六个月的时间来收集这1PB的色情片,当他收集了1.8 PB的色情片后,他害羞的停下了。

这1.8PB的色情片大约可以在高清电视上播放 23.4年,当然,网络摄像头的质量可能远远不及高清电视的。一个大家都比较熟悉的换算方式:720P是每小时大约2g,所以这大概需要90万小时,那就是大概102年的时间。如果视频质量更低,比如说480p,大概是每小时0.7g,这个数字就变成了293年6个月。

他录制了两百万GB色情视频,只是为了测试云存储是否真的“无限”

Beaston02告诉我们,他之所以停止收集,是因为他的兴趣减弱了。他说:“我知道很多人将我标记成了一个大变态或者是一个色情狂,但这真的不是我的一切。” “我收集或者说是囤积数据的原因才是我的主要目的,而色情只是出于兴趣。” 他说他用这一方式来学习Python、SQL数据库以及如何处理这么多数据。

这个项目现在完成了,我得到了我所希望得到的知识,而且我也没有什么兴趣了。

不再运行收集色情内容的脚本时,他将其放到了Github上。另一位Redditor —Archivist对这个“PB色情项目”产生了兴趣,并且做了一件引起广泛的关注事—招募其他收集者,帮助他们每天继续收集那些色情直播网站的视频。Archivist在一封Reddit消息中告诉我们,现在每天都会有超过12TB的视频存储在亚马逊的云端,并在Google云端上进行了备份。亚马逊目前并没有对此作出回应。

录制直播流并下载后续观看在技术上是合法的,但在道德上是有问题的。因为这些直播往往需要付费,但是录制之后则就是免费的了,对于那些直播的人来说可能是侵权的。

我们采访了Charon Hart,她是CamSoda上的一个表演者,对于在她不知情的情况下录制直播的人。她说:“如果只是我的话可能是无所谓的,但是我认为如果是所有人,那么整件事情可能就是需要获得许可的” 她表示,有些女性之所以使用现场直播,是因为这样会让他们的身份比上传到网站上的静态视频显得更加安全,因为那样可以重复观看。当然对于她而言,她觉得这样做可以让她的作品更为广泛的传播,也可以是很好的广告,但应该是让观众专门来看她的表演,而不是去下一个免费的视频。

她的一些观众在观看时也会去录制下载她的节目,但总是会得到她的同意,通常的情况就是,如果他们捕捉到一个很好的GIF,他们会与她分享,这样她可以很好的去推广自己。

Hart说:“这就是为什么我们要求人们支付一定酬劳来给我们的色情内容,因为现在不是去为公司服务,而是更多的为自己,”Hart说。“有些家伙试图免费获得这个这一切,我觉得可能让我受到了伤害,我已经放弃了这么多的工作,而我们之所以选择这份工作,就是希望人们在得到满足之后支付我们一些酬劳,因此,我想我们应该去寻求得到一些补偿。”

Beaston02表示,尽管人们要求他添加记录私人表演或具有地理位置要求的功能 ,这个功能实际上只能由表演者或网站指定的地质区域内的人员查看 但他拒绝了。“我们每个人都有不同的地方,我们在道德上都应该有一条底线,而现在这恰恰是我的底线。”他说。“虽然我对以后捕获的内容无法控制,但我能保证我曾经用脚本收集的内容绝不会在网站上共享或出售。”




原文发布时间为:2017年8月28日
本文作者:鲁班七号
本文来自云栖社区合作伙伴嘶吼,了解相关信息可以关注嘶吼网站。
上一篇:Shell在大数据时代的魅力:从一道百度大数据面试题想到的点滴


下一篇:机器学习(PAI)接入DataWorks