过去的一个周末,社交网络Facebook因为用户数据被第三方API滥用帮助美国大选的事情上了热搜。直到现在,Facebook CEO小扎也没有发出任何官方回应,以及未来该如何更好的保护私人数据。有人认为作为坐拥海量用户数据的网站在获得巨大收益的同时,理应预想到数据被滥用的可能并作出防范措施,在事情发生之后也应该更积极的面对而不是回避。也有人提出犯法的是第三方API, 原罪不在Facebook。
先把这件事情放一边,可以确定的是Facebook拥有大量可供人们浏览的数据,人们可以使用此数据做很多事情。今天我们来了解一下如何使用Facebook Graph API用Python进行数据抓取和分析。
Facebook拥有大量数据供您探索,您可以使用以下数据做很多事情:分析Facebook页面或Facebook群组,将这些数据用于社交网络分析(SNA),为数字营销做数据分析, 甚至收集和保存自己个人项目的数据。
这些视频将向你展示如何做基本的分析,例如:
从Facebook下载数据从json转换为更方便的数据结构
处理Graph API中的日期变量和其他数据
第1课:介绍和了解Graph API
在本视频中,我将向您介绍GRAPH API,我将使用GRAPH API Explorer并向您展示一些示例请求。
第2课:下载并保存Facebook数据
在本视频中,我将向您展示如何从Facebook页面或Facebook群组下载并保存所有数据,并记住某些要点。
第3课:设置和清理数据
在第三课中,我将使用notebook来清理和审计从Facebook获得的数据,并为分析做好准备。
第4课:评论最多的帖子
在第四课中,我将向您展示一种简单的方式,以获得评论最多的帖子。
https://v.qq.com/x/page/s06098fb92o.html
第5课:点赞最多帖子
在这个课程中发生了一些有趣的事情,因为我发现我可以使用API访问了一些已删除的帖子。
https://v.qq.com/x/page/r0609s6vt80.html
第6课:计算词频
在这个视频中,我将向您展示如何数一个组或一个页面中的所有帖子词频。
您也可以在评论中使用相同的功能。
https://v.qq.com/x/page/j0609g7vvhp.html
第7课:按关键字对帖子进行分组
在这个视频中,我会将在页面中具有关键字“free”的帖子进行分组,并计算有多少人拥有这个关键字,以及有多少人没有这个关键字。
分组方式非常有用,我们将在未来的视频中更频繁地使用更多变量。
https://v.qq.com/x/page/f06099j7ats.html
第8课:按日期分组
在本视频中,我们将探索“创建时间”变量,以按照年份,月份或星期几对帖子进行分组。
这可以用来查找发布模式等等。
https://v.qq.com/x/page/e0609puvw9j.html