川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

以下文章源于萝卜大杂烩

作者:周萝卜

Python爬虫、数据分析、网站开发等案例教程视频免费在线观看

https://space.bilibili.com/523606542

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

数据简单处理

数据数据纽约时报,由于正常情况下我们无法访问该网站,所以数据的提取过程就不展示了,总之我们得到了一份如下数据,由于某些空值和重复值,我们进行简单的处理
纽约时报数据

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

import pandas as pd
df = pd.read_csv('trump.csv')
df.drop_duplicates(inplace=True)
df.fillna('unkown',inplace=True)
df['date']=pd.to_datetime(df['date'])
df['year'] = df['date'].dt.year

我们最终得到的数据如下

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

数据分析

被攻击最多

首先我们看下,是谁被川神攻击的最多

from pyecharts.charts import Bar,Map,Line,Page,Scatter
from pyecharts import options as opts
from pyecharts.globals import SymbolType,ThemeType
from pyecharts.charts import Grid

result = df['target'].value_counts()[:10].sort_values()
x_data = result.index.tolist()
y_data = result.values.tolist()

b = (Bar()
     .add_xaxis(x_data)
     .add_yaxis('',y_data)
     .set_global_opts(title_opts = opts.TitleOpts(title='被侮辱次数前十'))
     .set_series_opts(label_opts=opts.LabelOpts(is_show=True,position='right'))
     .reversal_axis()
)
grid = Grid(init_opts=opts.InitOpts(theme=ThemeType.VINTAGE))
grid.add(b, grid_opts=opts.GridOpts(pos_left="20%"))
grid.render_notebook()

 

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

可以看到,the-media是被攻击最多的,当然了,这有可能是媒体的统称,毕竟川神的攻击,可都是无差异攻击啊

而高居第二的就是*dang,嗯,攻击zhengdi是提升自己的最好方式!

当然榜单里也少不了Joe Biden呀,绝对的“生死”对头

媒体情况

作为被diss最多的第三方,我们来看看media的情况
不同年份,川神diss的情况

result = df[df['target'] == 'the-media']
result1 = result.groupby('year').year.count()
x_data = result1.index.tolist()
y_data = result1.values.tolist()

b = (
    Bar(init_opts=opts.InitOpts(theme=ThemeType.VINTAGE))
    .add_xaxis(xaxis_data=x_data)
    .add_yaxis(
        '',
        y_data,
        label_opts=opts.LabelOpts(is_show=True),
    )
    .set_global_opts(title_opts = opts.TitleOpts(title='侮辱the-media推特数量的变化'))

)
b.render_notebook()

 

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

可以看到2019年和2020年是川神疯狂diss the media的时候,真的是怼天怼地啊尤其是2019年,竟然有361次,这是每天怼一次也不为过啊

再来看看怼媒体的时候,都用了某种侮辱

from wordcloud import WordCloud,STOPWORDS
import matplotlib.pyplot as plt
from imageio import imread

# result = df[df['target'] == 'the-media']
media_text = " ".join(df[df.target=="the-media"].insult)
mask = imread('1.jpg')
wordcloud = WordCloud(background_color = 'white',mask=mask,width=1200,height=1200).generate(media_text)
plt.figure(figsize=(16,8))
plt.imshow(wordcloud)
plt.axis("off")
plt.show()

 

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

再来看看怼Joe Biden的情况

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

每年侮辱推特数量

接下来是每年侮辱性推特的发布数量

result1 = df.groupby('year').year.count()
x_data = result1.index.tolist()
y_data = result1.values.tolist()

b = (
    Bar(init_opts=opts.InitOpts(theme=ThemeType.VINTAGE))
    .add_xaxis(xaxis_data=x_data)
    .add_yaxis(
        '',
        y_data,
        label_opts=opts.LabelOpts(is_show=True),
    )
    .set_global_opts(title_opts = opts.TitleOpts(title='侮辱推特数量的变化'))

)
b.render_notebook()

 

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

真的是勤奋啊,一年发了上千的欺诈性推特,尤其是近两年时间,都发了两千多推特,真的是推特治国呀!

每天发推特数量

发推特数量日期前前十

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

数量最多的一天,发了45条,真是疯狂啊,这是把推特当成笔记来用了吗?

再来看下发推特数量前三中,分别都是diss某种

2020-10-12

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

Joe Biden绝对是被针对的第一人,一天骂了14次,哈哈哈

2020-10-07

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

2020-09-02

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

此处,求Joe Biden的心理阴影面积

最后我们再看几个词云,看看川神的癖好

diss目标词云

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

diss用语词云

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

 

diss Joe Biden用语词云

川建国用推特攻击了谁?咱们用Python分析一下,可视化显示数据

上一篇:数据分析


下一篇:数据可视化 - 3D柱状图堆叠效果