数据分析案例_电子游戏的销售情况
1.引入需要的库。
import pandas as pd#辅助数据分析。
import numpy as np#科学计算库。
import matplotlib.pyplot as plt#绘图。
2.导入数据。(数据来源–GregorySmith在kaggle上传的数据。)
game_list = pd.read_csv("vgsales.csv")
game_list.head()
jupyter反馈内容(jupyter下载:pip install jupyter (-i 各种源都行)
Rank Name Platform Year Genre Publisher NA_Sales EU_Sales JP_Sales Other_Sales Global_Sales
0 1 Wii Sports Wii 2006.0 Sports Nintendo 41.49 29.02 3.77 8.46 82.74
1 2 Super Mario Bros. NES 1985.0 Platform Nintendo 29.08 3.58 6.81 0.77 40.24
2 3 Mario Kart Wii Wii 2008.0 Racing Nintendo 15.85 12.88 3.79 3.31 35.82
3 4 Wii Sports Resort Wii 2009.0 Sports Nintendo 15.75 11.01 3.28 2.96 33.00
4 5 Pokemon Red/Pokemon Blue GB 1996.0 Role-Playing Nintendo 11.27 8.89 10.22 1.00 31.37
3.分析需求。
3.1分析:根据年代不同电子游戏的销量情况。
year_list = game_list.groupby(['Year']).count()#以年来分组。
year_list.head()
Rank Name Platform Genre Publisher NA_Sales EU_Sales JP_Sales Other_Sales Global_Sales
Year
1980.0 9 9 9 9 9 9 9 9 9 9
1981.0 46 46 46 46 46 46 46 46 46 46
1982.0 36 36 36 36 36 36 36 36 36 36
1983.0 17 17 17 17 17 17 17 17 17 17
1984.0 14 14 14 14 14 14 14 14 14 14
year_sale = year_list["NA_Sales"] + year_list["EU_Sales"] +year_list["JP_Sales"] + year_list["Other_Sales"] + year_list["Global_Sales"] #汇总各地区销售额。
year_sale
Year
1980.0 45
1981.0 230
1982.0 180
1983.0 85
1984.0 70
1985.0 70
1986.0 105
1987.0 80
1988.0 75
1989.0 85
1990.0 80
1991.0 205
1992.0 215
1993.0 300
1994.0 605
1995.0 1095
1996.0 1315
1997.0 1445
1998.0 1895
1999.0 1690
2000.0 1745
2001.0 2410
2002.0 4145
2003.0 3875
2004.0 3815
2005.0 4705
2006.0 5040
2007.0 6010
2008.0 7140
2009.0 7155
2010.0 6295
2011.0 5695
2012.0 3285
2013.0 2730
2014.0 2910
2015.0 3070
2016.0 1720
2017.0 15
2020.0 5
dtype: int64
year_sale.plot(figsize = (20,8))
plt.show()
3.2分析:根据游戏平台不同电子游戏的销量情况。
platform_list = game_list.groupby("Platform").count()
platform_sale = platform_list["NA_Sales"] + platform_list["EU_Sales"] + platform_list["JP_Sales"] + platform_list["Other_Sales"]
platform_sale.plot(kind = 'bar', figsize = (20,8))
3.3分析:根据游戏类型不同电子游戏的销量情况。
genre_list = game_list.groupby("Ganre").count()
gener_sale = genre_list["NA_Sales"] + genre_list["EU_Sales"] + genre_list["JP_Sales"] + genre_list["Other_Sales"] + genre_list["Global_Sales"]
gener_sale.plot(kind = 'bar', figsize = (20,8))