数据分析第三次作业)
第一题
1、创建一个Series对象
score = pd.Series(data=[90,95,85,78,np.NAN,96,94,np.NAN,80,87,86,83],index=range(1,13),name='score')
score.index.name = "class"
score
输出结果
class
1 90.0
2 95.0
3 85.0
4 78.0
5 NaN
6 96.0
7 94.0
8 NaN
9 80.0
10 87.0
11 86.0
12 83.0
Name: score, dtype: float64
2、查看1-5班的成绩
score[:5]
输出结果
class
1 90.0
2 95.0
3 85.0
4 78.0
5 NaN
Name: score, dtype: float64
3、查看哪个班级的成绩没有录入
a = score[score.isnull()]
a
输出结果
class
5 NaN
8 NaN
Name: score, dtype: float64
4、获取11班的成绩
score[11]
输出结果
86.0
5、在每个人的成绩加5分
a = score + 5
a
输出结果
class
1 95.0
2 100.0
3 90.0
4 83.0
5 NaN
6 101.0
7 99.0
8 NaN
9 85.0
10 92.0
11 91.0
12 88.0
Name: score, dtype: float64
6、找出成绩在90分以上的班级
a = score[score>90]
a
输出结果
class
2 95.0
6 96.0
7 94.0
Name: score, dtype: float64
第二题
1、创建一个DataFrame
data = {
"姓名":['张三','李四','王五','小明','小红','小刚','小亮'],
"语文":[89,78,79,89,90,87,83],
"数学":[59,83,85,92,67,81,77],
"英语":[84,97,88,83,67,73,71],
"体育":[0,0,0,0,0,0,0]
}
df = pd.DataFrame(data)
df
输出结果
姓名 语文 数学 英语 体育
0 张三 89 59 84 0
1 李四 78 83 97 0
2 王五 79 85 88 0
3 小明 89 92 83 0
4 小红 90 67 67 0
5 小刚 87 81 73 0
6 小亮 83 77 71 0
2、进行转置
data = {
"姓名":['张三','李四','王五','小明','小红','小刚','小亮'],
"语文":[89,78,79,89,90,87,83],
"数学":[59,83,85,92,67,81,77],
"英语":[84,97,88,83,67,73,71],
"体育":[0,0,0,0,0,0,0]
}
df = pd.DataFrame(data)
df
df.T
输出结果.
姓名 语文 数学 英语 体育
0 张三 89 59 84 0
1 李四 78 83 97 0
2 王五 79 85 88 0
3 小明 89 92 83 0
4 小红 90 67 67 0
5 小刚 87 81 73 0
6 小亮 83 77 71 0
0 1 2 3 4 5 6
0 1 2 3 4 5 6
姓名 张三 李四 王五 小明 小红 小刚 小亮
语文 89 78 79 89 90 87 83
数学 59 83 85 92 67 81 77
英语 84 97 88 83 67 73 71
体育 0 0 0 0 0 0 0
3、删除掉体育成绩
del(df['体育'])
df
输出结果
姓名 语文 数学 英语
0 张三 89 59 84
1 李四 78 83 97
2 王五 79 85 88
3 小明 89 92 83
4 小红 90 67 67
5 小刚 87 81 73
6 小亮 83 77 71
4、添加‘综合’这个课程的成绩 (成绩自定义)
df['综合'] = [70,75,90,85,68,95,80]
df
输出结果
姓名 语文 数学 英语 体育 综合
0 张三 89 59 84 0 70
1 李四 78 83 97 0 75
2 王五 79 85 88 0 90
3 小明 89 92 83 0 85
4 小红 90 67 67 0 68
5 小刚 87 81 73 0 95
6 小亮 83 77 71 0 80