可视化绘图前提,Numpy和Pandas

# 生成numpy数组的方法array() array()生成的是二维数组,非常方便统计

 1 import csv
 2 
 3 import numpy
 4 
 5 # arr1 = numpy.zeros(5)
 6 #
 7 # arr2 = numpy.zeros([5,3],dtype=int)
 8 #
 9 # print(arr1)
10 # print(arr1)
11 
12 # 生成numpy数组的方法array() array()生成的是二维数组,非常方便统计
13 import pandas as pandas
14 
15 arr6 = numpy.array([[zhang,22,172],[li,23,175],[xi,25,173]])        #输出一个三行三列的数组
16 
17 print(arr6)

1 [[zhang 22 172]
2  [li 23 175]
3  [xi 25 173]]


# 生成numpy数组的方法arange() 参数为开始位置,结束位置,步长

1 # 生成numpy数组的方法arange()  参数为开始位置,结束位置,步长
2 
3 arr3 = numpy.arange(6)
4 
5 arr4 = numpy.arange(2,8.1,0.5)      #arange的操作对象不包括结束位置
6 
7 print(arr3)
8 
9 print(arr4)
1 [0 1 2 3 4 5]
2 [2.  2.5 3.  3.5 4.  4.5 5.  5.5 6.  6.5 7.  7.5 8. ]

# 生成numpy数组的方法linspace() 参数为开始位置,结束位置,输出元素个数 endpoint=False表示不包括结束值本身

1 # 生成numpy数组的方法linspace()        参数为开始位置,结束位置,输出元素个数 endpoint=False表示不包括结束值本身
2 arr5= numpy.linspace(0,10,11,endpoint=False)
3 
4 print(arr5)
1 [0.         0.90909091 1.81818182 2.72727273 3.63636364 4.54545455
2  5.45454545 6.36363636 7.27272727 8.18181818 9.09090909]

# pandas使用,根据二维数组,DataFrame()输出dataframe

1 arr6 = numpy.array([[zhang,22,172],[li,23,175],[xi,25,173]])        #输出一个三行三列的数组

2 df = pandas.DataFrame(arr6,index=[1,2,3],columns=[‘name‘,‘old‘,‘height‘])       #参数分别为输入二维数组,index设置行编号,默认为1,2,3.。。column设置列名
 
1 arr7 = {name:[zhang,li,xi],old:[22,23,25],height:[172,174,173]}     #也能根据字典类型数据创建dataframe

2
df2 = pandas.DataFrame(arr7,index=[1,2,3],columns=[‘name‘,‘old‘,‘height‘]) #参数分别为输入二维数组,index设置行编号,默认为1,2,3.。。column设置列名

# 第三种方法是直接从CSV文件创建

 1 # 第三种方法是直接从CSV文件创建
 2 with open(test_dataframe.csv,w,encoding="utf-8",newline=‘‘) as wd:
 3     wcsv = csv.writer(wd)
 4 
 5     wcsv.writerow([name,old,height])
 6     i = 3
 7     for x in range(i):
 8         wcsv.writerow(["zhang",22,172])
 9     wd.close()
10 
11 
12 df3 = pandas.read_csv(test_dataframe.csv)         #直接从CSV文件scdataframe

按指定格式输出dataframe

1 df3.index = [1,2,3] #指定index输出
2 
3 df3[address] = [shengzhen,nanjing,shanghai]     #添加一列输出
4 
5 print(df3.loc[1])   #read_csv对象可以只输出某一行的值
6 
7 print(df3.name)     #单独输出某一列的值

 

可视化绘图前提,Numpy和Pandas

上一篇:auth.log大量出现pam_unix(cron:session): session opened for user root by (uid=0)解决办法


下一篇:Ubuntu(14.04LTS)学习札记