# 生成numpy数组的方法array() array()生成的是二维数组,非常方便统计
1 import csv 2 3 import numpy 4 5 # arr1 = numpy.zeros(5) 6 # 7 # arr2 = numpy.zeros([5,3],dtype=int) 8 # 9 # print(arr1) 10 # print(arr1) 11 12 # 生成numpy数组的方法array() array()生成的是二维数组,非常方便统计 13 import pandas as pandas 14 15 arr6 = numpy.array([[‘zhang‘,22,172],[‘li‘,‘23‘,175],[‘xi‘,25,173]]) #输出一个三行三列的数组 16 17 print(arr6)
1 [[‘zhang‘ ‘22‘ ‘172‘] 2 [‘li‘ ‘23‘ ‘175‘] 3 [‘xi‘ ‘25‘ ‘173‘]]
# 生成numpy数组的方法arange() 参数为开始位置,结束位置,步长
1 # 生成numpy数组的方法arange() 参数为开始位置,结束位置,步长 2 3 arr3 = numpy.arange(6) 4 5 arr4 = numpy.arange(2,8.1,0.5) #arange的操作对象不包括结束位置 6 7 print(arr3) 8 9 print(arr4)
1 [0 1 2 3 4 5] 2 [2. 2.5 3. 3.5 4. 4.5 5. 5.5 6. 6.5 7. 7.5 8. ]
# 生成numpy数组的方法linspace() 参数为开始位置,结束位置,输出元素个数 endpoint=False表示不包括结束值本身
1 # 生成numpy数组的方法linspace() 参数为开始位置,结束位置,输出元素个数 endpoint=False表示不包括结束值本身 2 arr5= numpy.linspace(0,10,11,endpoint=False) 3 4 print(arr5)
1 [0. 0.90909091 1.81818182 2.72727273 3.63636364 4.54545455 2 5.45454545 6.36363636 7.27272727 8.18181818 9.09090909]
# pandas使用,根据二维数组,DataFrame()输出dataframe
1 arr6 = numpy.array([[‘zhang‘,22,172],[‘li‘,‘23‘,175],[‘xi‘,25,173]]) #输出一个三行三列的数组
2 df = pandas.DataFrame(arr6,index=[1,2,3],columns=[‘name‘,‘old‘,‘height‘]) #参数分别为输入二维数组,index设置行编号,默认为1,2,3.。。column设置列名
1 arr7 = {‘name‘:[‘zhang‘,‘li‘,‘xi‘],‘old‘:[22,23,25],‘height‘:[172,174,173]} #也能根据字典类型数据创建dataframe
2 df2 = pandas.DataFrame(arr7,index=[1,2,3],columns=[‘name‘,‘old‘,‘height‘]) #参数分别为输入二维数组,index设置行编号,默认为1,2,3.。。column设置列名
# 第三种方法是直接从CSV文件创建
1 # 第三种方法是直接从CSV文件创建 2 with open(‘test_dataframe.csv‘,‘w‘,encoding="utf-8",newline=‘‘) as wd: 3 wcsv = csv.writer(wd) 4 5 wcsv.writerow([‘name‘,‘old‘,‘height‘]) 6 i = 3 7 for x in range(i): 8 wcsv.writerow(["zhang",‘22‘,‘172‘]) 9 wd.close() 10 11 12 df3 = pandas.read_csv(‘test_dataframe.csv‘) #直接从CSV文件scdataframe
按指定格式输出dataframe
1 df3.index = [1,2,3] #指定index输出 2 3 df3[‘address‘] = [‘shengzhen‘,‘nanjing‘,‘shanghai‘] #添加一列输出 4 5 print(df3.loc[1]) #read_csv对象可以只输出某一行的值 6 7 print(df3.name) #单独输出某一列的值