---恢复内容开始---
作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753
作业要求:
1.列表,元组,字典,集合分别如何增删改查及遍历。
cm = ['Manry','kimi','tony','张三'] cm.append('在末尾增加一个字符') cm cm = ['Manry','kimi','tony','张三'] cm.insert(1,'在指定位置增加一个字符') cm
运行结果:
cm = ['Manry','kimi','tony','张三','删除最后一个字符'] cm.pop() cm cm = ['Manry','kimi','tony','张三','删除指定字符'] cm.pop(1) cm
运行结果:
cm = ['Manry','kimi','tony','张三'] cm[1]=('修改指定位置字符') cm
运行结果:
cm = ['Manry','kimi','tony','张三','34','Tom','Jary'] print(cm[1])#查找下标为1的字符 print(cm[-1])#查找最后一位字符 print(cm[1:2])#查找下标为1和2之间的字符 print(cm[3:])#查找下标为3及之后的字符 print(cm[:2])#查找下标为2之前的字符 print(cm[:6:2])#查找下标为6之前每隔2位的字符 print(cm[:])#查找所有字符
运行结果:
cm = ['Manry','kimi','tony','张三','34','Tom','Jary'] print(len(cm)) for cm1 in cm: print(cm1)
运行结果:
增
删
改
查
遍历
2.总结列表,元组,字典,集合的联系与区别。参考以下几个方面:
- 括号
- 有序无序
- 可变不可变
- 重复不可重复
- 存储与查找方式
3.词频统计
1.下载一长篇小说,存成utf-8编码的文本文件 file
2.通过文件读取字符串 str
-
3.对文本进行预处理
4.分解提取单词 list
5.单词计数字典 set , dict
6.按词频排序 list.sort(key=lambda),turple
7.排除语法型词汇,代词、冠词、连词等无语义词
- 自定义停用词表
- 或用stops.txt
8.输出TOP(20)
9.可视化:词云
排序好的单词列表word保存成csv文件
import pandas as pd pd.DataFrame(data=word).to_csv('big.csv',encoding='utf-8')
线上工具生成词云: https://wordart.com/create
作业博客要求:
- 文字作业要求言简意骇,用自己的话说明清楚。
- 编码作业要求放上代码,加好注释,并附上运行结果截图。
---恢复内容结束---
作业来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE1/homework/2753
作业要求:
1.列表,元组,字典,集合分别如何增删改查及遍历。
cm = ['Manry','kimi','tony','张三'] cm.append('在末尾增加一个字符') cm cm = ['Manry','kimi','tony','张三'] cm.insert(1,'在指定位置增加一个字符') cm
运行结果:
cm = ['Manry','kimi','tony','张三','删除最后一个字符'] cm.pop() cm cm = ['Manry','kimi','tony','张三','删除指定字符'] cm.pop(1) cm
运行结果:
cm = ['Manry','kimi','tony','张三'] cm[1]=('修改指定位置字符') cm
运行结果:
cm = ['Manry','kimi','tony','张三','34','Tom','Jary'] print(cm[1])#查找下标为1的字符 print(cm[-1])#查找最后一位字符 print(cm[1:2])#查找下标为1和2之间的字符 print(cm[3:])#查找下标为3及之后的字符 print(cm[:2])#查找下标为2之前的字符 print(cm[:6:2])#查找下标为6之前每隔2位的字符 print(cm[:])#查找所有字符
运行结果:
cm = ['Manry','kimi','tony','张三','34','Tom','Jary'] print(len(cm)) for cm1 in cm: print(cm1)
运行结果:
增
删
改
查
遍历
2.总结列表,元组,字典,集合的联系与区别。参考以下几个方面:
- 括号
- 有序无序
- 可变不可变
- 重复不可重复
- 存储与查找方式
3.词频统计
1.下载一长篇小说,存成utf-8编码的文本文件 file
2.通过文件读取字符串 str
-
3.对文本进行预处理
4.分解提取单词 list
5.单词计数字典 set , dict
6.按词频排序 list.sort(key=lambda),turple
7.排除语法型词汇,代词、冠词、连词等无语义词
- 自定义停用词表
- 或用stops.txt
8.输出TOP(20)
9.可视化:词云
排序好的单词列表word保存成csv文件
import pandas as pd pd.DataFrame(data=word).to_csv('big.csv',encoding='utf-8')
线上工具生成词云: https://wordart.com/create
作业博客要求:
- 文字作业要求言简意骇,用自己的话说明清楚。
- 编码作业要求放上代码,加好注释,并附上运行结果截图。