分析excel硕士序列数据提示词——包含对特征的筛选,非0值的过滤

文章目录

  • 1 分析出发点
  • 2 围绕出发点的文件分析
  • 3 功能模块
    • 计算重心
    • 相关性计算
    • 教学倾向百分比
  • 多列相关性计算
  • 结果封装
  • 证伪——过滤0后的交叉相关系数
  • 封装和总控——批量处理
  • 特征筛选——筛选提问倾向最大和最小的前五
      • 代码
  • 总的清洗

1 分析出发点

写一个python代码,遍历"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\文科优质"下所有excel文件,计算每个excel的行为类别列和教学倾向列这两列的交叉相关系数,新建一个excel存入文件名作为一列,后面一列是行为倾向交叉系数列,存入对应的系数
以下是完整的 Python 代码,包含了遍历文件夹、收集所有 Excel 文件的绝对路径、并将其写入到一个新的 Excel 文件中,所有文件路径从第一行开始写入:

import os
import pandas as pd

# 设置文件夹路径和输出文件路径
folder_path = r"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\文科优质"
output_file = r"D:\BaiduSyncdisk\硕士毕业相关\毕业论文数据\文科优质结果.xlsx"

# 收集所有 Excel 文件的详细信息
data = []
for root, dirs, files in os.walk(folder_path):
    for file in files:
        if file.lower().endswith(('.xlsx', '.xls')):
            full_path = os.path.join(root, f
上一篇:UI自动化概念+Web自动化测试框架


下一篇:linux 磁盘管理