班主任with python: 绿码和行程码收集处理

防疫工作感觉一时半会儿还停不下来,为了避免下次还要收集类似的材料,记录一下这个WorkFlow, 有python 环境的班主任朋友也可以直接使用。

背景:

学生返校要求收集学生的绿码、父母双方的绿码、父母双方的行程码,并且统一重命名后分成两个文件夹上交:绿码(孩子姓名、孩子姓名+爸爸/妈妈)、行程码(孩子姓名+爸爸/妈妈)。

WorkFlow:

  1. 生成问卷星问卷发到群里作为群代办(模板ID:107344712)
    题目设置第一题为全班孩子的姓名,这样比较容易查看未提交的名单并在群里疯狂@
  2. 确认全员提交之后在问卷星的统计后台逐一确认数据合格(标准:图片上传正确、是否有离深离粤等情况),个别不合格的要求重新上传
  3. 批量下载附件以及按文本下载问卷EXCEL
  4. 运行处理脚本

脚本基本逻辑:

  1. 利用excel 获取序号及学生名字的对应关系
  2. 如有重复记录的情况仅保留最后一次的上传结果
  3. 将文件重命名后移动至对应的文件夹

脚本代码:

import os
import pandas as pd
import shutil

def changeNameAndMove(filename):
    filenameSplited = filename.split('_')
    numInFile = int(filenameSplited[0][2:])
    if (any(corrFile['number'] == numInFile)):
        name = ''.join(corrFile[corrFile['number'] == numInFile]['name'])
        suffix = os.path.splitext(filename)[-1]
    
        fileCategory = filenameSplited[1]
        if fileCategory == '2':
            desPath = pathStatus
            newName = name
        elif fileCategory == '3':
            desPath = pathStatus
            newName = name + '爸爸'
        elif fileCategory == '4':
            desPath = pathStatus
            newName = name + '妈妈'
        elif fileCategory == '5':
            desPath = pathTravel
            newName = name + '爸爸'
        elif fileCategory == '6':
            desPath = pathTravel   
            newName = name+'妈妈'
        
        newName = newName+suffix
        print("name: " + name + " Cat: "+ fileCategory + " newPath: " + desPath + newName)
        os.rename(os.path.join(pathOriginal,filename),newName)
        shutil.move(newName,desPath)


# Define paths
pathOriginal = "E:\\tmp\\"
pathDes = "E:\\HealthCapture\\"
# Load serial number and correlated name
corrFile = pd.read_excel(r"E:\\107344712_filelist.xlsx")

# Change workDir and setup
pathStatus = pathDes + "Status\\"
pathTravel = pathDes + "Travel\\"
fileList = os.listdir(pathOriginal)
os.chdir(pathOriginal)

# Delete duplicated uploads
corrFile['孩子姓名'][corrFile['孩子姓名'].duplicated()]
corrFile = corrFile[['序号','孩子姓名']]
corrFile = corrFile.drop_duplicates(subset ='孩子姓名',keep = 'last').rename(columns = {'序号':'number','孩子姓名':'name'})

fileList = os.listdir(pathOriginal)
for filename in fileList:
    if filename.endswith('.jpeg'):
        changeNameAndMove(filename)

理论上应该封装一下的,不过这个东西复用率应该就一学期一次,就不折腾了。这个学期着重弄一下学生的周测小分跟踪,做个稍微可视化的notebook吧。

转业就好久不写代码了,命名规范的细节都想不起来的时候还是有点小感伤。

上一篇:MSSQL 如何导出db所有用户权限创建语句


下一篇:Spring MVC基于浏览器请求的国际化实现