出于某些原因,不能使用eveything这个软件,但是这个软件的功能是真挺好用的,免去了在文件海洋中寻找;
搜索模块
import os import re import subprocess import time ''' 获取盘符列表,返回元组,元组第一个元素为bool值,表示函数成功与否,第二个值表示原因(失败的情况,字符串形式)或结果(成功的情况,列表形式) ''' def get_DriveLetter(): result_str = subprocess.run('''powershell $my_path = $env:temp + '\Get-Volume.txt';(Get-Volume).DriveLetter |Out-File -Encoding utf8 $my_path''') if result_str.returncode == 0: env_temp_path_str = os.environ['TEMP'] + r'\Get-Volume.txt' with open(env_temp_path_str,'r',encoding='utf-8_sig')as fd: result = fd.read().splitlines() return (True,result) else: return (False,"cmd_Fail") ''' 初始目录initial_path已被记录,本次不记录 因为重复的文件名或目录名,并且要考虑到以后有拓展信息字段的需求,所以数据形状设计为这样:{'name':[['path1','other'],['path2','other'],]} 规定,初始目录字符串结尾必须带\ ''' def get_fileList(all_file_dict,initial_path): if os.path.isdir(initial_path): #部分目录不允许访问,不过这部分目录也不在我的需求范围内。 try: child_file_list = os.listdir(initial_path) except: #print(initial_path) return for i in child_file_list: if i in all_file_dict.keys(): all_file_dict[i].append([initial_path,]) else: all_file_dict[i] = [[initial_path,],] new_path_str = initial_path + i + '\\' if os.path.isdir(new_path_str): get_fileList(all_file_dict,new_path_str) ''' 将结果字典格式化输出到文件中存储。 输出到用户家目录下存放,名称叫eveything_data.data ''' def Formatted_output(all_file_dict): out_file_path_str = os.environ['USERPROFILE'] + 'eveything_data.data' with open(out_file_path_str,'w',encoding='utf-8')as fd: for key,value in all_file_dict.items(): for value_i in value: line_str = key for value_i_i in value_i: line_str += "\t{}".format(value_i_i) fd.write(line_str + '\n') ''' 直接输出 输出到用户家目录下存放,名称叫eveything_data.data ''' def Direct_output(all_file_dict): out_file_path_str = os.environ['USERPROFILE'] + 'eveything_data.data' with open(out_file_path_str,'w',encoding='utf-8')as fd: print(all_file_dict,file=fd) ''' 主控函数 ''' def main(): start_time = time.time() result = get_DriveLetter() all_file_dict = {} if result[0]: for i in result[1]: get_fileList(all_file_dict = all_file_dict,initial_path = '{}:\\'.format(i)) Formatted_output(all_file_dict) #Direct_output(all_file_dict) #end_time = time.time() #print("扫描花费时间:{}".format(end_time-start_time)) return all_file_dict if __name__ == '__main__': main()
人机交互模块
import 扫描模块 as saomiao import re import time import threading import os ''' 读取csv格式的数据文件(以制表符为分隔符的文件) ''' def get_data_csv(filepath_str): with open(filepath_str,'r',encoding= 'utf-8-sig') as fd: lines_list= fd.read().splitlines() lines_list_ = [i.split('\t') for i in lines_list] return lines_list_ ''' 从扫描模块中直接获取其运行结果数据,这里会比较慢,大概在5-10分钟才能获取到结果 ''' def get_data_dict(data): data = saomiao.main() #检验是否含有中文字符 def is_contains_chinese(strs): for _char in strs: if '\u4e00' <= _char <= '\u9fa5': return True return False #计算字符串中中文字符个数 def count_chinese_num(strs): ret_num = 0 for _char in strs: if '\u4e00' <= _char <= '\u9fa5': ret_num +=1 return ret_num ''' 计算字符串中的非英文字符个数; 不咋个完美,字符问题真他妈头大,有些非英文字符只占用一个字节,有些又占用两个,喵了个咪的! ''' def count_notASCII_num(strs): return int((len(strs.encode()) - len(strs))/2) ''' 专门美化输出的函数 参数是列表类型 原本还计划着说根据命令行窗口大小来进行省略超长部分,但是我本就是查询路径信息,省略了我如何看呢,所以便不进行此操作 ''' def beautify_output(data_result): #查询出最长的文件名长度 name_Maxlen =0 for i in data_result: if len(i[0]) > name_Maxlen: name_Maxlen = len(i[0]) #获取命令行的高 terminal_high = os.get_terminal_size()[1] #输出 num_line = 0 #记录输出的行数 for i in data_result: #目前只有两列信息,名称和路径,后续需要的话再加即可 print("{}{} | {}".format(i[0] , ' ' * (name_Maxlen - len(i[0]) - count_notASCII_num(i[0])),i[1])) num_line += 1 if num_line % (terminal_high - 1) == 0: print("按下字母q结束输出,按其他键继续输出下一页:",end='') in_str = input() if in_str == 'Q' or in_str == 'q': break print("总计{}个结果!".format(len(data_result))) print("输出完毕!\n\n") ''' 处理用户输入和系统的提示性输出的 ''' def Human_computer_interaction(): print('请输入:') regex_str = input() return regex_str ''' 查询函数 ''' def find_match(data,regex_str): result_list = [] for i in data: result_regex = re.findall(regex_str,i[0]) if len(result_regex) != 0: result_list.append(i) return result_list def main(): #程序刚运行时使用之前扫描的格式化输出结果文件 data_file_path_str = r'C:\Users\Administratoreveything_data_old.data' data = get_data_csv(data_file_path_str) threading_Operating_condition = '' #子线程运行情况 while True: #只有在线程结束时才运行 if threading_Operating_condition == '' or threading_Operating_condition.is_alive() == False: threading_Operating_condition = threading.Thread(target = saomiao.main) threading_Operating_condition.start() if threading_Operating_condition != '': #不为空的时候说明不是刚读取过数据文件,这是可以重新读取数据文件以获取最新的情况 data = get_data_csv(data_file_path_str) user_in_str = Human_computer_interaction() result_list = find_match(data = data,regex_str = user_in_str) beautify_output(result_list) if __name__ == '__main__': main()
我很尽力的去做对齐了,但是这个超出了我能力范围,字符真是个好垃圾!
运行结果大概呈现 这样: