如下为墨墨的导入要求
很明显,例3的导入方法是最好的;
有道单词导出
选择txt导出后发现文本编码方式为UTF-16 LE 并不能直接用于文本处理 ,shift+ctrl+s 另存为UTF-8即可
观察文本结构可以发现,每个单词前后都有一个空格,使用split(" ")分割每一行后,第2个元素就是单词,这就很好处理了;
附代码
fd = open('1.txt') #待处理文本 fd_w = open('2.txt','w+') #待生成文本 for line in fd.readlines(): #读取每一行 word_all = line.split(" ") #每一行的词以空格划分 if len(word_all)>1 and word_all[1].isalpha(): #len大于1是要去掉一些无用行 isalpha用于判断字符串是否全为英文 fd_w.write(word_all[1]+"\n")#将取出的词添加到待生成文本里 fd.close() fd_w.close()
文本1.txt
1, abbreviations [əˌbri:vɪˈeɪʃn] n. [语] 缩写词,缩略语;[语] 缩写(abbreviation的复数) 2, albeit [ˌɔːlˈbiːɪt] conj. 虽然,尽管 n. (Albeit) (美、英、马)艾乐贝特(人名) 3, alternating ['ɔːltəneɪtɪŋ] adj. 交替的;交互的 v. 使交替;依次(alternate的ing形式) 4, antenna [ænˈtenə] n. [电讯] 天线;[动] 触角,[昆] 触须 n. (Antenna)人名;(法)安泰纳 5, appendix [əˈpendɪks] n. 附录;阑尾;附加物 6, associated [əˈsəʊsieɪtɪd; əˈsəʊʃieɪtɪd] adj. 关联的;联合的 v. 联系(associate的过去式和过去分词) 7, asynchronous [eɪˈsɪŋkrənəs] adj. [电] 异步的;不同时的;不同期的 8, Attenuation [əˌtenjuˈeɪʃn] n. [物] 衰减;变薄;稀释 9, backup [ˈbækʌp] n. 支持;后援;阻塞 adj. 支持的;候补的 vt. 做备份 10, bearer [ˈbeərə(r)] n. 持票人;[建] 承木;[机] 托架;送信人;搬运工人;不记名(债券,股票等) 11, bidirectional [ˌbaɪdəˈrekʃənl; ˌbaɪdaɪˈrekʃənl] adj. 双向的;双向作用的 12, brackets ['brækɪts] n. 支架;括号,圆括号;舱口围板支架(bracket的复数) v. 给…装上托架;把…容纳在内(bracket的三单形式) 13, carriage [ˈkærɪdʒ] n. 运输;运费;四轮马车;举止;客车厢 14, carrier [ˈkæriə(r)] n. [化学] 载体;运送者;带菌者;货架 n. (Carrier)人名;(英)卡里尔;(法)卡里耶 15, ceases n. 停止(cease的复数形式) v. 停止(cease的第三人称单数);终了 16, Cellular adj. (cellular) 细胞的,由细胞组成的;(无线电话)蜂窝状的; 网状的,多孔的;分隔式的 n. (印尼、美、印)茨罗拉尔(人名) n. (cellular) 移动电话 17, ceramic [səˈræmɪk] n. 陶瓷;陶瓷制品 adj. 陶瓷的;陶器的;制陶艺术的 18, chest [tʃest] n. 胸,胸部;衣柜;箱子;金库 19, coefficient [ˌkəʊɪˈfɪʃnt] n. [数] 系数;率;协同因素 adj. 合作的;共同作用的 复数coefficients 20, comparison [kəmˈpærɪsn] n. 比较;对照;比喻;比较关系 21, components [kəm'pəʊnənts] n. 部件;组件;成份(component复数) 22, compound [ˈkɒmpaʊnd] n. [化学] 化合物;混合物;复合词;有围栏(或围墙)的场地(内有工厂或其他建筑群) adj. 复合的;混合的 v. 合成;混合;恶化,加重;和解,妥协 23, compression [kəmˈpreʃn] n. 压缩,浓缩;压榨,压迫 24, contention [kənˈtenʃn] n. 争论,争辩;争夺;论点 复数contentions 25, conventions [kən'vɛnʃən] n. [法] 惯例;会议;[计] 约定(convention的复数) 26, convergence [kənˈvɜːdʒəns] n. [数] 收敛;会聚,集合 n. (Convergence)人名;(法)孔韦尔让斯 复数convergences 27, converter [kənˈvɜːtə(r)] n. (使)转变的人(或物);转换器;整流器;变频器;转换程序;变焦镜 复数converters 28, dedicated [ˈdedɪkeɪtɪd] adj. 专用的;专注的;献身的 v. 以…奉献;把…用于(dedicate的过去式和过去分词) 29, default [dɪˈfɔːlt; ˈdiːfɔːlt] n. 违约,拖欠;系统默认值;常规做法;缺席 v. 不履行,拖欠,违约;默认,预设;(计算机等)自动转到(默认值);因未到场而取消……参赛资格;(未)不到场;不参加(比赛等);对……处以缺席裁判 30, deprave [dɪˈpreɪv] vt. 使堕落;使腐败 31, diagram [ˈdaɪəɡræm] n. 图表;图解 vt. 用图解法表示 过去式diagramed或diagrammed 过去分词diagramed或diagrammed 现在分词diagraming或diagramming 复数diagrams 第三人称单数diagrams 32, dissipation [ˌdɪsɪˈpeɪʃn] n. 浪费;消散;[物] 损耗 33, dynamic [daɪˈnæmɪk] adj. 动态的;动力的;动力学的;有活力的 n. 动态;动力 [ 复数:dynamics ] 34, embedded [ɪm'bedɪd] adj. 嵌入式的;植入的;内含的 v. 嵌入(embed的过去式和过去分词形式) 35, EMC [,i: em 'si:] abbr. 电磁兼容性(Electro Magnetic Compatibility) 36, enable [ɪˈneɪbl] v. 使能够;使成为可能;授予权利或方法;(计算机)启动 37, Ethernet ['i:θə,net] n. [计] 以太网 38, executed ['eksɪ,kjʊtɪd] v. 履行(execute的过去分词) adj. 已执行的;已生效的 39, extract [ˈekstrækt] v. 提取,提炼;索取,设法得到;选取,摘录;取出,拔出;推断出,引申出;开(方),求(根) n. 摘录,引文;榨出物,汁 [ 复数:extracts 过去式:extracted 过去分词:extracted 现在分词:extracting 第三人称单数:extracts ] 40, fine-tuned [] adj. 有调整德;有提高的 v. 调整;使有规则;对进行微调(fine-tune 的过去式和过去分词) 41, flight [flaɪt] n. 飞行;班机;逃走 n. (Flight)人名;(英)弗莱特 vt. 射击;使惊飞 vi. 迁徙 42, frontend n. 前端 43, generator [ˈdʒenəreɪtə(r)] n. 发电机;发生器;生产者 44, gyroscope [ˈdʒaɪrəskəʊp] n. 陀螺仪;[航] 回转仪 复数gyroscopes 45, herein [ˌhɪərˈɪn] adv. 本文中,本书中;于此,在此 n. (Herein) (美、德)赫赖因(人名) 46, host [həʊst] n. [计] 主机;主人;主持人;许多 vt. 主持;当主人招待 vi. 群集;做主人 47, hyper [ˈhaɪpə(r)] n. 宣传人员 adj. 亢奋的;高度紧张的 48, impedance [ɪmˈpiːdns] n. [电] 阻抗 49, implement ['ɪmplɪm(ə)nt] n. 工具,器具;手段 vt. 实施,执行;实现,使生效 50, implementation [ˌɪmplɪmenˈteɪʃn] n. [计] 实现;履行;安装启用 51, implementing ['ɪmplə,mɛnt] v. 贯彻,实行(implement 的现在分词) 52, implicitly [ɪmˈplɪsɪtli] adv. 含蓄地;暗中地 53, imprecise [ˌɪmprɪˈsaɪs] adj. 不精确的;不严密的;不确切的 54, indicator [ˈɪndɪkeɪtə(r)] n. 指标,标志,迹象; 指示器;[试剂] 指示剂;[计] 指示符;压力计 55, inherent [ɪnˈherənt; ɪnˈhɪərənt] adj. 固有的;内在的;与生俱来的,遗传的 56, integrator ['ɪntɪgreɪtə] n. [自] 积分器;[电子] 积分电路;整合之人 57, intentionally [ɪnˈtenʃənəli] adv. 故意地,有意地 58, intervals ['intevls] n. 间隔;[声] 音程(interval的复数) 59, intrinsically [ɪnˈtrɪnzɪkli; ɪnˈtrɪnsɪkli] adv. 本质地;内在地;固有地 60, LDO abbr. 低压差线性稳压器(Low Dropout Regulator);低溶解氧(Low Dissolved Oxygen) 61, maintain [meɪnˈteɪn] vt. 维持;继续;维修;主张;供养 62, mandatory [ˈmændətəri; mænˈdeɪtəri] n. 受托者(等于mandatary) adj. 强制的;托管的;命令的 63, manually [ˈmænjuəli] adv. 手动地;用手 64, mimic [ˈmɪmɪk] vt. 模仿,摹拟 n. 效颦者,模仿者;仿制品;小丑 adj. 模仿的,模拟的;假装的 [ 过去式:mimicked 过去分词:mimicked 现在分词:mimicking 复数:mimics 第三人称单数:mimics ] 65, modifiers n. 修改器;编辑器;修改工具栏;修改器堆栈(modifier的复数) 66, multiple [ˈmʌltɪpl] n. 倍数;[电] 并联 adj. 多重的;多样的;许多的 67, multiplex [ˈmʌltɪpleks] n. [测] 多倍仪;多重通道 adj. 多样的,多元的;[通信] 多路传输的 vt. [通信] 多路传输 vi. [通信] 多路传输;多工 68, multiplexing ['mʌltɪpleksɪŋ] n. 多路技术 v. 多重发讯(multiplex的ing形式) 69, multislot n. 多槽 70, navigates [] 导航 找到正确的行进方向 航行 绕过 71, navigation [ˌnævɪˈɡeɪʃn] n. 航行;航海 72, offenders [ə'fɛndɚ] n. 罪犯(offender的复数);冒犯者 73, officially [əˈfɪʃəli] adv. 正式地;官方地;作为公务员 74, omitted [əʊ'mɪtɪd] v. 遗漏,省略(omit的过去分词) adj. 省略了的;省去的 75, optimization [,ɒptɪmaɪ'zeɪʃən] n. 最佳化,最优化 76, optimize [ˈɒptɪmaɪz] vt. 使最优化,使完善 vi. 优化;持乐观态度 77, originate [əˈrɪdʒɪneɪt] vt. 引起;创作 vi. 发源;发生;起航 78, orthogonal [ɔː'θɒg(ə)n(ə)l] n. 正交直线 adj. [数] 正交的;直角的 79, patent ['pæt(ə)nt; 'peɪt(ə)nt] v. 取得……的专利权;授予专利 adj. 专利的;特许生产或销售的;显著的;公开的;(脉管等)开放的 n. 专利权;专利证;专利品 80, peripheral [pəˈrɪfərəl] adj. 外围的;次要的;(神经)末梢区域的 n. 外部设备 81, possession [pəˈzeʃn] n. 拥有;财产;领地;自制;着迷 82, preamble [ˈpriːæmbl] n. (法规、契约的)序言,绪论;前言,开场白 v. 作序文 复数preambles 83, predictions [prɪ'dɪkʃən] n. 预测,预言(prediction复数形式) 84, presented [prɪˈzentid] v. 提出(present的过去分词);呈递,提供 85, protocol [ˈprəʊtəkɒl] n. 协议;草案;礼仪 vt. 拟定 vi. 拟定 86, registration [ˌredʒɪˈstreɪʃn] n. 登记;注册;挂号;[纺织]对花印花 87, regulator [ˈreɡjuleɪtə(r)] n. 监管机构,监管者;调整者;校准器 88, reinforcement [ˌriːɪnˈfɔːrsmənt] n. 加固;增援;援军;加强 [ 复数:reinforcements ] 89, relevancy ['reləvənsi:] n. 关联;恰当 90, requirements [ri'kwaiəmənt] n. 要求(requirement的复数);调整需要量,必需品 91, retransmission [,riːtrænz'mɪʃən] n. 转播;[通信] 重发;中继 92, retrieved v. 恢复;重新取回;补偿;挽救(retrieve的过去式和过去分词) 93, ripple [ˈrɪpl] n. 波纹;涟漪;[物] 涟波 vt. 在…上形成波痕 vi. 起潺潺声 n. (Ripple)人名;(英)里普尔 94, satellite [ˈsætəlaɪt] n. 卫星;人造卫星;卫星国家 adj. 卫星的 95, scenario [səˈnɑːriəʊ] n. 方案;情节;剧本;设想 96, shortcut [ˈʃɔːtkʌt] n. 捷径;被切短的东西 复数shortcuts 97, signaling ['sɪɡnəlɪŋ] n. 发信号;打信号 98, sink [sɪŋk] n. 洗涤槽,水槽;洼地;污水坑;(技)汇,壑;贫困地区学校(或房产);巢,藏垢的场所 n. (Sink) (美、英、罗马尼亚)辛克(人名) adj. 位于社会条件差的贫穷地区的,贫民窟的 v. (在水或泥里)下沉;使(船只)沉没;倒下;渗透;完全被理解;使锋利物穿透表面;(物体)沉降;消失;降低;(声音)变小;挖掘;埋入;使消沉,压抑;接近死亡;隐藏;击球入洞;(非正式)猛喝 99, slots n. 插槽;(slot的复数) n. (Slots)人名;(瑞典)斯洛茨 100, softkey ['sɔft,ki] n. 热键功能;功能键;简易操作 101, soldering ['sɒldərɪŋ] v. 焊接,焊合;(使)结合(solder 的现在分词) n. 紧扣 102, spam [spæm] n. (非正式)滥发的电邮,垃圾电邮 v. 在互联网上向(大量的新闻组或用户)发送垃圾信息,群发 n. (Spam) 帕斯姆午餐肉 n. (Spam) (俄、美)史琶姆(人名) [ 过去式:spammed 过去分词:spammed 现在分词:spamming 复数:spams 第三人称单数:spams ] 103, specification [ˌspesɪfɪˈkeɪʃn] n. 规格;说明书;详述 104, specifications [ˌspesɪfɪˈkeɪʃnz] n. 规格(specification的复数形式);说明书 105, spectrum [ˈspektrəm] n. 光谱;频谱;范围;余象 106, stratum [ˈstrɑːtəm] n. (组织的)层;[地质] 地层;社会阶层 107, subcarrier ['sʌb,kæriɚ] n. [电子][通信] 副载波;辅助波 108, subparameter [计] 子参数 109, suite [swiːt] n. (一套)家具;套房;组曲;(一批)随员,随从 复数suites 110, supervised ['sʊpɚvaɪz] adj. 有监督的 v. 监督(supervise的过去式和过去分词);指导 111, suspend [səˈspend] vt. 延缓,推迟;使暂停;使悬浮 vi. 悬浮;禁赛 112, synchronize [ˈsɪŋkrənaɪz] vt. 使……合拍;使……同步 vi. 同步;同时发生 过去式synchronized 过去分词synchronized 现在分词synchronizing 第三人称单数synchronizes 113, syntactical [sin'tæktikəl] adj. 句法的;依照句法的(等于syntactic) 114, syntax [ˈsɪntæks] n. 语法;句法;有秩序的排列 115, tantalum [ˈtæntələm] n. [化学] 钽(符号Ta,原子序73) 116, term [tɜːm] n. 术语;学期;期限;条款;(代数式等的)项 vt. 把…叫做 n. (Term)人名;(泰)丁 117, transmission [trænzˈmɪʃn; trænsˈmɪʃn] n. 传动装置,[机] 变速器;传递;传送;播送 118, unsolicited [ˌʌnsəˈlɪsɪtɪd] adj. 未经请求的;主动提供的 119, utility [juːˈtɪləti] n. 实用;效用;公共设施;功用 adj. 实用的;通用的;有多种用途的 120, validation [ˌvælɪˈdeɪʃn] n. 确认;批准;生效 121, variation [ˌveəriˈeɪʃn] n. 变化,变更,变动;[生物] 变异,变种;变奏曲 122, vendor [ˈvendə(r)] n. 卖主;小贩;供应商;[贸易] 自动售货机 123, vendors ['vendəz] n. 供应商,销售商(vendor的复数) 124, Zener diode [电子] 稳压二极管;[电子] 齐纳二极管
处理后的文本2.txt
abbreviations albeit alternating antenna appendix associated asynchronous Attenuation backup bearer bidirectional brackets carriage carrier ceases Cellular ceramic chest coefficient comparison components compound compression contention conventions convergence converter dedicated default deprave diagram dissipation dynamic embedded EMC enable Ethernet executed extract flight frontend generator gyroscope herein host hyper impedance implement implementation implementing implicitly imprecise indicator inherent integrator intentionally intervals intrinsically LDO maintain mandatory manually mimic modifiers multiple multiplex multiplexing multislot navigates navigation offenders officially omitted optimization optimize originate orthogonal patent peripheral possession preamble predictions presented protocol registration regulator reinforcement relevancy requirements retransmission retrieved ripple satellite scenario shortcut signaling sink slots softkey soldering spam specification specifications spectrum stratum subcarrier subparameter suite supervised suspend synchronize syntactical syntax tantalum term transmission unsolicited utility validation variation vendor vendors Zener
嗯,但是还是有点问题,单词短语不能很好的处理,待有想法了再改进改进~~~~
单词里的汉语意思竟然有敏感词,2333~