在杨老师的勉励下,我准备开始“自己”写程序。速度很慢,不过在写的过程中对于用到的几个函数更加熟悉。也尝试多学一点,学透一点。遇到不会的函数,语法不清楚的,还是会百度,不过会自己再敲一遍。重复下去。
下面记录一下。
根据老师的SPEC要求,加上后来测试和学长们互怼、和Ranh讨论。我构思自己的单词统计规则。因为按照word的规则只是统计词数。而项目需求是统计单词量,Ranh学长提醒到我,数字不是单词,然后我想到,既然是统计单词量,那么,像I'm、It's、Bob's这样的可以直接去掉“'s”,因为Bob才是单词。在word字数统计中诸如“¥10,000”的会被统计称一个词,所以在处理字符串的时候应该忽略数字,只考虑英文单词。标点符号也应该考虑完全。
在输出top10的时候往往看不出什么,如果按照升序排序,则可以看到很多问题。比如漏掉的需要处理的标点、字符格式。
但是那个“-”我是选择不处理了的。因为如果用空格替换掉连字符,本该有连字符的词就变成多个单词了。只处理了“—”半个破折号。
有几个小知识点。自己备忘、学习、博客待补充:
StreamReader streamReader = new StreamReader(Console.OpenStandardInput(),Encoding.Default);编码格式
Dictionary<string, int> dictionary = new Dictionary<string, int>();
dictionary.ContainsKey(str)
StreamReader streamReader = new StreamReader(filename,Encoding.Default)
while((line = streamReader.ReadLine()) != null)
字符串的处理,有关函数