编码及字符集探讨

我们用到的工具UltraEdit
 
1.文件编码
新建一个文本文件,我们知道我们输入一篇文章,可能需要保存到存储设备中,既然存储,那么我们怎么存呢,我们知道计算机只认识0和1,对于语言文字中的各种符号标记我们怎么存储到计算机中,这就有个编码的问题了。
我们知道如果识别一个学生,我们可以通过给学生编号的方式来管理,这就是学号,而对于各种字符我们类似,进行编码的方式来识别,
了解ASCII码的知道,它用0-255定义这么256个英文及标点等符号。只需要一个字节也就是8个比特位就够了。
对于像我们中文这样的亚洲文字怎么办呢,于是出现了各种编码,比如GB2312,GBK等等。
他们使用2个字节存储汉字。
 
另存我们的文件,存储格式我们用ANSI方式,
这样英文占1个字节,而汉字占2个字节。
 
我们输入几个字符:
 
编码及字符集探讨ABCDE中文
这样是5个英文字母和2个汉字共占9个字节,你可以查看下文件属性验证下。
 
我们在ultraEdit里面Ctrl+H用16进制方式查看下
 
编码及字符集探讨
 
我们看到41是A的ASCII码,依次42,43,44,45是BCDE
 
而 D6 D0是 中
CEC4是 文
 
 




 本文转自 xcf007 51CTO博客,原文链接:http://blog.51cto.com/xcf007/149549,如需转载请自行联系原作者

上一篇:DRDS和RDS只读实例性能对比测试


下一篇:DRDS和RDS只读实例性能对比测试