带有汉字的字符串截断出现半个“汉字”的解决方法-C语言源码

  汉字字符的编码为双字节,对于汉字字符和单字节字符混排的情况,如果目标截取的字符串内只包含奇数个单字节字符,则会出现半个汉字字符的问题。如下所示:

  (1)天水市秦州区南郭路2号(工行七里墩分理处? --包含数字字符,单字节

  (2)七里河区金港城金福花园20号楼3号(金港城?--包含数字字符,单字节。

  (3)甘肃银馨春天餐饮服务业有限责任公司(省委? --包含英文格式半括号。

  以上为截取字符串前四位以后的显示结果,其中“?”为半个汉字编码的显示。要想解决以上问题可以采用截取最后一个非法字符,并用合法字符替换的方法。实例代码如下所示:

#include <stdio.h>
int chkHalfChinese(char *buf,int len)
{
        int i = 0;
    int cnt = 0;
    int idx;
    for(i=0;i<len;i++)
     {
           int value = buf[i]&0xFF;
        if(value>160)   
         {
           cnt++;   
           idx=i;
         }
     }
    if(cnt%2)
     {
        buf[idx] =' ';
        return(1);
     }
    else
        {
        return(0);
      }
}

int main(void)
{
  char str[44] = "天水市秦州区南郭路2啊(工行七里墩分理处里家";  
  if(chkHalfChinese(str,40)==1)
  {
    printf("true\n");
  }
  else
  {
    printf("false\n");
  }
  printf("%s\n",&str);
  return 0;
}
程序代码在Linux环境下测试通过,运行结果如下图所示:

带有汉字的字符串截断出现半个“汉字”的解决方法-C语言源码

 

 


作者:张子良
出处:http://www.cnblogs.com/hadoopdev
本文版权归作者所有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

上一篇:基于Hadoop的云盘系统客户端技术难点之三 小文件存储优化


下一篇:基于Hadoop的云盘系统客户端技术难点之二 HDFS文件访问控制