R 语言中文乱码问题

2023-11-27 23:52:04

R 语言似乎在WINDOWS平台上对中文的支持不是特别好，似乎是3.1.2的一个BUG。

目前我研究出了一个临时解决方案,你可以将代码编写成一个函数，从而在调用的过程中不必如下繁琐：

1. 先将本地语言集转换成English 1252:

　Sys.setlocale(category="LC_ALL", locale = "English_United States.1252")

2. 将文件集以UTF-8的格式读入：

b<-read.csv(y,head=F,encoding="UTF-8",stringsAsFactor=F)

3.最后将本地语言集再转换成中文。

Sys.setlocale("LC_CTYPE", "Chinese")

值得注意的是上例中文件以UNICODE的字符集的形式存在，似乎对ANSI的字符集却不会有问题。我也闹不明白什么问题。

码农公寓