php读mysql时,有以下几个地方涉及到了字符集。
1. 建立数据库表时指定数据库表的字符集。例如
1 create table tablename 2 ( 3 id int not null auto_increment, 4 title varchar(20) not null, 5 primary key (‘id‘) 6 )DEFAULT CHARSET =UTF8;
如果在创建表时没有指定表的字符集,则使用表所属的数据库的默认字符集。该字符集由character_set_database指定。
查看数据库表所使用的字符集的方法是:
show create table mytable;
(PS:建立数据库/表和进行数据库操作时尽量显式指出使用的字符集,而不是依赖于MySQL的默认设置,否则MySQL升级时可能带来很大困扰[1])
2.
mysql的字符集
mysql中有三个重要的变量,character_set_client,character_set_results,character_set_connection。
通过设置character_set_client,告诉Mysql,PHP存进数据库的是什么编码方式。
通过设置character_set_results,告诉Mysql,PHP需要取什么样编码的数据。
通过设置character_set_connection,告诉Mysql,PHP查询中的文本,使用什么编码。
3.
连接数据库后,设置数据库间传输字符时所用的默认字符编码。
使用mysqli::set_charset()或mysqli::query(‘set
names
utf8‘),进行设置。
尽量使用mysqli::set_charset(mysqli:set_charset)而不是”SET
NAMES”(参考这篇文章)
$db = new mysqli(‘localhost‘,‘user‘,‘passwd‘,‘database_name‘); $db->set_charset(‘utf8‘);
注意是utf8,不是utf-8
(这里有个问题就是,数据库和php都已经统一了编码,但是如果没有调用mysqli::set_charset()函数时,读出数据时仍然会出现乱码。这是为什么?)
(另,set
names utf8相当于下面三句
SET character_set_client =
utf8;
SET character_set_results =
utf8;
SET character_set_connection =
utf8;
)
4.
html页面使用的字符集。在meta标签中设置
<meta http-equiv="content-type" content="text/html; charset=utf-8">
5.
php文本文件所使用的字符集。
在linux下可以用vim打开文件,输入
:set
encoding
查看文件使用的字符集
要保证不乱码,需要保证文件自身的编码,HTML里指定的编码,PHP告诉Mysql的编码(包括character_set_client和character_set_results)统一。同时使用mysqli:set_charset()函数或”SET
NAMES”。
针对“3”后面的问题,写了几个例子,测试链接数据库后,设置和不设置字符集时的结果。测试环境Ubuntu
12.04,MySQL 5.5,php 5.5.7。
结果如下:
(1)
数据库表字符集是utf8,不使用set names
utf8
能正常插入、读出中文,但是在mysql中显示乱码
(2)
数据库表字符集是utf8,使用set names
utf8
能正常插入、读出中文,mysql中显示正确
(3)
数据库表字符集不是utf8,使用set names utf8
mysql中显示,读出都是问号。
参考:
[1]深入Mysql字符集设置. http://www.laruence.com/2008/01/05/12.html
[2]PHP和MYSQL的编码问题. http://blog.csdn.net/martinkro/article/details/5352474
[3]深入理解SET
NAMES和mysql(i)_set_charset的区别. http://www.laruence.com/2010/04/12/1396.html
[4]MySQL的“SET
NAMES xxx”字符集问题分析. http://bbs.phpchina.com/thread-13861-1-1.html