总结写在前面,
总结:
当Java通过jdbc链接mysql插入中文时,要保证程序可以正常执行,而且插入的中文不会乱码,
- mysql服务器端,对数据表(不是数据库)的编码设置,要保证是支持中文的,例如gbk, gb2312, utf-8
- jdbc的连接配置,要开启useUnicode=true,并且要设置一个支持中文的编码,不需要跟mysql表的编码保持一致,只需要支持中文就行。例如characterEncoding=utf8
- 本身的Java文件的编码需要支持中文
=============================================================================
刚学习JDBC,今天在调试代码的时候发现明明在公司的时候还能正常执行的插入语句,回来就不行了,测试代码是这样的。
数据库配置文件 mysql.ini
driver=com.mysql.jdbc.Driver
url=jdbc:mysql://127.0.0.1:3306/dedecms
user=root
pass=
测试代码
package db; import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.SQLException;
import java.sql.Statement;
import java.util.Properties; public class Test {
private String driver;
private String url;
private String user;
private String pass;
public void initParam(String paramFile) throws FileNotFoundException, IOException, ClassNotFoundException {
Properties prop = new Properties();
prop.load(new FileInputStream(paramFile));
driver = prop.getProperty("driver");
url = prop.getProperty("url");
user = prop.getProperty("user");
pass = prop.getProperty("pass");
Class.forName(driver);
} public int insertData(String sql) throws SQLException {
try (
Connection conn = DriverManager.getConnection(url, user, pass);
Statement stmt = conn.createStatement()) {
return stmt.executeUpdate(sql);
}
} public static void main(String[] args) throws FileNotFoundException, ClassNotFoundException, IOException, SQLException {
Test t = new Test();
t.initParam("mysql.ini");
t.insertData("insert into jdbc_test (jdbc_name, jdbc_desc) values ('测试标题','测试内容');");
System.out.println("ok");
} }
本来在公司还能执行的,拿回家新建了数据库,就不行了,报错如下,
Exception in thread "main" com.mysql.jdbc.MysqlDataTruncation: Data truncation: Incorrect string value: '\xCE\xE4\xBA\xBA\xB5\xD8...' for column 'jdbc_name' at row 1
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3513)
at com.mysql.jdbc.MysqlIO.checkErrorPacket(MysqlIO.java:3447)
at com.mysql.jdbc.MysqlIO.sendCommand(MysqlIO.java:1951)
at com.mysql.jdbc.MysqlIO.sqlQueryDirect(MysqlIO.java:2101)
at com.mysql.jdbc.ConnectionImpl.execSQL(ConnectionImpl.java:2548)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1605)
at com.mysql.jdbc.StatementImpl.executeUpdate(StatementImpl.java:1524)
at db.ExecuteSQL.insertData(ExecuteSQL.java:47)
at db.ExecuteSQL.main(ExecuteSQL.java:119)
考虑到插入了中文,在网上搜索了mysql的jdbc的url配置方法
url=jdbc:mysql://127.0.0.1:3306/dedecms?useUnicode=true&characterEncoding=utf8
即需要开启useUnicode=true并设置一种字符集,但是发现设置之后还是会出现上面的错误,于是又尝试修改了Eclipse文档的字符集,
即在preferences->general->workspace->text file encoding下选择UTF-8,使java文件与jdbc链接配置的编码一致,
然而发现这么设置之后,已然会出现上面的问题,想想大概是mysql数据库本身的设置不对,于是又更改下面的配置(用的phpMyAdmin做mysql客户端)
找到我当前的数据库,将排序规则改为了 utf8_unicode_ci
再次执行程序,发现问题依然存在,于是又折腾了半天,发现不仅仅是数据库可以修改排序规则,单个表格也可以修改排序规则,
将表格的排序规则也改成 utf8_unicode_ci ,并且勾选 Change all column collations ,
再次执行程序,终于可以看到数据正常插入了!
程序测试结果,
表内容
不过后来又发现一个有趣的事情,就是无论mysql服务器的表设置为什么编码,只要在jdbc链接的时候也选择同样的编码,程序就可以执行成功,
只不过如果编码不支持中文的话,数据表里就会出现乱码,例如这样,
mysql数据表是拉丁编码
mysql链接字符串也用拉丁编码
url=jdbc:mysql://127.0.0.1:3306/dedecms?useUnicode=true&characterEncoding=latin1
java文件编码默认
然后发现可以执行,
但是数据表里全是乱码,
而一旦将数据表里的编码修改成支持中文的编码,比如gb2312
并且将mysql jdbc的链接也修改成支持中文的编码, gb2312, gbk, utf8中的任何一个都行,并不需要跟数据表编码一致,
url=jdbc:mysql://127.0.0.1:3306/dedecms?useUnicode=true&characterEncoding=utf8
当然,eclipse的文件编码也必须支持中文(否则根本无法保存含有中文的文件),比如utf-8
这样的话,就能正常执行程序,而且插入数据表的中文也不会乱码了
所以,在创建表的时候顺便指定字符集是很重要的,像这样,
create table jdbc_test (jdbc_id int auto_increment primary key, jdbc_name varchar(255), jdbc_desc text) DEFAULT CHARSET=utf8;
总结:
当Java通过jdbc链接mysql插入中文时,要保证程序可以正常执行,而且插入的中文不会乱码,
- mysql服务器端,对数据表的编码设置,要保证是支持中文的,例如gbk, gb2312, utf-8
- jdbc的连接配置,要开启useUnicode=true,并且要设置一个支持中文的编码,不需要跟mysql表的编码保持一致,只需要支持中文就行。例如characterEncoding=utf8
- 本身的Java文件的编码需要支持中文
ps:
关于这个问题,今天在CSDN上看到一个喜欢钻研的人,研究了一下jdbc数据传输过程(tcp),并做了抓包分析,颇有帮助,
http://blog.csdn.net/dslztx/article/details/47070475