脱机手写汉字识别若干关键技术研究
对于大字符集识别问题,一般采用模板匹配的算法,主要是因为该算法比较简单,识别速度快。但直接的模板匹配算法往往无法满足实际应用中对识别精度的需求。为此任俊玲编著的《脱机手写汉字识别若干关键技术研究》在模板匹配算法的基础上,结合统计分析和统计信号处理的原理,对脱机手写汉字识别算法以及相关问题进行了研究,力求在基本不降低识别速度的基础上较大地提高识别的精度。
内容简介
目录
第1章 绪论
1.1 课题的提出
1.2 研究现状分析
1.3 研究内容和主要工作
1.4 本书的结构及安排
参考文献
第2章 脱机手写汉字识别系统的实现
2.1 脱机手写汉字识别系统
2.1.1 识别原理
2.1.2 基于模板匹配的两级脱机手写汉字识别系统
2.2 手写汉字识别系统的特征提取
2.2.1 方向线素的定义
2.2.2 方向线素特征的提取
2.3 基于模板匹配的识别算法
2.4 汉字识别系统的粗分类算法
2.4.1 粗分类特征提取
2.4.2 粗分类时的识别算法
2.5 汉字识别系统的细分类算法
2.5.1 细分类特征提取
2.5.2 细分类时的识别算法
1.1 课题的提出
1.2 研究现状分析
1.3 研究内容和主要工作
1.4 本书的结构及安排
参考文献
第2章 脱机手写汉字识别系统的实现
2.1 脱机手写汉字识别系统
2.1.1 识别原理
2.1.2 基于模板匹配的两级脱机手写汉字识别系统
2.2 手写汉字识别系统的特征提取
2.2.1 方向线素的定义
2.2.2 方向线素特征的提取
2.3 基于模板匹配的识别算法
2.4 汉字识别系统的粗分类算法
2.4.1 粗分类特征提取
2.4.2 粗分类时的识别算法
2.5 汉字识别系统的细分类算法
2.5.1 细分类特征提取
2.5.2 细分类时的识别算法
2.6 本章小结
参考文献
第3章 HCL2004脱机手写汉字库及相关研究
3.1 研究背景及现状
3.2 HCL2000手写汉字数据库
3.2.1 数据库系统模型
3.2.2 汉字样本信息的组织
3.2.3 书写者信息的管理
3.2.4 两种信息的互查方法
3.2.5 HCL2000的数据分布
3.3 对HCL2000数据库进行更新的原因
3.4 手写汉字数据库HCL2004系统模型及实现
3.4.1 汉字样本信息的组织形式
3.4.2 样本集的划分
3.4.3 HCL2004手写汉字数据库的实现
3.5 基于HCL2004数据库的分析
3.5.1 实验系统
3.5.2 训练样本数与识别率
3.5.3 样本质量的选择与识别
3.5.4 基于单字的识别性能分析
3.5.5 关于距离测度分类器性能的分析
3.6 本章小结
参考文献
第4章 基于统计分析的手写汉字识别算法研究
4.1 引言
4.2 几种常用的平均数
4.2.1 均值
4.2.2 中位数
4.3 样本数据的分散程度描述
4.3.1 标准差
4.3.2 极差
4.4 HCL2004数据库样本特征分析
4.5 基于平均数的手写汉字标准模板
4.5.1 基于均值的标准模板
4.5.2 基于分位数的标准模板
4.6 引人数据分散程度参数的距离测度
4.6.1 引入极差的距离测度
4.6.2 引入标准差的距离测度
4.7 实验
4.7.1 不同标准模板分类性能分析
4.7.2 引入不同分散程度参数的距离测度分类性能分析
4.8 本章小结
参考文献
第5章 基于高阶统计量的距离测度
5.1 引言
5.2 在距离测度中引入高阶统计量
5.3 基于二阶标准差的距离测度
5.3.1 二阶标准差的定义
5.3.2 用二阶标准差刻画特征分布的可行性分析
5.3.3 基于二阶标准差的距离测度
5.3.4 实验
5.4 基于高阶统计量的距离测度
5.4.1 3种高阶统计量
5.4.2 基于高阶统计量的距离测度
5.4.3 实验
5.5 本章小结
参考文献
第6章 基于样本聚类的多级汉字识别系统
6.1引言
6.2 基于DB准则的K均值聚类算法
6.2.1 K均值算法
6.2.2 DB有效性准则
6.2.3 基于DB准则的K均值算法
6.3多模板匹配算法
6.3.1 多模板匹配算法原理
6.3.2 多模板匹配算法的设计方案
6.4 实验
6.4.1 实验系统
6.4.2 系统实现
6.4.3 实验结果及分析
6.5 本章小结
参考文献
第7章 基于广义置信度的样本选择算法
7.1 引言
7.2 字符识别的置信度分析
7.2.1 分类器的置信度和广义置信度
7.2.2 分类器的置信度估计
7.3 基于广义置信度的边界样本定义
7.4 基于广义置信度的样本选择算法
7.5 实验结果及分析
7.6 本章小结
参考文献
第8章 结束语
参考文献
第3章 HCL2004脱机手写汉字库及相关研究
3.1 研究背景及现状
3.2 HCL2000手写汉字数据库
3.2.1 数据库系统模型
3.2.2 汉字样本信息的组织
3.2.3 书写者信息的管理
3.2.4 两种信息的互查方法
3.2.5 HCL2000的数据分布
3.3 对HCL2000数据库进行更新的原因
3.4 手写汉字数据库HCL2004系统模型及实现
3.4.1 汉字样本信息的组织形式
3.4.2 样本集的划分
3.4.3 HCL2004手写汉字数据库的实现
3.5 基于HCL2004数据库的分析
3.5.1 实验系统
3.5.2 训练样本数与识别率
3.5.3 样本质量的选择与识别
3.5.4 基于单字的识别性能分析
3.5.5 关于距离测度分类器性能的分析
3.6 本章小结
参考文献
第4章 基于统计分析的手写汉字识别算法研究
4.1 引言
4.2 几种常用的平均数
4.2.1 均值
4.2.2 中位数
4.3 样本数据的分散程度描述
4.3.1 标准差
4.3.2 极差
4.4 HCL2004数据库样本特征分析
4.5 基于平均数的手写汉字标准模板
4.5.1 基于均值的标准模板
4.5.2 基于分位数的标准模板
4.6 引人数据分散程度参数的距离测度
4.6.1 引入极差的距离测度
4.6.2 引入标准差的距离测度
4.7 实验
4.7.1 不同标准模板分类性能分析
4.7.2 引入不同分散程度参数的距离测度分类性能分析
4.8 本章小结
参考文献
第5章 基于高阶统计量的距离测度
5.1 引言
5.2 在距离测度中引入高阶统计量
5.3 基于二阶标准差的距离测度
5.3.1 二阶标准差的定义
5.3.2 用二阶标准差刻画特征分布的可行性分析
5.3.3 基于二阶标准差的距离测度
5.3.4 实验
5.4 基于高阶统计量的距离测度
5.4.1 3种高阶统计量
5.4.2 基于高阶统计量的距离测度
5.4.3 实验
5.5 本章小结
参考文献
第6章 基于样本聚类的多级汉字识别系统
6.1引言
6.2 基于DB准则的K均值聚类算法
6.2.1 K均值算法
6.2.2 DB有效性准则
6.2.3 基于DB准则的K均值算法
6.3多模板匹配算法
6.3.1 多模板匹配算法原理
6.3.2 多模板匹配算法的设计方案
6.4 实验
6.4.1 实验系统
6.4.2 系统实现
6.4.3 实验结果及分析
6.5 本章小结
参考文献
第7章 基于广义置信度的样本选择算法
7.1 引言
7.2 字符识别的置信度分析
7.2.1 分类器的置信度和广义置信度
7.2.2 分类器的置信度估计
7.3 基于广义置信度的边界样本定义
7.4 基于广义置信度的样本选择算法
7.5 实验结果及分析
7.6 本章小结
参考文献
第8章 结束语