[摘 要]:· 20世纪90年代初期,由Vapnik等人所提出的支持向量机(SVM)是在统计学理论基础上发展进而产生的一个崭新的学习系统,在文本分类、手写字符识别、图像分类、生物序列分析等实际应用中具有很高的泛化学习性能。随着在理论方面不断深入,在实践中不断发展,SVM目前已成为机器学习和数据挖掘领域的标准工具。 基于支持向量机的验证码识别在电子商务中有着广泛应用。电子商务的发展非常迅速,迫切需要一种推广方式来推销他们的商品,残障人士上网问题也需要迫切关注,因此许多人开始研究网络机器人技术,用于邮箱自动注册,群发信息,自动灌水,自动登录等功能,而这些功能都离不开验证码识别技术,验证码识别技术已成为当前这一领域的一个研究热点。 本文详细介绍了支持向量机的基础理论、算法实现策略、模型和参数选择,研究了验证码图像处理、特征提取及验证码识别的具体方法,设计并实现了验证码识别方案,在验证码识别过程中取得了良好的效果。 本文首先概述统计学习理论和支持向量机的构造方法,分析和研究了支持向量机的多类分类算法和核函数方法。 其次,介绍了图像处理的各种基本算法,对验证码图像处理遇到的问题进行了分析,并采取不同的方法使验证码处理达到较好效果,方便了验证码特征向量的提取,同时还分析了几种不同的验证码特征提取方法的优劣。 再次,介绍了SVM多类分类器的详细设计过程,分析了实现过程过程中遇到的情况,设计了良好的数据结构用来存储向量数据,提供了SVM训练接口和预测接口,分别用来训练支持向量机和预测分类结果。 最后,综合以上理论,设计出基于C++的SVM算法,同时实现了验证码识别系统。从各类不同网站上下载具有典型特征的验证码进行实验的结果表明,该系统可非常有效地识别目前网络上流行的各类验证码。 [关键字]:·SVM 选择工作集 核函数 多类分类 验证码识别 [学位级别]:·硕士 [目录]· - 摘 要3—4
- Abstract4—9
- 1、 绪论9—16
- 1.1 研究背景及意义9—11
- 1.1.1 机器学习的发展9—10
- 1.1.2 图像处理与应用10—11
- 1.2 支持向量机概述11—13
- 1.2.1 支持向量机的研究内容11—12
- 1.2.2 支持向量机发展状况12—13
- 1.3 验证码识别方法研究13—14
- 1.3.1 验证码识别的意义13
- 1.3.2 验证码识别的方法13—14
- 1.4 研究内容和组织结构14—16
- 1.4.1 研究的主要内容14
- 1.4.2 论文的组织结构14—16
- 2、 SVM算法理论16—35
- 2.1 统计学习16—21
- 2.1.1 经验风险最小16—17
- 2.1.2 学习过程一致性17—18
- 2.1.3 VC维理论18—19
- 2.1.4 结构风险最小19—21
- 2.2 线性SVM21—24
- 2.2.1 线性问题21—23
- 2.2.2 线性分类器23—24
- 2.3 非线性SVM和核函数24—27
- 2.3.1 非线性SVM24—25
- 2.3.2 核函数方法25—26
- 2.3.3 核函数的选择26—27
- 2.4 SVM多类分类27—29
- 2.4.1 多类问题27—28
- 2.4.2 多类分类方法28—29
- 2.5 SMO和选择工作集算法29—30
- 2.5.1 SMO算法29—30
- 2.5.2 选择工作集算法30
- 2.6 常用的SVM类型30—35
- 2.6.1 C—SVC30—31
- 2.6.2 v—SVC31—32
- 2.6.3 on—class SVM32—33
- 2.6.4 ε—SVR33
- 2.6.5 v—SVR33—35
- 3、 验证码图像处理算法35—45
- 3.1 图像预处理35—41
- 3.1.1 图像平滑35—36
- 3.1.2 中值滤波36
- 3.1.3 直方图均衡36
- 3.1.4 图像锐化36—40
- 3.1.5 图像灰度化40
- 3.1.6 图像二值化40—41
- 3.1.7 去除噪音41
- 3.2 形态学图像处理41—43
- 3.2.1 图像的腐蚀42
- 3.2.2 图像的膨胀42—43
- 3.2.3 图像的细化43
- 3.3 图像分割43—44
- 3.3.1 基于区域的分割43—44
- 3.3.2 基于分水岭的分割44
- 3.3.3 基于投影的分割44
- 3.4 特征提取44—45
- 4、 SVM分类器设计45—48
- 4.1 改进的SMO和工作集选择算法45—46
- 4.2 SVM设计和实现46—48
- 5、 验证码识别48—55
- 5.1 验证码识别过程48—49
- 5.1.1 识别的流程48
- 5.1.2 样例的制作48—49
- 5.1.3 样例的训练49
- 5.1.4 识别验证码49
- 5.2 验证码识别系统框架49—51
- 5.2.1 系统框架49—50
- 5.2.2 图像预处理模块50—51
- 5.2.3 特征提取模块51
- 5.2.4 支持向量机模块51
- 5.3 验证码识别实验51—54
- 5.4 验证码识别实验分析54—55
- 6、 总结与展望55—57
- 参 考 文 献57—61
- 致 谢61—62
- 攻读硕士期间发表的论文62—63
|