加入收藏 | 设为首页 | 会员中心 | RSS
您当前的位置:首页 > 博硕期刊 > 博硕论文

基于SVM的验证码识别算法研究

时间:2010-09-22  来源:原创毕业论文  点击这里给我发消息
[摘 要]:· 20世纪90年代初期,由Vapnik等人所提出的支持向量机(SVM)是在统计学理论基础上发展进而产生的一个崭新的学习系统,在文本分类、手写字符识别、图像分类、生物序列分析等实际应用中具有很高的泛化学习性能。随着在理论方面不断深入,在实践中不断发展,SVM目前已成为机器学习和数据挖掘领域的标准工具。 基于支持向量机的验证码识别在电子商务中有着广泛应用。电子商务的发展非常迅速,迫切需要一种推广方式来推销他们的商品,残障人士上网问题也需要迫切关注,因此许多人开始研究网络机器人技术,用于邮箱自动注册,群发信息,自动灌水,自动登录等功能,而这些功能都离不开验证码识别技术,验证码识别技术已成为当前这一领域的一个研究热点。 本文详细介绍了支持向量机的基础理论、算法实现策略、模型和参数选择,研究了验证码图像处理、特征提取及验证码识别的具体方法,设计并实现了验证码识别方案,在验证码识别过程中取得了良好的效果。 本文首先概述统计学习理论和支持向量机的构造方法,分析和研究了支持向量机的多类分类算法和核函数方法。 其次,介绍了图像处理的各种基本算法,对验证码图像处理遇到的问题进行了分析,并采取不同的方法使验证码处理达到较好效果,方便了验证码特征向量的提取,同时还分析了几种不同的验证码特征提取方法的优劣。 再次,介绍了SVM多类分类器的详细设计过程,分析了实现过程过程中遇到的情况,设计了良好的数据结构用来存储向量数据,提供了SVM训练接口和预测接口,分别用来训练支持向量机和预测分类结果。 最后,综合以上理论,设计出基于C++的SVM算法,同时实现了验证码识别系统。从各类不同网站上下载具有典型特征的验证码进行实验的结果表明,该系统可非常有效地识别目前网络上流行的各类验证码。
[关键字]:·
SVM 选择工作集 核函数 多类分类 验证码识别
[学位级别]:·硕士
[目录]·
  • 摘 要3—4
  • Abstract4—9
  • 1、 绪论9—16
  • 1.1 研究背景及意义9—11
  • 1.1.1 机器学习的发展9—10
  • 1.1.2 图像处理与应用10—11
  • 1.2 支持向量机概述11—13
  • 1.2.1 支持向量机的研究内容11—12
  • 1.2.2 支持向量机发展状况12—13
  • 1.3 验证码识别方法研究13—14
  • 1.3.1 验证码识别的意义13
  • 1.3.2 验证码识别的方法13—14
  • 1.4 研究内容和组织结构14—16
  • 1.4.1 研究的主要内容14
  • 1.4.2 论文的组织结构14—16
  • 2、 SVM算法理论16—35
  • 2.1 统计学习16—21
  • 2.1.1 经验风险最小16—17
  • 2.1.2 学习过程一致性17—18
  • 2.1.3 VC维理论18—19
  • 2.1.4 结构风险最小19—21
  • 2.2 线性SVM21—24
  • 2.2.1 线性问题21—23
  • 2.2.2 线性分类器23—24
  • 2.3 非线性SVM和核函数24—27
  • 2.3.1 非线性SVM24—25
  • 2.3.2 核函数方法25—26
  • 2.3.3 核函数的选择26—27
  • 2.4 SVM多类分类27—29
  • 2.4.1 多类问题27—28
  • 2.4.2 多类分类方法28—29
  • 2.5 SMO和选择工作集算法29—30
  • 2.5.1 SMO算法29—30
  • 2.5.2 选择工作集算法30
  • 2.6 常用的SVM类型30—35
  • 2.6.1 C—SVC30—31
  • 2.6.2 v—SVC31—32
  • 2.6.3 on—class SVM32—33
  • 2.6.4 ε—SVR33
  • 2.6.5 v—SVR33—35
  • 3、 验证码图像处理算法35—45
  • 3.1 图像预处理35—41
  • 3.1.1 图像平滑35—36
  • 3.1.2 中值滤波36
  • 3.1.3 直方图均衡36
  • 3.1.4 图像锐化36—40
  • 3.1.5 图像灰度化40
  • 3.1.6 图像二值化40—41
  • 3.1.7 去除噪音41
  • 3.2 形态学图像处理41—43
  • 3.2.1 图像的腐蚀42
  • 3.2.2 图像的膨胀42—43
  • 3.2.3 图像的细化43
  • 3.3 图像分割43—44
  • 3.3.1 基于区域的分割43—44
  • 3.3.2 基于分水岭的分割44
  • 3.3.3 基于投影的分割44
  • 3.4 特征提取44—45
  • 4、 SVM分类器设计45—48
  • 4.1 改进的SMO和工作集选择算法45—46
  • 4.2 SVM设计和实现46—48
  • 5、 验证码识别48—55
  • 5.1 验证码识别过程48—49
  • 5.1.1 识别的流程48
  • 5.1.2 样例的制作48—49
  • 5.1.3 样例的训练49
  • 5.1.4 识别验证码49
  • 5.2 验证码识别系统框架49—51
  • 5.2.1 系统框架49—50
  • 5.2.2 图像预处理模块50—51
  • 5.2.3 特征提取模块51
  • 5.2.4 支持向量机模块51
  • 5.3 验证码识别实验51—54
  • 5.4 验证码识别实验分析54—55
  • 6、 总结与展望55—57
  • 参 考 文 献57—61
  • 致 谢61—62
  • 攻读硕士期间发表的论文62—63
上一篇:基于Q统计量的选择性集成学习研究
下一篇:地震动传感器的目标检测和识别算法研究
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
相关文章
    无相关信息
最后更新
栏目热门