1. 研究目的与意义
现如今,在科技革命与产业变革快速发展的背景下,文字识别、人脸识别、纹理识别等领域中,机器视觉发挥着重要作用。其中,数字图像处理(DigtalImage Processing)是一种借助计算机平台,实现对图像的除噪、增强、复原、分割及提取的处理技术。相较于传统的图像处理技术,其具有诸多特点,尤其是其较强的还原和变通能力,可以精确地完成复杂图像的处理。另外,其能够利用软件的强大功能完成封装,极大地提升了处理效率和压缩了处理的时间成本,以便于适合复杂的应用场景。此外,光学字符识别(OCR)是机器视觉中的一项广泛而重要的应用。OCR通常可分为手写体识别和印刷体识别,识别内容则包括汉字、英文字母、数字等。一套基本的OCR处理流程由5个步骤——版面分析、预处理、行列切割、字符识别、后处理识别矫正构成。
作为一种交流媒介和身份信息的载体,名片在商务应用甚至日常生活中一直发挥了很重要的作用。对于个人而言,名片的重点在于其持有者的姓名、职位、工作和联系方式;对于企业而言,名片的重点不仅限于个人信息,更注重企业相关资料,如企业名称、地址、业务领域及官方联系方式等。不论从何种层面而言,名片所传递的信息都是直接有效的,并且是持有人/公司向外界展示自身的尤为重要的形式。随着日益频繁的经济交往,名片的数量大大增加,给名片信息的保存、管理和查找带很大的困难。因此为便于查找,需要利用excel对名片信息进行保存和管理。对于录入过程,在携带式通讯设备的普及的情况下,人们可以通过拍摄照片以直接获取图像上的文字,运用OCR技术以获取名片中的文字,大大减少人工识别及录入所耗费的时间和人力,提高文字信息的管理和传播效率[1]。
本课题研究的背景是基于新冠疫情过后大众重回正常生活的情形,经济需要复苏,商务社交需要继续,那么名片作为日常商务活动中最重要的信息载体之一,仍然发挥着重要作用。但是,就传统纸质名片而言,一是目前大部分人们出门追求简洁,常常是“一支手机走天下”,没有地方存放纸质名片;二是名片信息参差不齐,甚至有的会为了引人注意而卡面花里胡哨,紧急情况下无法直截了当找到所需信息;三是名片过多的情况下,在寻找需要的名片时,不能够及时找到。因此,本课题的目的是实现基于图像处理的名片识别与提取,并且可以将重要信息归纳至excel中,便于用户及时寻找使用,以此获得名片利用最大化,实现基本需求。
2. 研究内容和预期目标
研究内容:
1. 基于机器视觉和图像处理技术实现文字区域检测。对已有图片进行检测,框选文字所在区域。
2. 图像汉字或字母识别。将输入图像进行预处理,并进行单字切割与文字识别。
3. 研究的方法与步骤
一、研究方法
该研究可分为基于数字图像处理技术实现名片识别、图像文字识别和图像信息提取与排版的设计与实现三大部分。
以下为系统总体的结构框图:
4. 参考文献
[1]车树林. 名片识别和信息提取算法研究[D].西安电子科技大学,2013.
[2]王晓艺,高挺挺.二值文本信息翻译过程中光学字符识别方法研究[J].激光杂志,2021,42(05):156-160.
[3] Akhtar Jamil et al. Multilingual Artificial Text Extractionand Script Identification from Video Images[J]. International Journal ofAdvanced Computer Science and Applications, 2016.
5. 计划与进度安排
1. 2024.1.1-2.28:查阅收集参考资料;5000字的外文文献翻译。
2. 2024.3.1-3.10:完成开题报告。
3. 2024.3.11-3.31:完成文字识别并排版的具体实现。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。