基于OCR软件的刀具信息数据库开发与应用

来源:万方数据

点击:1476

A+ A-

所属频道:新闻中心

关键词:OCR 刀具信息 数据库

    0 引言

        随着制造业在我国的不断发展,运用数控加工技术进行机械加工已经非常普遍,而合理选用切削刀具是生产一个合格零件的重要因素之一。目前,数控技术人员选用刀具的方法主要是参考刀具牛产厂家提供的产品样本,从而确定刀具的种类、结构、几何参数、切削参数等。随着计算机技术的发展,将刀具产品信息做成可查询的软件早在10年前就有提及,但是目前也只有世界几大知名刀具厂家采用,国内企业应用很少,分析原因主要是由于刀具的分类复杂,各种参数信息量大,导致人工处理这类数据成本较高,企业难以负担。

        随着OCR技术的日益成熟和识别准确率的不断提高,运用OCB软件处理刀具产品样本并基于此开发刀具信息数据库可以大幅度提高效率,节约时间,降低成本,并有町能使基于此类数据库的查询软件真正的广泛应用。本文结合为苏州某公司开发的数据库实例,探讨运用OCR软件开发此类数据库的方法。
    1 OCR软件的功能

        1.1OCR技术简介

        光学字符识别(0pIical Character Recognition)简称OCR,是通过扫描仪将数字、符号和文字以图形信息的形式输入计算机,再由相应的软件进行识别处理,将原稿上的每一个字符变为正确的标准代码,让计算机自动完成字符的录入工作。OCR的基本处理过程可以分为三个步骤:扫描输入,自动识别、整理输出。1)在扫描仪上输入的原稿只是~页图形信息,识别时先将各个字符相互分离开,再逐字做特征向量分析;2)在自动识别的过程中,相似的字符可能不只—个,需要根据字词关系、语句关系、词意关系进行比较,最终找出字符的正确代码;3)将所有扫描输入的信息全部转换为正确的代码文件,
    存储在计算机内。

        1.2 ABBYY inmeReader简介

        ABBYY FineBeader Professional是一款真正的专业OCB软件,它不仅支持多国文字,还支持彩色文件识别、自动保留原稿插图和排版格式以及后台批处理识别功能,能够直接在MS word、MS Excel、WordPeffect及Word Pro中扫描和读取文件、信件或各类表格,并且能存成RTF、TXT、DOC、CSV、XLS或HTML等格式。它能保持表格与图片中原始的多栏页面设计。FineReader Professional在识别方面支持ADF(自动进纸)扫描仪,批处理,拼音检查。强大的表格1二具,多语言文件,背景运算和学习新的字体。基于此软件的强大功能和对中文的高准确率识别,所以选择ABBYY FineReader 9.0来处理海量的刀具数据。

    2 数据库的分析和开发实现

        2.1数据库开发平台的选择

        刀具综合信息数据库采用中小型数据库管理系统Mj.crosof t Access开发,它具有界面友好、简单易学、高速快捷、扩展性强等优点,其结构简单,且与日常事务中所使用的二维表格有着对应的关系,刀具信息数据库在Access软件环境中进行关系数据库的创建和使用,更利于开发使用者今后数据库的扩展、集成网络平台以及推广应用等工作。

       2.2数据库开发流程

        本数据库的开发主要包括两大部分:第一要根据刀具生产厂家现有的普通样本分析刀具的分类、结构、各类参数,然后确立各数据间的关系,以此为基础进行数据模型和结构的设计。第二要把普通样本上的数据通过OCR软件处理并校对最后录人到设计好的数据库文件中。根据上述要求,整个数据库的开发流程如图1所示。

        2.3数据模型的设计

        概念数据模型是按照用户的观氛来对数据和信息建模,主要用于数据库设计,概念模型主要用实体联系方法表示,所以也称E-R模型。该模型反映了客观世界中各种实体的内外部联系,比较简单明了。在E-R模型中主要由下列基本要素组成:1)实体一般用矩形来表示;2)实体属性一般用椭圆型来表示;3)实体间的联系一般用菱形来表示,并标注联系类型。

        由于刀具品种很多,尺寸类型也不尽相同,下面以4刃立铣刀为例来说明E一R模刑关系。

        2.4数据库结构设计

        在确定实体联系模型以后,还需要将其转化成Access数据库能支持的模型,这就需要用一系列的表及表间关系来表述实体及实体间的关系。按照上述要求,分别建立刀具类型表(Tool Catalog )、刀具产品表(Tool Date )、刀具几何参数表( Tool Geometric )、刀具切削参数表(Tool Parameter),每张表的字段及表间的关系如图3所示。

        2.5刀具信息数据的获取

        1)对ABBYY FineReader软件进行语言设置,步骤如下:点击“tools”一“language editor”,打开对话框以后,在“addi—tional Ianguages”中框选“Chinese Simplified”选项,在“formallanguages”中框选“numbers”和“Simple chemical f啪ul部”选项。如果产品样本包含其他语言和特殊的字符,则应该做相应的语言设置。

        2)利用ABBYYFineReader自带的扫描模块对刀具样本进行扫描,扫描完成,软件自动进人识别校对模块,按照软件对页面的划块分区,选择刀具关键参数的分区,按照纵向校对的方式,逐字符校对,发现有误可直接在文本框中修改,校对完成的数据保存成Execl格式文件。

         3)建立数据汇总的Execl文件,该文件需要设置多个sheet。不同型号刀具的几何参数放在不同的sheet中,不同类型刀具的切削参数也放在不同的sheet中。将上一步经过校对的每个分页面的数据导入对应的sheet里面,至此所有准确的刀具信息数据都已经导入本文件。

        2.6刀具信息数据导入Acces数据库

        VBA是附属在Office办公软件包中的一套程序语言,其作用主要是自定义应用程序中的功能,以及加强应用程序间的互动。如果Office应用程序中包含了VBA应用程序,程序开发人员就可以在不同的应用程序中,使用共同的宏语言进行程序的开发,以形成在Word、Execl和Access等Office应用程序中交互式的解决方案。使用Execl绑定的VBA编辑器能够减轻操作者的工作负担,使Execl的大量重复性操作变得简单而快捷。

        本数据库运用VBA进行宏编辑的要点:1)所有型号刀具的几何参数需要导人Acc鹊s文件中的刀具几何参数表(Tool—Geometric),所以要求程序循环读取多个Sheet罩衙的数据,切削参数也是同样道理;2)由于每种刀有很多型号,所以在把数据导入几何参数表(Tool—Geometrie)时需要根据产品表(Tool_Data)来自动生成‰LDataID;3)由于每种型号的刀对应很多切削参数,所以在导入切削参数时需要根据刀具型号表(Tool—Geometric)来自动生成‰LParmaterlD。具体VBA程序及宏编辑的过程如图6。
     

     

    3 数据库的应用

        刀具信息数据库开发完成以后,在.net平台上开发刀具信息查询系统,本系统可以实现如下功能:1)根据加工方法选择合适的刀具,并查询刀具所有的参数;2)对于刀柄和刀头有匹配要求的,系统可以进行能智能双向匹配;3)所有刀具的实物图、技术参数图均可查看。

    4 结束语

        刀具产品样本的信息化所带来的价值,各生产厂家都能看到,但是受制于成本问题,一直没有得到广泛的推广和应用,本文利用OCR软件对刀具产品样本进行数据处理,并总结和实践了开发刀具信息数据库的方法。运用该方法可以大幅度降低数据处理的成本和数据库开发的周期,基于此数据库开发的系统更能方便工程技术人员查询刀具,从而有助于更多的生产企业采用产品查询系统代替传统的纸质样本。


    (审核编辑: 智汇小新)