符合学术规范的学术服务

机器视觉表面缺陷检测综述

分类:计算机职称论文 时间:2022-03-17

  摘 要: 目的 工业产品的表面缺陷对产品的美观度、舒适度和使用性能等带来不良影响,所以生产企业对产品的表面缺陷进行检测以便及时发现并加以控制。机器视觉的检测方法可以很大程度上克服人工检测方法的抽检率低、准确性不高、实时性差、效率低、劳动强度大等弊端,在现代工业中得到越来越广泛的研究和应用。方法 以机器视觉表面缺陷检测为研究对象,在广泛调研相关文献和发展成果的基础上,对基于机器视觉在表面缺陷检测领域的应用进行了综述。分析了典型机器视觉表面缺陷检测系统的工作原理和基本结构,阐述了表面缺陷视觉检测的研究现状、现有视觉软件和硬件平台,综述了机器视觉检测所涉及到的图像预处理算法、图像分割算法、图像特征提取及其选择算法、图像识别等相关理论和算法研究,并对每种主要方法的基本思想、特点和存在的局限性进行了总结,对未来可能的发展方向进行展望。结果 机器视觉表面缺陷检测系统中,图像处理和分析算法是重要内容,算法各有优缺点和其适应范围。如何提高算法的准确性、实时性和鲁棒性,一直是研究者们努力的方向。结论机器视觉是对人类视觉的模拟,机器视觉表面检测涉及众多学科和理论,如何使检测进一步向自动化和智能化方向发展,还需要更深入的研究。

机器视觉表面缺陷检测综述

  关键词: 机器视觉; 表面缺陷; 检测算法; 图像处理; 图像识别

  0 引 言

  中国是一个制造大国,每天都要生产大量的工业产品。用户和生产企业对产品质量的要求越来越高,除要求满足使用性能外,还要有良好的外观,即良好的表面质量。但是,在制造产品的过程中,表面缺陷的产生往往是不可避免的。不同产品的表面缺陷有着不同的定义和类型,一般而言表面缺陷是产品表面局部物理或化学性质不均匀的区域,如金属表面的划痕、斑点、孔洞,纸张表面的色差、压痕,玻璃等非金属表面的夹杂、破损、污点,等等。表面缺陷不仅影响产品的美观和舒适度,而且一般也会对其使用性能带来不良影响,所以生产企业对产品的表面缺陷检测非常重视,以便及时发现,从而有效控制产品质量,还可以根据检测结果分析生产工艺中存在的某些问题,从而杜绝或减少缺陷品的产生,同时防止潜在的贸易纠份,维护企业荣誉。

  人工检测是产品表面缺陷的传统检测方法,该方法抽检率低、准确性不高、实时性差、效率低、劳动强度大、受人工经验和主观因素的影响大,而基于机器视觉的检测方法可以很大程度上克服上述弊端。

  美国机器人工业协会( RIA) 对机器视觉下的定义为: “机器视觉是通过光学的装置和非接触的传感器自动地接收和处理一个真实物体的图像,以获得所需信息或用于控制机器人运动的装置”[1]。

  机器视觉是一种无接触、无损伤的自动检测技术,是实现设备自动化、智能化和精密控制的有效手段,具有安全可靠、光谱响应范围宽、可在恶劣环境下长时间工作和生产效率高等突出优点。机器视觉检测系统通过适当的光源和图像传感器( CCD 摄像机) 获取产品的表面图像,利用相应的图像处理算法提取图像的特征信息,然后根据特征信息进行表面缺陷的定位、识别、分级等判别和统计、存储、查询等操作。

  视觉表面缺陷检测系统基本组成主要包括图像获取模块、图像处理模块、图像分析模块、数据管理及人机接口模块。

  图像获取模块由 CCD 摄像机、光学镜头、光源及其夹持装置等组成,其功能是完成产品表面图像的采集。在光源的照明下,通过光学镜头将产品表面成像于相机传感器上,光信号先转换成电信号,进而转换成计算机能处理的数字信号。目前工业用相机主要基于 CCD 或 CMOS( complementary metal oxide semiconductor) 芯片的相机。CCD 是目前机器视觉最为常用的图像传感器。

  光源直接影响到图像的质量,其作用是克服环境光干扰,保证图像的稳定性,获得对比度尽可能高的图像。目前常用的光源有卤素灯、荧光灯和发光二级管( LED) 。LED 光源以体积小、功耗低、响应速度快、发光单色性好、可靠性高、光均匀稳定、易集成等优点获得了广泛的应用。

  由光源构成的照明系统按其照射方法可分为明场照明与暗场照明、结构光照明与频闪光照明。明场与暗场主要描述相机与光源的位置关系,明场照明指相机直接接收光源在目标上的反射光,一般相机与光源异侧分布,这种方式便于安装; 暗场照明指相机间接接收光源在目标上的散射光,一般相机与光源同侧分布,它的优点是能获得高对比度的图像。结构光照明是将光栅或线光源等投射到被测物上,根据它们产生的畸变,解调出被测物的 3 维信息。频闪光照明是将高频率的光脉冲照射到物体上,摄像机拍摄要求与光源同步。

  图像处理模块主要涉及图像去噪、图像增强与复原、缺陷的检测和目标分割。

  由于现场环境、CCD 图像光电转换、传输电路及电子元件都会使图像产生噪声,这些噪声降低了图像的质量从而对图像的处理和分析带来不良影响,所以要对图像进行预处理以去噪。图像增强目是针对给定图像的应用场合,有目的地强调图像的整体或局部特性,将原来不清晰的图像变得清晰或强调某些感兴趣的特征,扩大图像中不同物体特征之间的差别,抑制不感兴趣的特征,使之改善图像质量、丰富信息量,加强图像判读和识别效果的图像处理方法。图像复原是通过计算机处理,对质量下降的图像加以重建或复原的处理过程。图像复原很多时候采用与图像增强同样的方法,但图像增强的结果还需要下一阶段来验证; 而图像复原试图利用退化过程的先验知识,来恢复已被退化图像的本来面目,如加性噪声的消除、运动模糊的复原等。图像分割的目的是把图像中目标区域分割出来,以便进行下一步的处理。

  图像分析模块主要涉及特征提取、特征选择和图像识别。

  特征提取的作用是从图像像素中提取可以描述目标特性的表达量,把不同目标间的差异映射到低维的特征空间,从而有利于压缩数据量、提高识别率。表面缺陷检测通常提取的特征有纹理特征、几何形状特征、颜色特征、变换系数特征等,用这些多信息融合的特征向量来区可靠地区分不同类型的缺陷; 这些特征之间一般存在冗余信息,即并不能保证特征集是最优的,好的特征集应具备简约性和鲁棒性,为此,还需要进一步从特征集中选择更有利于分类的特征,即特征的选择。图像识别主要根据提取的特征集来训练分类器,使其对表面缺陷类型进行正确的分类识别。

  数据管理及人机接口模块可在显示器上立即显示缺陷类型、位置、形状、大小,对图像进行存储、查询、统计等。

  机器视觉表面缺陷检测主要包括 2 维检测和 3 维检测,前者是当前的主要表面缺陷检测方式,也是本文的着重论述之处。

  机器视觉在工业检测、包装印刷、食品工业、航空航天、生物医学工程、军事科技、智能交通、文字识别等领域得到了广泛的应用。工业检测领域是机器视觉应用中比重最大的领域,主要用于产品质量检测、产品分类、产品包装等,如: 零件装配完整性检测,装配尺寸精度检测,位置/角度测量,零件识别, PCB 板检测,印刷品检测,瓶盖检测,玻璃、烟草、棉花检测,以及指纹、汽车牌照、人脸、条码等识别。表面质量检测系统是工业检测的极其重要的组成部分,机器视觉表面缺陷检测在许多行业开始应用,涉及钢板[2-4]、玻璃[5-6]、印刷[7-9]、电子[10]、纺织品[11]、零件[12-13]、水果[14]、木材[15-16]、瓷砖[17-19]、钢轨[20]等多种关系国计民生的行业和产品。

  1 研 究 现 状、视觉软件系统和研究平台

  1. 1 研究现状

  机器视觉在金属( 特别是钢板) 表面、纸张等印刷品、纺织品、磁砖、玻璃、木材等表面缺陷检测国内外有较多的研究成果,不乏成功应用系统和案例。

  在钢板表面缺陷检测领域,美国 Westinghouse 公司采用线阵 CCD 摄像机和高强度的线光源检测钢板表面缺陷,并提出了将明域、暗域及微光域 3 种照明光路形式组合应用于检测系统的思路[21]。这些系统可识别的缺陷种类相对较少,并且不具备对周期性缺陷的识别能力。美国 Cognex 公司研制成功了 iS - 2000 自动检测系统和 iLearn 自学习分类器软件系统[22]。这两套系统配合有效改善了传统自学习分类方法在算法执行速度、数据实时吞吐量、样本训练集规模及模式特征自动选择等方面的不足; Parsytec 公司为韩国浦项制铁公司研制了冷轧钢板表面缺陷检测系统 HTS,该系统能对高速运动的热轧钢板表面缺陷进行在线自动检测和分级的系统,在连 轧 机 和 CSP 生产线上取得了良好的效果[23]; 英国 European Electronic System 公司研制的 EES 系统也成功地应用于热连轧环境下的钢板质量自动检测[24]。EES 系统实时地提供高清晰度、高可靠性的钢板上下表面的缺陷图像,最终交由操作员进行缺陷类型的分类判别。国内北京科技大学的高效轧制国家工程研究中心也在进行钢板表面质量检测系统的研制,对其常见缺陷类型进行了检测与识别,取得了一定的研究成果[25],东北大学、上海宝钢集团公司、武汉科技大学等科研院所研究了冷轧钢板表面缺陷的检测系统[26-28],重庆大学对高温连铸坯表面缺陷进行了研究[29]。

  在其他领域,视觉表面缺陷检测也得到了广泛的研究和应用。文献[30]对规则纹理表面( 天然木材、机械加工表面、纺织面料) 的表面缺陷采用傅里叶变换进行图像的复原,高频的傅里叶分量对应表面纹理线型,而低频的傅里叶分量对应表面缺陷区域。文献[31]研究了铝带连铸生产中的表面缺陷检测,通过红外检测提供铝带表面温度的分布情况以评估铝带质量,采集铝带图像,进行表面缺陷检测和分类。文献[32]将机器视觉应用于集成电路晶片表面缺陷检测,使用模糊逻辑对表面凹坑缺陷的不同形状进行分析处理。文献[33]利用图像对铁轨的表面质量进行自动检测,车载检测系统对铁轨的表面质量进行实时检测和分类。文献[34]基于机器视觉系统对鸡肉包装前的质量检测,根据鸡肉图像的颜色信息,采用数学形态学方法对潜在的问题区域进行特征提取,然后按预定义的质量问题列表进行分类。文献[35]针对随机纹理的彩色图像提出了一种利于分水岭变换的颜色相似性度量,提取了图像的颜色和纹理特征,实现了随机纹理表面缺陷的自动分割和检测。文献[36]采用双目立体视觉,基于特征立体匹配算法对扫描电镜图像研究了物体的表面深度信息。文献[37]介绍了一种皮革表面缺陷检测的方法,采用 OTSU 方法进行缺陷分割,利用欧式距离聚类法进行缺陷分类,在分类聚类时使用形态学算子进行腐蚀运算,实验结果表明了该方法的有效性。文献[38]对玻璃缺陷进行了识别,把采集到的缺陷图像缩放到 10 × 10 的大小,然后把这个 100 个像素值作为特征向量,分别运用径向基( RBF) 神经网络和决策树进行识别; 该方法的缺点是不同缺陷缩放后造成部分信息的丢失。文献[39]研究了一种玻璃缺陷识别的专家系统( ES) ,首先需要电子显微技术和等离子射线获得缺陷信息作为知识库,对未知的玻璃缺陷通过搜索知识库对缺陷信息进行匹配,选择最相近的类别作为输出; 该方法的缺点是分类采用贪婪搜索法,匹配速度慢。文献[40]针对机器视觉在产品表面粗糙度的检测方法作了描述,首先建立粗糙度的模型,然后以表面的累加偏差作为特征通过神经网络( ANN) 进行等级划分,并阐述了不同的 ANN 模型对识别结果的影响。

  1. 2 视觉软件系统

  机器视觉软件系统除具有图像处理和分析功能外,还应具有界面友好、操作简单、扩展性好、与图像处理专用硬件兼容等优点。国外视觉检测技术研究开展的较早,已涌现了许多较为成熟的商业化软件,应该 比 较 多 的 有 HALCON、HexSight、Vision Pro、 LEADTOOLS 等[41]。

  HALCON 是德国 MVtec 公司开发的一套完善的标准的机器视觉算法包,拥有应用广泛的机器视觉集成开发环境维视图像开发定制软件,在欧洲以及日本的工业界已经是公认具有最佳效能的 Machine Vision 软件。HALCON 的 image processing library,由一千多个各自独立的函数和底层的数据管理核心构成,其函数库可以用 C,C + + ,C#,Visual basic 和 Delphi 等多种普通编程语言访问。HALCON 百余种工业相机和图像采集卡提供接口,包括 GenlCam,GigE 和 IIDC 1394。HALCO 还具有强大的 3 维视觉处理能力,另 外,自动算子并行处 理 ( AOP) 技术是 HALCON 的一个独特性能。HALCON 应用范围涵盖自动化检测、医学和生命科学,遥感探测,通讯和监控等众多领域。

  Adept 公司出品的 HexSight 是一款高性能的、综合性的视觉软件开发包,它提供了稳定、可靠及准确定位和检测零件的机器视觉底层函数。HexSight 的定位工具是根据几何特征、采用轮廓检测技术来识别对象和模式。在图像凌乱、亮度波动、图像模糊和对象重叠等方面有显著效果。HexSight 能处理自由形 状 的 对 象,并具有功能强大的去模糊算法。 HexSight 软件包含一个完整的底层机器视觉函数库,可用来建构完整的高性能 2D 机器视觉系统,可利用 Visual Basic、Visual C + + 或 Borland Dephi 平台方便地进行二次开发。其运算速度快,在一台 2 GHz 的处理器上寻找和定位一般的零部件不超过 10 ms; 具有 1 /40 亚像素平移重复精度和 0. 05 度旋转重复精度。此外,内置的标定模块能矫正畸变、投影误差和 X - Y 像素比误差,完整的检测工具包含硬件接口、图像采集、图像标定、图像预处理、几何定位、颜色检测、几何测量、Blob 分析、清晰度评价( 自动对焦) 、模式匹配、边缘探测等多种多样,开放式体系结构,支持 DirectShow、DCam,GigE vision 等多种通用协议,几乎与市面上所有商业图像采集卡,以及各种 USB、1394 以及 GigE 接口的摄像机兼容。

  Cognex 公司的 VisionPro 是一套基于. Net 的视觉工具,适用于包括 FireWire 和 CameraLink 在内的所有硬件平台,利用 ActiveX 控制可快速完成视觉应用项目程序的原模型开发,可使用相应的 Visual Basic、VB. Net、C#或 C + + 搭建出更具个性化的应用程序。

  LEADTOOLS 在数码图像开发工具领域中已成为全球领导者之一,是目前功能强大的优秀的图形、图像处理开发包,它可以处理各种格式的文件,并包含所有图形、图像的处理和转换功能,支持图形、图像、多媒体、条形码、OCR、Internet、DICOM 等等,具有各种软硬件平台下的开发包。

  此外,还有 Dalsa 公司的 Sherlock 检测软件,日本的 OMRON 和 Keyence,德国 SIEMENS 等,这些机器视觉软件都能提供完整的表面缺陷检测方法。

  国内机器视觉检测系统开发较晚,相关的企业主要是代理国外同类产品,提供视觉检测方案和系统集成,其中具有代表性的企业有凌华科技、大恒图像、视觉龙、凌云光子、康视达、OPT、三姆森和微视图像等。

  1. 3 视觉硬件平台

  机器视觉表面质量检测,特别是实时检测,图像采集的数据量大,所以如何提高图像处理速度显得十分重要。提高图像处理速度主要有两种手段,一是改善和优化图像处理算法,算法既要简单快速,又要兼顾实际效果; 二是改善和优化实现算法的手段。目前,实时图像处理采集方案主要为下面几个方面[42]。

  1) 通用计算机网络并行处理。这种处理结构采用“多客户机 + 服务器”的方式,一个图像传感器对应一台客户机,服务器实现信息的合成,图像处理的大部分工作由软件来完成。该结构虽然比较庞大,但升级维护方便、实时性较好。

  2) 数字信号处理器( DSP) 。DSP 是一种独特的微处理器,是以数字信号来处理大量信息的器件。其工作原理是将接收到的模拟信号转换为“0”或 “1”的数字信号,再对数字信号进行修改、删除和强化,并在其他系统芯片中把数字数据解译回模拟数据或实际环境格式,其实时运行速度远远超过通用微处理器。但是,DSP 的体系仍是串行指令执行系统,而且只是对某些固定的运算进行硬件优化,故不能满足众多的算法要求。

  3) 专用集成电路( ASIC) 。ASIC 是针对于某一固定算法或应用而专门设计的硬件芯片,有很强的实时性。但在实际应用中存在开发周期相对较长、成本高、适应性和灵活性差等缺点。

  4) 现场可编程门阵列( FPGA) 。FPGA 由多个可编程的基本逻辑单元组成的一个 2 维矩阵,逻辑单元之间以及逻辑单元与 I/O 单元之间通过可编程连线进行连接。FPGA 能在设计上具有很强的灵活性,集成度、工作速度也在不断提高,可实现的功能也越来越强; 同时其开发周期短,系统易于维护和扩展,能够大大地提高图像数据的处理速度。

  实时图像处理系统中,底层的信号数据量大,对处理速度的要求高,但运算结构相对比较简单,适合采用 FPGA 以硬件方式来实现; 高层处理算法的特点是处理的数据量相对较少,但算法和控制结构复杂,可使用 DSP 来实现。所以,可以把二者的优点结合在一起以兼顾实时性和灵活性。

  USB、串口、并口是计算机和外设进行通讯的常用接口,但对于数据量大的图像来说,串行 RS - 232 协议难于达到图像采集实时性要求。USB 口即使能满足所需速度,但要求外设必须支持 USB 协议,而 USB 协议与常用工程软件的接口还不普及。 IEEE - 1394 接口具有廉价,速度快,支持热拔插,数据传输速率可扩展,标准开放等特点,在众多领域得到了广泛的应用。但随着数字图像采集速度的提高、数据量的增大,原有的标准渐难以满足需求。为了简化数据的连接,实现高速、高精度、灵活、简单的连接,在 National Semiconductor 公司等多家相机制造商共同制定推出了 Camera Link 标 准。Camera Link 是专门为数字摄像机的数据传输提出的接口标准,专为数字相机制定的一种图像数据、视频数据控制信号及相机控制信号传输的总线接口,其最主要特点是采用了低压差分信号 ( LVDS) 技术,使摄像机的数据传输速率大大提高。

  2 表面缺陷检测图像处理和分析算法

  2. 1 图像预处理算法

  工业现场采集的图像通常包含噪声,图像预处理主要目的是减少噪声,改善图像的质量,使之更适合人眼的观察或机器的处理。图像的预处理通常包括空域方法和频域方法,其算法有灰度变换、直方图均衡、基于空域和频域的各种滤波算法等,其中直观的方法是根据噪声能量一般集中于高频,而图像频谱则分布于一个有限区间的这一特点,采用低通滤波方式进行去噪,例如滑动平均窗滤波器、Wiener 线性滤噪器等。上述各种滤波方法中,频域变换复杂,运算代价较高; 空域滤波算法采用各种模板对图像进行卷积运算。直接灰度变换法通过对图像每一个像素按照某种函数进行变换后得到增强图像,变换函数一般多采用线性函数、分段线性函数、指数函数、对数函数等,运算简单,在满足处理功能的前提下实时性也较高。近年来,数学形态学方法[43-44]、小波 方 法[45-47] 用于图像的去噪,取 得 了 较 好 的效果。

  2. 2 图像分割算法

  图像的分割是把图像阵列分解成若干个互不交迭的区域,每一个区域内部的某种特性或特征相同或接近,而不同区域间的图像特征则有明显差别。它是由图像处理到图像分析的关键步骤。现有的图像分割方法主要分为基于阈值的分割方法、基于区域的分割方法、基于边缘的分割方法以及基于特定理论的分割方法等。近年来,研究者不断改进原有的图像分割方法并把其他学科的一些新理论和新方法用于图像分割,提出了不少新的分割方法。图像分割后提取出的目标可以用于图像语义识别、图像搜索等领域。

  2. 2. 1 基于区域的分割算法

  基于区域的分割算法包括阈值分割法、区域生长法和聚类分割法等。

  阈值分割法是一种传统的图像分割方法,其基本原理是: 通过设定不同的灰度阈值,把图像像素点分为若干类。因其实现简单、计算量小、性能较稳定而成为图像分割中最基本和应用最广泛的分割方法,其中阈值的选取是图像阈值分割方法中的关键。

  关于阈值的确定方法,目前比较常用的有固定阈值法、自适应阈值法、多区域阈值法等。固定阈值分割算法实时性强,适用于图像背景和目标灰度值区别明显的情况; 自适应阈值分割算法,适用于目标与背景的灰度值区别不明显的情况; 多区域阈值法,适用于目标与背景在不同区域区别较大的情况。

  Otsu 提出了动态门限方法[48],它以目标和背景之间的方差最大来动态地确定图像分割门限值,但当目标的相对面积较小时,此方法性能不佳。Pun 和 Kapur 等人提出了利用最大先验熵选取阈值的方法[49-50],从信息论的角度选择阈值,在一定程度上克服了上述算法的缺点,但当图像背景复杂时分割时容易丧失部分信息,且计算量较大。

  Yen 等人提出了利用最大相关性原则取代常用的最大熵原则来选取阈值的方法[51],以及基于一维或 2 维直方图的阈值方法[52-54]、最小误判概率准则下的最佳阈值方法[55]在其后也被提出。

  区域生长法的基本思想是依据一定的生长准则,将若干个“相似”子区域聚合成较大的区域。它首先对每个需要分割的区域找到一个种子像素作为生长的起点,再将种子像素邻域中与其具有相同或相似性质的像素根据某种事先确定的准则合并到种子像素所在的区域中; 将这些新像素当作新的种子像素继续像上面的操作,直到再没有满足条件的像素可包括进来。此法原理简单,对于较均匀的连通目标有较好的分割效果; 缺点是依赖于初始条件的选取,计算量较大,不适用于实时检测。

  分裂—合并法也是一种基于区域的分割算法,其基本思想是: 根据图像和各区域的不均匀性,将图像或区域分裂成新的子区域,再将包含相同内容的区域合并成新的较大区域,最后得到分割图像。四叉树分解是一种常用的分裂—合并法,其具体过程是: 将图像分成 4 块大小相等的方块,判断每个小块是否满足一致性标准( 如两区域参数统计特征结果相同,等等) 。若满足,则不再分解; 若不满足,则再细分成四块,再用细分块进行一致性标准检查,直到满足一致性标准,结果可能包含大小不同的块。

  聚类法进行图像分割是根据图像在特征空间的聚集对特征空间进行分割,再映射到原图像空间得到分割结果,K 均 值 聚 类 算 法、模 糊 C 均 值 聚 类 ( FCM) 算法[56 - 57]是常用的聚类算法。

  2. 2. 2 基于边缘的分割方法

  基于边缘的分割方法其实就是根据图像中局部特性的不连续性而采用某种算法来提取出图像中的对象与背景间的交界线。

  相关知识推荐:论文发表sci期刊需要多久

  边缘处像素的灰度值不连续,这种不连续性可通过求导来检测。经典的边缘检测算法一般采用微分的方法进行计算,常用的一阶微分边缘检测算子有 Robert 算子、Sobel 算子、Prewitt 算子、Kirsch 算子等几种。一阶微分算子方法计算简便、速度快,但定位不准确。二阶微分算子主要有 Canny 算子、Log 算子、Laplacian 算子,这类算子基于一阶导数的局部最大值对应二阶导数的零交叉点这一性质,通过寻找图像灰度的二阶导数的零交叉点从而定位边缘。二阶微分算子方法边缘定位准确,但对噪声敏感。对于噪声污染的图像,在进行微分算子边缘检测前一般先要滤波,但滤波的同时也使图像边缘产生一定程度的模糊。Marr 算子将噪声滤波与边缘提取相结合,但当模板较小时抗噪性能不良,模板较大时计算费时。

  2. 2. 3 基于特定理论的分割方法

  随着数学和人工智能的发展,出现了一些新的边缘检测方法,如数学形态学法、小波变换法、人工神经网络法、遗传算法、基于模糊理论的算法等。 20 世纪 90 年代初,Mallat 在图像多分辨分析理论的基础上,提出了小波变换局部模极大值边缘检测方法[58-59],在噪声图像中取得了较好的边缘检测效果。后来,人们在 Mallat 理论框架下,提出了多尺度边缘检测方法[60]。多尺度边缘检测方法主要思想在较大的尺度下能对边缘精确检测,而在较小的尺度下能对边缘点精确定位。小波变换的突出优点是其多分辨率,图像的每个尺度的小波变换都提供了一定的边缘信息。小波分析在时域和频域都具有良好的局部化性质,可聚焦到对象的任意细节,是图像处理领域的热点。虽然人们提出了多种的边缘检测方法[61-62],但边缘检测时抗噪性和检测精度的矛盾仍然是要研究的重点内容之一。

  基于数学形态学边缘检测方法[63-64]的基本思想是用具有一定形态的结构元素提取图像中的对应形状,以达到对图像分析和识别的目的。采用多结构元素的数学形态学算法,既能提取细小边缘,又能很好的抑制噪声,结构元素选取灵活,但在灵活的同时也导致算法的适应性变差。

  近年来有一些新的研究手段如神经网络、遗传算法和小波方法等被引入到图像分割的阈值选取中[65-69],其效果仍在探索之中。

  虽然有许多图像分割的方法,这些算法的共性问题在于分割精度与抗噪性的矛盾,同时,高实时性处理算法的研究远远滞后于通用图像处理算法的研究,应用于实际生产中的一些算法在准确性、实时性和可操作性上也还存在较大的困难。至今,图像分割算法大都是针对具体问题所提出的,虽然每年都有新的图像分割算法提出,但是并没有一种通用的算法能适用于所有的图像分割处理。——论文作者:汤勃,孔建益,伍世虔

全学科期刊推荐 中英文发表指导

* 稍后学术顾问联系您

学术顾问回访> 详细沟通需求> 确定服务项目> 支付服务金> 完成服务内容

SCI期刊

国际英文期刊

核心期刊

国外书号出书

国内纸质出书

2023最新分区查询