提高分类的数据融合技术在X射线检查

提高分类的数据融合技术在X射线检查

摘要。
DS证据(DS)证据理论的发展,作为处理不确定,不准确,不完整的信息,试图克服的限制,传统的概率论。在本文中,我们提出了一个分类系统,这种融合理论的基础上。该系统的性能评价在2D和3D透视数据。得到的结果是非常有前途的,并鼓励我们在其他应用程序中使用这个系统,即超声数据进行分类。

1。介绍

X射线检查是一种传统的非破坏性的测试方法进行全面测试 工业零部件,如铝铸件在汽车行业。安全规范。 和质量控制的任务是检查过程中的主要焦点。数字图像 处理,计算智能和硬件的进步使这项任务自动化。 虽然真正的缺陷的检测是客观的,在X射线检查的一个主要的困难 检测的误报(或错误的缺陷),特别是如果是非常小的,低对比 缺陷被检测到。因此,减少了良好的部件,而不抑制比 缺少真正的缺陷的风险是一个严峻的挑战。 自动检测和识别的缺陷,需要计算机图像 处理,图像分析和决策过程。的图像处理的步骤是关键 检测潜在的缺陷。在所述图像分析步骤,特征提取进一步 分类之间真正的缺陷,TD和虚假的缺陷FD。我们的干预是在 分类步骤,在数据融合理论的基础上,我们制定了具体的方法 不同来源的信息结合在一起,以便改善真 真正的缺陷分类率和误报。为了使不同的融合 可能的源,从源空间的过渡到一个共同的空间被称为“质量 值“空间的地方。我们提出了一个完全自动的质量,价值归属 没有必要对专家的监督程序。分类器的性能进行量化 在正确分类率分别为真正的缺陷和误报, 使用受试者工作特征曲线(ROC)。所开发的分类 从分段系统,被称为数据融合的分类器(DFC),是用来区分缺陷 二维X光图像和3D-CT卷在这两种情况下,它给了高精确度和 可靠的决策。

在接下来的部分,数据融合理论的介绍,然后第3节描述的分类算法。在第四部分恢复之后,应用程序和结果。第五部分介绍了在讨论和未来的改进。

2。数据融合

数据融合发现有用的应用程序在多源环境中,当数据是不确定的,不精确的,那里有丢失数据的可能性。在决策过程中,应用数据融合的目的是建立一个更加有针对性的决策。的普遍关注,是成功的一个元素x分类为一类次法眼的框架,利用信息FJ提供的资源j。

2.1普林西比

最常用的模型在数据融合中的概率方法,可能的方法和证据理论(DS证据理论)。这些理论的不确定性表示,通过信任措施的不完善信息。对于每个类Ci,值M(C I / FJ(x))的表示这样的事实给予的信心,一个
元素x属于一类次,使用FJ源j所提供的信息。的数据融合过程包括三个步骤,在图1中示出。

图1。数据融合过程步骤:知识建模,结合信任和决策[1]。

前处理的目的是提取的参数的x。所选择的参数必须是相关的目标。在一些应用中,如铸造缺陷,专家的选择可以作为我们选择的重要参数。的类,这些类提供识别框架,必须对应的应用程​​序的需求,并根据问题的类型,这些类可以是独占的(一个真正的和其他假)或(中间的符号OR)。
M(次)的措施,使我们能够量化的假设,即一个元素x是类词的信心。信任措施提出的每一个理论融入共同的数学框架,但靠自己的能力来模拟一些细微的语言(概率,真实性,信仰,必要性,可信性)区分。在接下来的步骤中,我们结合各种来源的信心措施用于获得单一的一套信任措施。最后,根据对决策的标准,我们选择的类,它有最高的信心。

在接下来的部分,Demspter-Shafer理论(也称为证据理论)。

2.2证据理论

DS证据理论(DS),[2] [3],是一个总体框架,它提供了更多的灵活性概率论。它适合与不确定性的原因,并可以区分的不确定性和不精确性。这是这样实现的特定的,使得能够处理复合假说。 DS理论也适用于从不同的来源的信息相结合。对于一个给定识别框架的类或假设(一组),DS理论的特殊性,是任何来源的信息,可以给一块的证据的任意子集,它可以是一个简单的假设Hi或简单的联合假设。此外,这些假设并不一定是独家的,例如: {朋友,敌人,中立};因此,2的应用程序,因为它包含的所有命题的信息源可以提供证据的工作空间。信息来源识别框架的子集分配质量值

推导的质量分布是最重要的步骤,因为它代表了知识的实际应用中,以及在所选择的信息源引入的不确定性[4]:
0M(A)1,前面已经提到过,一个信息源的质量值分配到任何假设。也就是说,如果一个信息源无法区分两个命题Ai和Aj,它分配一个质量值的设置包括两个命题(艾AJ)。

2.3融合过程

登普斯特的组合规则提供了一个数学关系的措施结合在一起的信心(称为大规模值)从不同的信息来源。为m1,m2,从两个不同的源的质量分布相结合与登普斯特正交规则(结膜的组合)。

其中,K是信号源之间的冲突的措施,在这个方程中,它被引入作为归一化因子。较大的K时,更多的来源是冲突和感少它们的组合。因此一些学者,特别是Smets [5],需要使用Dempster组合规则没有正常化。事实上,当K增大时,熔化的质量增加,虽然它是不相关的增加的信心。出于这个原因,当使用归一化的规则,冲突ķ必须被包括在决定标准。

这是可能的,以显示,通过连续的组合的质量值的迭代,登普斯特强度的操作员的确定性[6]。换句话说,当两个独立的传感器的动作导致喜欢一个假设,在此假设授予的信任将合并,这不一定是贝叶斯概率的情况下与后大。

3。分类算法:数据融合分类(DFC)

问题是每个检测到的对象进行分类,这两个类的:在一个缺陷(TD)或假缺陷(FD)。在Dempster-Shafer理论的框架,这三个假设:H1:这个对象是一个缺陷H2:该对象是一个虚假的报警H3 = H1H2:无知

检测到的对象都是通过列表的几何和灰度级为基础的功能。每个测量的功能被认为是一个信息源,而预期的组合中的两个或两个以上功能的提高分类性能。为了结合起来,功能值必须转化为质量值,每一种假说识别框架。我们已开发出一种原始的方法,自动归属的质量值测量对检测到的对象的功能。实现的方法是使用每个功能直方图的信息来源。使用直方图功能的空间划分成区域,并指定这些地区的每一个相应的质量值的H1假设。补充至1的影响到H3的假说,并没有质量的被分配到H2期间组合,以避免任何冲突。地区之间的平滑过渡是通过使用模糊集,如介绍[4]。该方法可以被概括如下:

3.1学习一组已知的对象

特征提取和直方图计算
从功能区域:真正的缺陷比例P(I)计算在每个直方图区间i。一个区域被定义为一个稳定的真正的缺陷比例(通过一个标准上的p(ⅰ)的衍生物)
群众归属地:M(H1)= P(地区),M(H3)= 1 - M(H1),M(H2)= 0
不同群众的组合规则:归Demspter正交规则(成对,三个或全部功能)和统计规则(平均数和中位数群众)。 选择的最佳来源(成功源)相对于原来的外部
检查系统或整体破案率满足输入需求。

3.2未知物体的一组上的验证

特征提取只使用选定的来源
群众的归属
群众相结合
性能测试

[7]中给出了该方法的更详细的描述。

3.3措施

为了测量的性能的源极,一个阈值S被施加上的质量值m(H1)中的每个功能,和每一个组合后。米(H1)高于该阈值的对象的质量被认为是真正的缺陷,和其他为假。分类结果进行比较,以真正的专家作出的决定,下列税率计算:

- 正确的决策速度(PCD):数量的truedefectscorrectlyclassifiedfalsedefectscorrectlyclassified
PCDtotalnumberof truedefectsandfalsedefects

真正的缺陷分类率(PTD):真正的正确分类的缺陷数
PTD
真正的缺陷总数
- 虚假的缺陷分类率(PFD):

虚假缺陷正确分类数
PFD
虚假缺陷总数

4。应用程序和结果

我们测试建议的分类算法DFC上的二维X线数据集和三维计算机断层扫描(CT)数据集。在第一种情况下,DFC系统相比,自动透视(ISAR),开发的EZRT弗劳恩霍夫和用于生产的铸件射线的质量控制与智能系统。 ISAR系统的信息可以在参考文献[8]。在本文中,我们将恢复得到的结果。关于每个应用程序的详细说明,请参阅论文[9]和[10]。

4.1铸件射线照相数据集

此数据集提取工业铸件射线图像。分割后,检测对象的特点是由一组11个功能(如面积,对比度,音量,等等..)。每个对象都被归类到TD和FD手动的放射学专家,他的决定被视为真正的决定。数据集是由361对象。它包含231真正的缺陷包括TD氧化物,气体空隙和孔隙度和130虚假缺陷FD(参见图2)。该数据集被划分成两个部分,一个学习数据库(形成65 FD和115 TD),和测试数据集(形成65 FD和116 TD)。

图2。真或假的缺陷出现在红色矩形区域作为一个更光明的。的左侧出现一个真正的缺陷,并在右侧出现的人为检查部分的结构所造成的。

首先,在学习过程中的学习数据集。然后,选择最好的来源,使整体分类率最高的R.之后的测试数据集被列为使用选定的最佳来源。他们的学习和测试数据集上的性能进行了比较ISAR的表现。结果恢复下令降低获得的测试数据集上的整体分类率R在下面的表1。

Source Learning process Testing process
R PFD PTD R PFD PTD
Mean Mass 0.992 1 0.991 0.97 0.974 0.953
DFC(MaxElongation & InOutContrast) 0.988 0.938 1 0.955 0.982 0.841
DFC(Depth2Thickness & InOutContrast) 0.997 0.98 1 0.941 0.964 0.846
ISAR 0.925 0.723 0.974 0.932 0.723 0.982


表1中。整体速率R表演2D铸件射线照相的分类利用ISAR和数据融合的分类。

4.2铸件三维CT数据集

三维CT数据集是铝铸件。它包含442对象(或潜在缺陷)专家真假缺陷分类(见图3)。只有44的对象是真正的缺陷,其余的398对象都是假的缺陷,因此该数据集很不平衡。存在的缺陷是从不同的类型:孔隙率,裂缝和空隙。假缺陷是由于噪声,CT文物和作为潜在的缺陷的结构元件的分割。自动分类的目的,是衡量每个对象总数的30功能。这些功能代表了输入信号源的DFC的信息系统自动分类条目对象为真或假的缺陷。

对于学习和测试过程中,完整的数据集分为:
- 学习数据集:226潜在的缺陷包括:200个假警报和26个真正的缺陷。

图3。从三维CT卷提取的切片视图的零件:一个真正的缺陷(表面缺陷)的左侧显示为较暗的区域,并在右侧的一个假警报(重建人工制品)出现时,较暗的区域,以及作为。

DFC系统的结果列于表2通过降低R.订购

Source Learning process Testing process
R PFD PTD R PFD PTD
Median Mass 0.99 0.97 1 0.97 0.89 1
DFC(features 15 & 23) 0.88 1 0.84 0.63 0.99 0.5

 

5。讨论和观点

首先,利息,这种分类的方法是,它是完全“透明”的,
即如神经网络技术,例如,它不是一个黑盒子。分类得到的结果非常好,在比较证明上的二维数据(没有实际的系统的3D数据)的实际的工业系统。这一点尤其明显的误报的分类率大大提高了数据融合系统。关于组合规则,实际上平均数或中位数的质量出现好转,DFC组合,可能是因为使用的所有功能,而与的登普斯特谢弗规则,使用的所有功能下降的表现。 Dempster组合规则的合并来源,其行为与一个完整的分析不在本文的讨论范围。值得一提的是,翻译任何功能到一个共同的空间,让他们的组合(使用的统计规则,或正交和登普斯特)的质量属性的方法(可以比作一个信心的措施)是一个非常有用的工具。我们目前的工作是类似的方法应用到其他的三维数据,即从复合材料超声波检测。

参考文献

[1]杜普伊斯。 O.,“融合恩特雷里奥斯LESdonnéesultrasonores和图像radioscopie一个高级解决方案::应用非盟控制的警戒线soudure”。融洽的这些研究所国家科学Appliquées里昂,2000年。
[2]登普斯特A.,“上和下诱导的多值映射的概率”。数理统计年鉴。 38,325-339,1967。
[3]谢弗,G.,“证据”的数学理论。普林斯顿大学出版社,普林斯顿大学。页。 297,1976。

[4] Kaftandjian五等,“不确定性建模使用Dempster-Shafer理论,为提高检测的焊缝缺陷”。模式识别快报,第24卷,第547-564页,2003年。
[5]泰勒法则P.,“相结合,在传递信度模型”,IEEE证据。模式分析与机器智能,第12卷,N°5页。 447-458,1990。
[6] Gacogne L.,“元素logique floue”,巴黎:爱马仕。 ISBN 2-86601-618-1,1997。
[7]奥斯曼A.等,通过使用DS证据数据融合论“的”改进的X射线铸件检验的可靠性。模式识别快报32,页168-180,2011。
[8]福克斯T. U.,Huetten U.,哈斯勒和Wenzel T.,“一个新的系统,全自动铝铸件的”数字平板探测器的X光片检查。第9届欧洲无损检测会议(ECNDT),2006年九月25号至29日,德国柏林。
[9]奥斯曼A.等,“应用程序的数据融合理论与支持向量机的X-RAY铸件检验”。 :非破坏性检测,莫斯科2010年6月7-11日第10届欧洲会议。
[10]奥斯曼A等人,“三维分割的CT数据,采用数据融合和支持向量机”的自动分类。第10届国际会议的的人工视觉QCAV'2011,2011年6月28日至30日,法国Saint-Etienne的质量控制。


TAG:

在线客服

技术支持
点击这里给我发消息
产品咨询
点击这里给我发消息