哈尔滨工业大学学报  2018, Vol. 50 Issue (10): 72-78  DOI: 10.11918/j.issn.0367-6234.201711013
0

引用本文 

张江梅, 季海波, 王坤朋, 冯兴华. 稀疏表示与多任务学习的复杂核素识别[J]. 哈尔滨工业大学学报, 2018, 50(10): 72-78. DOI: 10.11918/j.issn.0367-6234.201711013.
ZHANG Jiangmei, JI Haibo, WANG Kunpeng, FENG Xinghua. Sparse representation and multi-task learning based complex nuclide identification[J]. Journal of Harbin Institute of Technology, 2018, 50(10): 72-78. DOI: 10.11918/j.issn.0367-6234.201711013.

基金项目

国家自然科学基金(61501385);四川省科技支撑计划(2016GZ0210);四川省科技厅应用基础项目(2016JY0242)

作者简介

张江梅(1975—), 女, 副教授;
季海波(1964—), 男, 教授, 博士生导师

通信作者

张江梅, zjm@swust.edu.cn

文章历史

收稿日期: 2017-11-04
稀疏表示与多任务学习的复杂核素识别
张江梅1,2, 季海波1, 王坤朋2, 冯兴华2     
1. 中国科学技术大学 信息科学技术学院,合肥 230027;
2. 西南科技大学 信息工程学院,四川 绵阳 621010
摘要: 为提高核探测器在复杂环境下测量的适应性,提出了一种能谱校正和核素识别方法.针对核信号探测过程中,由于环境温度的交替变化会出现γ能谱偏移导致多核素识别率低的问题,提出了一种基于稀疏表示和多任务学习的核素识别方法.首先建立一个用于描述环境变量对于当前测量能谱影响的迁移矩阵,其次对测量能谱进行建模,该模型可以表示为标准能谱中独立核素能谱的瞬时叠加,由此核素识别问题就转化为多种核素能谱稀疏分解的问题,为求解该非凸优化问题采用交替方向乘子法(ADMM)的多任务学习方法同时优化迁移矩阵并进行稀疏分解,实现多核素识别.为验证该方法的可行性和有效性,利用高低温交变试验箱对CsI(Tl)探测器的测量环境进行模拟,分别测量得到11种核素和典型混合核素的实际放射性元素能谱数据,以及基于蒙特卡洛分析软件Geant4仿真IAEA规定的27种核素的单一与混合核素数据进行实验.结果表明,提出的方法即使在温度为:-20℃~50℃的环境下依然可以准确地识别多种常用核素.
关键词: 核素识别     能谱校正     多任务学习     稀疏表示     ADMM    
Sparse representation and multi-task learning based complex nuclide identification
ZHANG Jiangmei1,2, JI Haibo1, WANG Kunpeng2, FENG Xinghua2     
1. School of Information Science and Technology, University of Science and Technology of China, Hefei 230027, China;
2. School of Information Engineering, Southwest University of Science and Technology, Mianyang 621010, Sichuan, China
Abstract: A spectra calibration method and a radionuclide identification method are developed for the improvement of the adaptability to the nuclear detector measurement in complex environment. In view of the low identification rate of multiple nuclides caused by γ-ray energy spectrum shifting with temperature change, we propose a radionuclide identification method based on sparse representation and multi-task learning. Firstly, a transfer matrix was constructed to represent the environment variation affecting currently measured spectra. Then, the model of the measurement spectra was established, which was used to describe the instantaneous superposition of scale copies of individual nuclide sub-spectra in standard spectra library. Thus, the problem of radionuclide identification was transformed into the problem of sparse decomposition of various radionuclides. In order to solve this non-convex optimization problem, the multi-task learning method based on alternating direction multiplier method (ADMM) was developed to optimize the transfer matrix and decompose the sparse matrix simultaneously. The feasibility and effectiveness of the developed method were verified by some experiments, in which the measurement environment of CsI (Tl) detector was simulated by using the programmable temperature and humidity chamber and the real radioactive spectrum data of 11 kinds of nuclides and typical mixed nuclides were measured, respectively. Meanwhile, the single and mixed nuclide data of 27 kinds of nuclides were used, which are specified by the simulation IAEA of Monte Carlo analysis software Geant4. The experiment results show that the developed method can accurately identify a variety of commonly used nuclides even at temperature range of -20~50℃.
Keywords: nuclide identification     spectra calibration     multi-task learning     sparse representation     ADMM    

基于闪烁晶体的核素识别仪在特种核素材料(special nuclide material, SNM)检测、国土边境监控、高能物理测量和核医学设备[1-10]等应用中有着广泛应用.环境中温度的改变会影响闪烁晶体(例如:NaI(T1)、CsI(T1)、BGO、LaBr3)发出的光子数量及能量分辨率.以CsI(T1)探测器为例,当温度变化4.7 ℃时,探测频谱大概会漂移20个能谱通道[11],这种影响会对能谱处理和核素识别造成较大影响.

传统的特征峰匹配方法[5]对能谱精度有较高的依赖性,而且需要能谱校准才能达到良好的核素识别效果.通常有3种校准γ能谱的方法:直接校准法、有效校准法[6]和数字脉冲波形分析法[4](PSA).直接校准法需要一个标准源(例如铀、钍或40K)进行能谱刻蚀;有效校准法在测量绝对效率曲线时,可使用任何具有放射性γ射线的源进行校准,但此类方法会花费大量的时间,并不适用于温度环境变量迅速变化的探测情形.基于数字PSA的校准方法可以直接补偿能谱输出增益的漂移,但需要测量晶体内部的实际温度,限制了该方法的实际应用范围.

通常情况下很难测量出晶体内部敏感单元状态改变所造成的影响,但对在复杂环境测量条件的能谱校准来说,这种影响因素的测量又十分重要.近年来,Oczkowski[6]提出基于数据建模的校准迁移方法来解决该问题,并成功应用于近红外线(NIR)光谱校准中.该方法需要用受到测量环境干扰的采样去更新迁移模型,之后用Tikhonov正则化(TR)优化预测模型中的参数,例如岭回归(RR)和LASSO(least absolute shrinkage and selection operator)等方法[7-8].本文用一个迁移矩阵对环境变量的影响进行建模,并且矩阵会随外部测量条件的改变而改变,该迁移矩阵可以利用历史采样数据通过稀疏学习得到.然而,用于更新迁移矩阵的不同环境下的历史能谱信息,通常难于获取且需要花费大量时间,并由于环境本底噪声污染的影响能谱分辨率也会大幅降低,很难从能谱中得到迁移矩阵的准确估计.

1 核素识别模型及问题描述

为解决迁移矩阵的学习问题,受LLS(library least-squares)[9-10]启发,首先,引入一个基于稀疏表示的识别模型,给定一系列标准放射核素的能谱{siRM, i=1, …, N}.标准能谱矩阵可表示为:S =[s1, …, sN], SRM×N,式中,MN分别为谱仪中特征能量的数量,分别对应于相关的放射性同位素.

然后,测量能谱y =(y1, …, yM)T的模型可以表示为标准能谱矩阵S中大量独立核素能谱的线性组合,即

$ \mathit{\boldsymbol{y}} = \mathit{\boldsymbol{S}}x + \mathit{\boldsymbol{b}}. $ (1)

式中: b =(b1, …, bM)T为本底放射能谱;x =(x1, …, xN)T表明了放射性核素的“数量”.迁移矩阵FRM×M可用于描述由环境变量影响的能谱漂移,实际转换的标准能谱为:S ′= FS.在特定的环境下,仅用S ′中少量元素即可表示测量能谱y,因此,可以从方程y - Sx = b ′中得到向量x的稀疏分解来完成核素识别.能量通道数量M通常是1 024、2 048、4 096、8 192,因此对于矩阵F和向量x中的元素优化是一个十分耗费时间的过程.

为加速能谱迁移矩阵的优化和稀疏分解,本文将该过程分解为多个独立任务,因此每个任务样本的维度相对较小,即采用多任务学习算法,可同时解决预测矩阵的优化问题和稀疏分解问题.近年来,多任务学习在机器学习领域已取得较大进展[12],该方法将复杂的学习任务分解为若干子任务,可以对每个子任务更好的建模,已广泛应用于许多实际场景,例如:生物信息学、视频分类和工业检查等.

给定一个M道多道分析仪(MCA),测量能谱y可以被分解成两个独立的组:待测核素Sx和本底辐射b.将标准能谱S中的si, i=1, …, N和背景环境辐射能谱视作两个独立过程,对si进行建模,可以用实际放射源测量或者用蒙特卡罗方法计算得到,例如文献[11, 13]等.

通常来讲,每个放射性核素γ能谱均包含多个特征峰,可将核素放射出的γ射线看作单能γ源的叠加(例如,137Cs可以被当做两个单能γ射线放射源,它们分别是661.657 keV和283.500 keV;60Co则由6种单能源组成如1 173.000 keV,1 333.000 keV,826.100 keV等)[14].因此,标准能谱矩阵S可以看作N组子能谱的线性组合,这些子能谱由单能γ源放射出来,例如S可被写为

$ \mathit{\boldsymbol{S}} = \left( {\underbrace {s_1^1, \cdots ,s_{{J_1}}^1}_{{{60}_{{\rm{Co}}}}}, \cdots ,\underbrace {s_1^N, \cdots ,s_{{J_N}}^N}_{{{137}_{{\rm{Cs}}}}}} \right), $ (2)

式中: sji=(sj, 1i, …, sj, Mi)TsjiRM为第i个放射核素的第j个子能谱,其中i=1, …, N, j=1, …, JiJi为第i个能谱中特征峰的数量.

另外,b中将探测器内部和外部的放射性分别视为非易变性放射性和易变性放射性.非易变性部分u =(u1, …, uM)T可以在一个封闭铅体容器中测量.测量能谱模型可以写成子能谱和b的非易变性部分的线性组合,式(1)可改写为

$ \begin{array}{l} \left[ {\begin{array}{*{20}{c}} {{y_1}}\\ {{y_2}}\\ \vdots \\ {{y_M}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {s_{1,1}^1}& \cdots &{s_{{j_i},1}^i}& \cdots &{s_{{j_N},1}^i}&{{u_1}}\\ {s_{1,2}^1}& \cdots &{s_{{j_i},2}^i}& \cdots &{s_{{j_N},2}^i}&{{u_2}}\\ \vdots&\vdots&\vdots&\vdots&\vdots&\vdots \\ {s_{1,M}^1}& \cdots &{s_{{j_i},M}^i}& \cdots &{s_{{j_N},M}^i}&{{u_M}} \end{array}} \right] \cdot \\ \;\;\;\;\;\;\;\;\;\;\;\left[ {\begin{array}{*{20}{c}} {x_1^1}\\ \vdots \\ {x_{{j_i}}^1}\\ \vdots \\ {x_{j,N}^N}\\ {x_u^{N + 1}} \end{array}} \right] + \left[ {\begin{array}{*{20}{c}} {{v_1}}\\ {{v_2}}\\ \vdots \\ {{v_M}} \end{array}} \right]. \end{array} $ (3)

式中:向量x =(x11, …, xJ11, …, x1N, …, xJNN, xuN+1)T,并且xRJ, $J = \sum\limits_i^N {{J_i} + 1} $,非零元素xuN+1为背景辐射的非易变部分的幅度;u =(u1, …, uM)T为背景辐射非易变部分子能谱,标准能谱矩阵可表示为:Φ =(S, u).

由于v的低能连续部分在处理过程中大部分可以被平滑函数[15]滤除,这里可以将v近似看作高斯随机过程.从式(3)中可以看出,x中仅有少量元素为非零元素.核素识别问题可以转化成从x的元素中估计少量非零元素的问题.即y可以被分解成若干个Ф中少量向量的线性叠加,从高维向量空间中得出稀疏向量的问题叫做稀疏分解问题,该方法已经被广泛的应用于信号探测、压缩感知、图像处理、音频处理以及文件分析等[16].

向量x可通过l2范数和l1范数估计出来,该稀疏分解问题可表示为

$ \mathop {\min }\limits_{x \in {R^M}} \frac{1}{2}\left\| {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{ \boldsymbol{\varPhi} x}}} \right\|_{{l_2}}^2 + \lambda {\left\| \mathit{\boldsymbol{x}} \right\|_{{l_1}}}, $ (4)

式中:λ>0为权衡系数,通过调整该系数可以在能谱保真度和稀疏度之间进行均衡.

但是,测量过程中环境因素可能导致能谱矩阵Ф漂移,进而导致稀疏分解模型失效.本文采用一个迁移矩阵F来根据当前环境去校正能谱矩阵Ф,该过程可表述为:

(5)

式中:矩阵FRM×M为迁移矩阵,当幅度变量被忽略时,该矩阵为主次对角元素非零的平移矩阵.当且仅当当测量环境条件保持不变的情况下,矩阵F为单位矩阵.

如果能谱向左偏移,那么F是一个上对角矩阵,Ud=[δi+d, j],当能谱向右偏移,F是一个下对角矩阵, Ld=[δi, d+j],其中δ为Kronecker符号,i, j=1, …, M, d=1, …, M-1.直接对F进行学习十分困难,因为探测器内部状态很难被准确测量.在大多数情况下,结合以下几种物理事实可以得到一个满意的解:

1) 一个放射性核素经常放射出少量的特征射线,并且这些特征射线的能量间隔是相对稳定的;

2) 由探测器材料所产生的γ射线可以被检测并识别;

3) 环境变量对不同特征峰的影响是一致的,尽管它们之间表现出弱非线性关系.

因此,式(4)所述的核素识别稀疏分解问题可重述为

$ \mathop {\min }\limits_{\mathit{\boldsymbol{x}} \in {R^M},\mathit{\boldsymbol{F}} \in \mathscr{F}} \frac{1}{2}\left\| {\mathit{\boldsymbol{y}} - \mathit{\boldsymbol{F \boldsymbol{\varPhi} x}}} \right\|_{{l_2}}^2 + \lambda {\left\| \mathit{\boldsymbol{x}} \right\|_{{l_1}}}, $ (6)

式中:可行域$\mathscr{F} = \left\{ {\mathit{\boldsymbol{I}},{\mathit{\boldsymbol{U}}_d},{\mathit{\boldsymbol{L}}_d}} \right\}$.

由于矩阵F的特殊结构,式(6)中的目标函数不再是凸的,直接求解非凸优化问题计算复杂度较高,并且很容易陷入局部最值问题.当F确定时,通过搜索每个次对角线,可以将目标函数的优化过程转化成多个凸优化问题.如图 1所示,每个子能谱对应的偏移矩阵sji不尽相同,因为在环境变量和探测器分辨率有限的影响下,特征峰之间存在弱非线性关系.

图 1 迁移矩阵组 Figure 1 Projection matrix group

本文通过对特征峰对应的迁移矩阵进行分组来消除这些差异带来的影响,每一组迁移矩阵可以被看作是同一环境差异造成的.优化过程就可以被分解成多个任务,一系列预测矩阵可以被这些任务同时进行学习.如式(6)所描述的优化过程可以分别用ADMM(alternating direction method of multipliers)[17]完成.

2 基于多任务学习的核素识别算法

如式(6)中最小化稀疏分解目标函数优化,通常需要采用非凸优化方法,存在计算复杂度高且容易陷入局部极小值的问题.本文将该优化问题转化成基于多任务学习的多个小的局部优化问题进行求解.

2.1 按γ射线能量Φi进行分组

图 2所示,优化过程按照特征峰对应能量将标准能谱中的子能谱Φi, i=1, …, J分为K个组,每组的x中有Mk个元素需要被优化,$\sum\limits_{k = 1}^K {{M_k}} = M$假设探测器的能量响应范围为Ξ=(εL, ϵH),通过线性划分能量响应范围可得到每个能量组的区间.

图 2 基于多任务学习的稀疏分解示意 Figure 2 Multi-task learning based sparse decomposition
2.2 子任务中迁移矩阵的优化

在每个组Gk, k=1, …, K,线性搜索方法被用于最小化式(6)中的gk*={dk, xk},其中dk为标准测量环境的偏差度,定义

$ {d_k} = \left\{ \begin{array}{l} + d,{\rm{if}}\;\mathit{\boldsymbol{F}} = {U_d};\\ - d,{\rm{if}}\;\mathit{\boldsymbol{F}} = {L_d};\\ 0,{\rm{if}}\;\mathit{\boldsymbol{F}} = I. \end{array} \right. $ (7)

由于矩阵F的特殊结构,通过平移标准能谱矩阵,必定可以找到矩阵F的一个可行解.利用xk作为辅助信息对{dk, k=1, …, K}进行搜索的方法找到可行解xk.该方法基于在上述提到的物理事实,可描述为

$ d_k^ * = \left\{ \begin{array}{l} {d_k},\left| {{d_k} - \bar d} \right| \le {\delta ^ * };\\ \bar d,{\rm{otherwise}}. \end{array} \right. $ (8)

式中:$\bar d = \left( {\sum\limits_{K = 1}^K {{{\left\| {{x_k}} \right\|}_{{l_0}}}} \cdot {d_k}} \right)/{N_d}$${N_d} = \sum\limits_{K = 1}^K {{{\left\| {{x_k}} \right\|}_{{l_0}}}} $δ*dk的不确定性,这种不确定性主要由探测环境变化时探测器的非线性所导致.每组的迁移矩阵Fk可由{dk*, k=1, …, K}得到.

2.3 并行ADMM协同优化

当逐一处理子问题时,整个优化过程很容易陷入局部最小值,因此,本文提出使用ADMM方法以协同的方式管理这些局部优化过程.这种算法将优化问题分解为多个小型容易解决的问题,原本是为了解决凸优化问题,目前也被广泛地应用于稀疏逻辑回归、子空间聚类、支持向量机等[9]领域.由于式(6)中的目标函数为非凸函数,本文提出一种带有收缩因子的并行算法.

当确定迁移矩阵F时,式(6)的优化转化为一个凸优化问题,在ADMM形式下,它可被写成:

$ \begin{array}{*{20}{c}} {{\rm{minimiz}}{{\rm{e}}_{x,z}}\left\{ {f\left( \mathit{\boldsymbol{x}} \right) + g\left( \mathit{\boldsymbol{z}} \right)} \right\},}\\ {{\rm{subject}}\;{\rm{to}}\;\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{z}} = 0.} \end{array} $ (9)

式中:f(x)= $\frac{1}{2}$yFΦxl22, g(z)=λzl1.

凸优化函数f(x)和g(z)相互独立,在ADMM策略下优化目标函数可表示为:

$ f\left( \mathit{\boldsymbol{x}} \right) = \sum\limits_{k = 1}^K {{f_k}\left( {{x_k}} \right)} ,g\left( \mathit{\boldsymbol{z}} \right) = \sum\limits_{k = 1}^K {{g_k}\left( {{z_k}} \right)} . $ (10)

式中:变量xkRMkx的子向量,式(9)的优化结果可以写成:

$ {q^ * } = \inf \left\{ {f\left( \mathit{\boldsymbol{x}} \right) + g\left( \mathit{\boldsymbol{z}} \right)} \right\}. $ (11)

另外,标准的能谱矩阵Φ可以写成以下形式:

$ \begin{array}{l} \mathit{\boldsymbol{ \boldsymbol{\varPhi} }} = \left[ {{\mathit{\Phi }_1},{\mathit{\Phi }_2}, \cdots ,{\mathit{\Phi }_K}} \right],\\ \mathit{\boldsymbol{F \boldsymbol{\varPhi} x}} = \sum\limits_{k = 1}^K {{\mathit{\boldsymbol{F}}_k}{\mathit{\boldsymbol{ \boldsymbol{\varPhi} }}_k}{\mathit{\boldsymbol{x}}_k}} , \end{array} $ (12)

式中:${\mathit{\boldsymbol{F}}_k} \in \mathscr{F}$为第k组对应的迁移矩阵.其增广拉格朗日方程可以写为

$ \begin{array}{l} {L_\rho }\left( {\mathit{\boldsymbol{x}},\mathit{\boldsymbol{z}},\mathit{\boldsymbol{w}}} \right) = f\left( \mathit{\boldsymbol{x}} \right) + g\left( \mathit{\boldsymbol{z}} \right) + {\mathit{\boldsymbol{w}}^{\rm{T}}}\left( {\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{z}}} \right) + \\ \;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\;\left( {\rho /2} \right)\left\| {\mathit{\boldsymbol{x}} - \mathit{\boldsymbol{z}}} \right\|_{{l_2}}^2. \end{array} $ (13)

ADMM的迭代步骤为:

$ \begin{array}{l} \mathit{\boldsymbol{x}}_k^{p + 1}: = {\left( {\mathit{\boldsymbol{ \boldsymbol{\varPhi} }}_k^{\rm{T}}\mathit{\boldsymbol{F}}_k^{\rm{T}}{\mathit{\boldsymbol{F}}_k}{\mathit{\boldsymbol{ \boldsymbol{\varPhi} }}_k} + \rho I} \right)^{ - 1}}\left( {{\mathit{\boldsymbol{ \boldsymbol{\varPhi} }}^{\rm{T}}}\mathit{\boldsymbol{F}}_k^{\rm{T}}{y_k} + } \right.\\ \;\;\;\;\;\;\;\;\;\left. {\rho \left( {z_k^p - w_k^p} \right)} \right),\\ z_k^{p + 1}: = {S_{\lambda /\rho }}\left( {z_k^p - w_k^p} \right),\\ w_k^{p + 1}: = w_k^p + x_k^{p + 1} - z_k^{p + 1}, \end{array} $ (14)

式中:Sk(·)为软阈值算子,它可以被看成是l1范数的近似操作,定义为

$ {S_k}\left( a \right) = \left\{ \begin{array}{l} a - k,a > k;\\ 0,\left| a \right| \le k;\\ a + k,a < - k. \end{array} \right. $ (15)

当迁移矩阵F固定时,ADMM满足残差和目标函数收敛条件(相关证明详见文献[17]),并且可在少数几次迭代中得到满意的解.终止条件可根据残差rkp=xkpzkp给出:

$ \begin{align} &{{\left\| r_{k}^{p} \right\|}_{2}}<{{\mathit{\pmb{\epsilon}} }^{\text{pri}}}=\sqrt{{{M}_{k}}}{{\mathit{\pmb{\epsilon}} }^{\text{abs}}}+ \\ &\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ {{\mathit{\pmb{\epsilon}} }^{\text{rel}}}\max \left\{ {{\left\| x_{k}^{p} \right\|}_{2}},{{\left\| z_{k}^{p} \right\|}_{2}} \right\}. \\ \end{align} $ (16)

式中:ϵabs>0为绝对误差;ϵrel为相对误差;ϵrel的典型值为10-3或10-4,而绝对误差值取决于环境参数变量的幅度.

为优化矩阵Fk,在ADMM迭代过程中引入一个收缩因子.因为对角线搜索空间受限于每个预测矩阵,在每个优化任务中,当ADMM达到稳定点时,引入对角线搜索因子.

假设初始搜索空间是Fk0= FFkp为第p次迭代过程的迁移矩阵,dkp为和主对角线元素之间的距离,如果在迭代中达到稳定点q*(p),那么就需要用到对角线搜索操作.搜索策略的几个步骤为:

Step1    沿着斜下方向进行双向对角线搜索,逐渐增加|dkp+1| = |dkp|+1,根据式(7)更新Fkp+1

Step2    将Fkp+1代入式(14),如果目标函数的值q(p+1)>q*(p),而且Fk ≠∅,将当前对角线用Fkp+1:= FkpFkp+1替换;

Step3    计算第(p+1)个平均值和{dk(p+1), k=1, …, K}的变化,即:

$ \begin{array}{*{20}{c}} {{\mu ^{\left( {p + 1} \right)}} = \frac{1}{K}\sum\limits_{k = 1}^K {d_k^{\left( {p + 1} \right)}} ,}\\ {{\delta ^{\left( {p + 1} \right)}} = \frac{1}{K}\sum\limits_{k = 1}^K {{{\left( {d_k^{\left( {p + 1} \right)} - {\mu ^{\left( {p + 1} \right)}}} \right)}^2}} .} \end{array} $ (17)

如果δ(p+1) < δ*,停止迭代,否则执行式(8)中定义的操作,之后重新回到Step1.

基于文献[17]的工作,本文将分析所提出的对角线搜索方法.假设稳定点q*(p)已经达到第p次迭代,然后,对dk(p+1)进行搜索得到新的最优值p(p+1).

3 结果与分析

为验证本文所提出方法的可行性和有效性,进行了仿真和实测数据两种实验方法.此处,采用多种常用放射源,包括5种特殊核材料(233U、235U、237Np、239Pu、241Pu),10种医用同位素(51Cr、67Ga、99mTc、103Pd、111In、125I、123I、131I、201TI、133Xe),9种工业同位素(57Co、60Co、133Ba、137CS、192Ir、152Eu、75Se、226Ra、241Am),3种自发辐射同位素(40K、232Th、238U)和本底放射性核素.本文使用的CsI(Tl)闪烁晶体探测器(直径25 mm,高度30 mm,在662 keV时能量分辨率为7%),多通道分析仪的能量通道数为4 096.

实验所用的源是从27个标准放射源中随机选取并且增加由天然存在的同位素所造成的本底辐射作为噪声,以验证算法的识别性能,用一组随机迁移矩阵来表示由于测量环境的改变所造成的能谱的差异.

3.1 模拟数据仿真

标准能谱矩阵Φ是有27种放射源S和环境背景噪声能谱u的非易变性部分构成,这个非易变性特征峰是由探测材料CsI(Tl)造成的.每个子能谱用蒙特卡罗软件Geant4进行计算,并且根据式(2)将这些能谱放在一起.在S的构造过程中,放射性核素分别被当作是单能γ射线源.对背景辐射能谱u中的非易变性部分进行精确的测量是十分困难的,由于其与探测器材料的形状以及分布有关.在本仿真中忽略该部分,并且设xuN+1=0,如图 3所示,这个模型可以用于表示在铝质圆柱壳体中的CsI探测器模型.点源被放置在探测器的前面,距离探测平面任意距离处,此时测量获取的子能谱可以被看成是纯净的, 例如235U和131I的子能谱如图 4所示.

图 3 在铝质圆柱壳体中的CsI(Tl)探测器模型 Figure 3 The model of CsI(Tl) detector with an aluminum cylindrical shell
图 4 235U和131I的子能谱(衰变概率>0.005%) Figure 4 Sub-spectra of 235U and 131I (intensity more than 0.005%)

根据式(3)的线性混合模型,测试数据可以从一个或多个由xsim随机选择的核素中获得,并且带有背景辐射能谱中的易变性部分v.能谱v是通过随机混合自然发生辐射的同位素40K、232Th、238U仿真得到.测量环境的差异所造成的能谱偏移可由一组随机迁移矩阵仿真模拟.该数据仿真过程可描述为:

$ \begin{array}{*{20}{c}} {{y_{{\rm{sim}}}} = {\mathit{\boldsymbol{F}}_k}{\mathit{\boldsymbol{ \boldsymbol{\varPhi} }}_k}{\mathit{\boldsymbol{x}}_{{\rm{sim}}}} + \mathit{\boldsymbol{v}},}\\ {{\rm{subject}}\;{\rm{to}}\;\;\;\;\;\sum\limits_i^N {\left( {\frac{1}{{{J_i}}}\mathit{\boldsymbol{x}}_{{l_0}}^i} \right)} < {N_{{\rm{sim}}}},}\\ {{d_k} \sim N\left( {\mu ,{\delta ^2}} \right).} \end{array} $ (18)

式中: xi=(x1i, x1i, …, xJii)T, Nsim为核素种类的最大数量;ysim为仿真测量能谱;μδ分别为dk的平均值和变化量,-M < μ < M.主要模拟了在测量环境变化影响下多种核素混合的过程,能够比较完备的测试本文所提出方法的性能.

实验过程中假设标准核素能谱数据和待测实验能谱具有相同测量时间长度,每个类型的数据有100个实例,并且从27种标准核素中选择Nsim=6种核素.为了模拟环境变量的影响,假设|dk| ≤21, δ=3,探测器灵敏度为8%.之后用本文提出的方法从混合能谱中识别核素,并与典型的能谱寻峰识别方法进行比较.

通过在Geant 4中设置仿真时间命令/run/beamOn=105完成,给出了核素的识别率γsame(%),并与寻峰核素识别法γGV进行了对比,结果见表 1.实验结果显示了本文所提出的方法识别率高于85%.

表 1 相同测量时间下的核素识别准确率 Table 1 Same length of measurement time with standard spectra
3.2 实测数据试验

为了进一步评估本文所提出方法(见表 2),采用11种真实的放射源进行实验.如图 5所示,分别将CsI(Tl)探测器放置于高-低温度/湿度测试箱中和办公室测量环境中,测试不同实验条件温度变化所造成的能谱测量差异,在高低温试验箱中测试温度从-20 ℃~50 ℃变化,探测器输出信号通过PCI1407数据采集卡进行采集,共得到30种混合核素的测试数据.

表 2 实际实验用放射源 Table 2 Actual radioactive sources used for experiments
图 5 温度变化对能谱测量影响实验场景 Figure 5 Real experiments with temperature variation

采用本文提出的识别算法对采集到的30种混合核素进行处理.实验结果表明, 该算法能够在不同测量温度条件下准确识别238U、60Co、137Cs、152Eu、241Am和55Fe多种核素,验证了所提方法的可行性和有效性.由于探测器自身分辨率问题和特征峰能量较低问题,仅能在温度变化不超过10℃的范围内识别40K和155Eu/22Na.但对于236Ra、232Th和239Pu均存在失效的情况,通过分析发现可能是活度较低且经过较长时间衰变后极难测量而引起的识别失败.

4 结语

采用能谱校正和稀疏分解方法解决了温度变化情况下的核探测中核素识别率低的问题,本文提出采用能谱迁移矩阵修正环境影响造成的测量差异,并通过稀疏表示和多任务学习实现核素识别的方法具有以下特点:1)可适用于温度变化-20 ℃~50 ℃的范围;2)能够识别IAEA规定的27种典型核素及其常见混合核素。

参考文献
[1]
ROSE P B, ERICKSON A S, MAYER M, et al. Uncovering special nuclear materials by low-energy nuclear reaction imaging[J]. Scientific Reports, 2016(6): 24388. DOI:10.1038/srep24388
[2]
GRODZICKA M, MOSZYSKI M, SZCZSNIAK T. 5 Silicon photomultipliers in detectors for nuclear medicine[M]. Boca Raton: CRC Press, 2015.
[3]
LECOQ P, ANNENKOV A, GEKTIN A, et al. Inorganic scintillators for detector systems: physical principles and crystal engineering[M]. Berlin: Springer, 2016. DOI: 10.1007/3-540-27768-4
[4]
SILVA J, FIORI E, ISAAK J, et al. Temperature gain correction for CsI (Tl) detection systems based on digital pulse shape analysis[J]. Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment, 2015, 776: 98. DOI:10.1016/j.nima.2014.12.064
[5]
ZAHN G S, GENEZINI F A, MORALLES M. Evaluation of peak-fitting software for gamma spectrum analysis[EB]. ArXiv Eprint ArXiv: 1511.04362, 2015
[6]
OCZKOWSKI H L. Calibration standard for use in gamma spectrometry and luminescence dating[M]. Geochronometria: Journal on Methods & Applications of Absolute Chronology, 2001
[7]
OTTAWAY J, KALIVAS J H, ANDRIES E. Spectral multivariate calibration with wavelength selection using variants of Tikhonov regularization[J]. Applied Spectroscopy, 2010, 64(12): 1388. DOI:10.1366/000370210793561655
[8]
KUNZ M R, OTTAWAY J, KALIVAS J H, et al. Impact of standardization sample design on Tikhonov regularization variants for spectroscopic calibration maintenance and transfer[J]. Journal of Chemometrics, 2010, 24(3/4): 218. DOI:10.1002/cem.1302
[9]
MERIC I, JOHANSEN G A, MOREIRA I V M. A library least-squares approach for scatter correction in gamma-ray tomography[J]. Radiation Physics and Chemistry, 2015, 108: 39. DOI:10.1016/j.radphyschem.2014.11.013
[10]
GARDNER R P, XU Libai. Status of the Monte Carlo library least-squares (MCLLS) approach for non-linear radiation analyzer problems[J]. Radiation Physics and Chemistry, 2009, 78(10): 843. DOI:10.1016/j.radphyschem.2009.04.023
[11]
AGOSTINELLI S, ALLISON J, AMAKO K A, et al. GEANT4-a simulation toolkit[J]. Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment, 2003, 506(3): 250. DOI:10.1016/S0168-9002(03)01368-8
[12]
PAN S J, YANG Qang. A survey on transfer learning[J]. IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10): 1345. DOI:10.1109/TKDE.2009.191
[13]
HAN Xiaogang. Development of Monte Carlo code for coincidence prompt gamma-ray neutron activation analysis[D]. Raleigh: North Carolina State University, 2005 http://www.openthesis.org/documents/Development-Monte-Carlo-code-coincidence-74231.html
[14]
CHAN K-S, LI Jinzheng, EICHINGER W, et al. A new physics-based method for detecting weak nuclear signals via spectral decomposition[J]. Nuclear Instruments and Methods in Physics Research Section A: Accelerators, Spectrometers, Detectors and Associated Equipment, 2012, 667(5): 16. DOI:10.1016/j.nima.2011.11.067
[15]
WESTMEIER W. Background subtraction in Ge(Li) gamma-ray spectra[J]. Nuclear Instruments and Methods, 1981, 180(1): 205. DOI:10.1016/0029-554X(81)90031-8
[16]
ZHANG Zheng, XU Yong, YANG Jian, et al. A survey of sparse representation: algorithms and applications[J]. IEEE Access, 2015, 3: 490. DOI:10.1109/ACCESS.2015.2430359
[17]
BOYD S, PARIKH N, CHU E, et al. Distributed optimization and statistical learning via the alternating direction method of multipliers[J]. Foundations and Trends® in Machine Learning, 2011, 3(1): 1. DOI:10.1561/2200000016