《人工神经网络在医学研究中的应用.docx》由会员分享,可在线阅读,更多相关《人工神经网络在医学研究中的应用.docx(3页珍藏版)》请在第壹文秘上搜索。
1、人工神经网络在医学讨论中的应用【摘要】人工神经网络由于其具有高度的自适应性、非线性、擅长处理简单关系的特点,在很多讨论领域得到了广泛应用,并取得了令人瞩目的成就。对其目前在医学讨论领域中的应用做简洁综述。【关键词】人工神经网络;应用人工神经网络(ArtifiCiaINeuralNetwork,ANN)方法自从本世纪40年月被提出以来,很多从事人工智能、计算机科学、信息科学的科学家都在对它进行讨论,已在军事、医疗、航天、自动掌握、金融等很多领域取得了成功的应用。目前消失了很多仿照动物和人的智能形式与功能的某个方面的神经网络,例如,GrOSSberg提出的自适应共振理论(AdaPtiVeReSon
2、anCeTheOry,ART),T-Kohenen的自组织特征映射网络(Self-OrganiZingfeatureMap,SOM),径向基函数网络(RadialBasisFunctionfRBDIlopfield网等。进入90年月以后,由于计算机技术和信息技术的进展,以及各种算法的不断提出,神经网络的讨论渐渐深化,应用面也逐步扩大,本讨论时常用的神经网络方法及其在医学领域中的应用做简洁综述。1自组织特征映射网络(SeIf-OrganiZingfeaturemap,SOM)在基因表达数据分析中的应用1.1方法介绍脑神经学的讨论表明,人脑中大量的神经元处于空间的不同区域,有着不同的功能,各自敏感
3、着各自的输入信息模式的不同特征。芬兰赫尔辛基高校神经网络专家T.Kohonen依据大脑神经系统的这一特性,于1981年提出了自组织特征映射网络,它模拟人的大脑,采用竞争学习的方式进行网络学习,具有很强的自组织、自适应学习力量,鲁棒性和容错力量,其理论及应用进展很快,目前已在信息处理、模式识别、图像处理、语音识别、机器人掌握、数据挖掘等方面都有成功应用的实例。KOhOnen网络由输入层和竞争层组成,网络结构见图1。输入层由N个神经元组成,竞争层由M个输出神经元组成,输入层与竞争层各神经元之间实现全互连接,竞争层之间实行侧向连接。设输入向量为x=(xl,xd)T,输出神经元j对应的权重向量为Wj=
4、(Wjl,wjd)T,对每一输出神经元计算输入向量X和权重向量Wj间的距离,据此枭用竞争学习规章对权向量进行调整。在网络的竞争层,各神经元竞争对输入模式的响应机会,最终仅一个神经元成为成功者,并对与获胜神经元有关的各权重朝着更有利于它竞争的方向调整,这样在每个获胜神经元四周形成一个“聚类区”,学习的结果使聚类区内各神经元的权重向量保持与输入向量靠近的趋势,从而使具有相近特性的输入向量聚集在一起,这种自组织聚类过程是系统自主、无老师示教的聚类方法,能将任意维输入模式在输出层映射成一维或二维离散图形,并保持其拓扑结构不变。网络通过时输入模式的学习,网络竞争层神经元相互竞争,自适应地形成时输入模式的
5、不同响应,模拟大脑信息处理的聚类功能、自组织、自学习功能,实现用低维目标空间的点去表示高维原始空间的点,其工作原理和聚类算法及改进方法参见相关文献1。1.2应用基因芯片技术的应用使得人们可以从基因水平研讨疾病的病因及预后,而基因芯片产生的数据具有高维度(变量多)、样本量小、高噪声的特点,样本量远小于变量数,如何从海量的数据中挖掘信息或学问成为重大课题。聚类分析是数据挖掘中的一类重要技术,传统方法主要有系统聚类、k-means聚类等,但在处理简单非线性关系及变量间的交互作用时效果较差,受特别值影响较大。近年来神经网络技术法成为聚类领域的讨论热点,其中自组织特征映射网络由于其良好的自适应性,其算法
6、对基因表达数据的聚类有较高的稳定性和智能性,尤其在处理基因表达中有缺失数据及原始空间到目标空间存在非线性映射结构时有较好的体现,适用于简单的多维数据的模式识别和特征分类等探究性分析,同时可实现聚类过程和结果的可视化2目前KOhOnen网络已被成功用到很多基因表达数据的分析中,JihuaHUang等3设计6X6的网络对酵母细胞周期数据进行分析,总正确率为67.7%:曹晖等4将其算法改进后用在酵母菌基因表达数据中,总正确率高达84.73%,有较高的聚类效能;邓庆山5将该模型与K平均值聚类方法结合用于公开的结肠基因表达数据集和白血病基因表达数据集,聚类的精确率分别为94.12%和90.32%。目前K
7、Ohonen网络在医学领域中主要应用前景有:发觉与疾病相关的新的未知基因,对目标基因进步讨论,提高诊断的正确率,并对药物的开发讨论供应重要的线索:对肿瘤组织的基因表达谱数据聚类,以期发觉新的、未知的疾病亚型(肿瘤亚型),以便提出更加有针对性的治疗方案,为从分子水平对疾病分型、诊断、预后等供应依据:发觉与已知基因有相像功能的基因,为推断未知基因的可能功能供应线索。2BP神经网络在医学讨论中的应用2.1 BP神经网络在疾病帮助诊断中的应用方法介绍BP神经网络是目前应用最多的神经网络,一般由一个输入层(inputlayer)、一个输出层(OUtPUtlayer)、一个或几个中间层(隐层)组成。每一层
8、可包含一个或多个神经元,其中每一层的每个神经元和前一层相连接,同一层之间没有连接。输入层神经元传递输入信息到第一隐层或直接传到输出层,隐层的神经元对输入层的信息加权求和,加一个常数后,经传递函数运算后传到下一个隐层(或输出层),常用的传递函数是logistic函数,即中h=l(l+exp(-z),输出层神经元对前一层的输入信息加权求和经传递函数中0(线性或logistic函数或门限函数)运算后输出,BP神经网络一般采纳BP算法训练网络,关于BP算法及改进可参考相关文献1.人工神经网络具有强大的非线性映射力量,含一个隐层的网络可以实现从输入到输出间的任意非线性映射,是典型的非线性数学模型,建立B
9、P神经网络模型的一般步骤为:BP网训练集、校验集、测试集的确定;输入数据的预处理:使输入变量的取值落在。至IJl的范围内,假如是无序分类变量,以哑变量的形式赋值:神经网络模型的建立及训练:学习率、传递函数、隐层数、隐单元数的选择,留意防止过度拟合。一般使用灵敏度、特异度、阳性猜测值、阴性猜测值、RoC曲线对模型的猜测性能进行评价。应用BP神经网络已广泛用于临床帮助诊断中,白云静等6用于中医证候的非线性建模,建立了RA证侯BP网络模型和DN证侯BP网络模型,结果显示平均诊断精确率分别为90.72乐92.21%,具有较高的诊断、猜测力量。曹志峰7采纳PROBENl中的甲状腺疾病数据库用于甲状腺疾病
10、(甲亢、甲减、正常)的诊断,结果显示训练样本的正确识别率为99.3%,测试样本的正确识别率为98.2%,提示对临床诊断甲状腺疾病供应有益的关心;还有学者用于急性心肌梗塞、甲状腺功能紊乱、乳腺癌、前列腺癌、宫颈癌、肺癌、卵巢癌、急性肺梗塞等的都助诊断等82.2 BP神经网络在生存分析中的应用方法介绍传统的生存分析方法有非参数、半参数、参数模型,参数模型主要有指数回归模型、WeibUll回归模型,都要求对基线风险做肯定的假设,但实际资料经常不符合条件,生存分析中应用最为广泛的半参数模型:CoX比例风险模型,但它要求满意比例风险的假定,在很多状况下也难以满意。基于神经网络的生存分析模型可以克服这些困
11、难,可以探测简单的非线性效应,简单的交互效应,模型中协变量的效应可以随时间变化,对数据的分布不做要求。目前一些策略被用到神经网络猜测方法中分析含有删失的生存数据,主要有Faraggi-SinlOn(1995)法、Liestol-Andersen-Andersen(1994)法、改良UCkIey-JamCS(1979)法等。BP神经网络建立生存分析模型常用的方法有9:连续时间模型(continuoustimemodels)与离散时间模型(discretetimemodels)0常用的Faraggi和SimOn10提出的连续时间模型扩展了COX回归模型,允许非线性函数代替通常的协变量的线性组合,这
12、种方法既保持了CoX回归模型的比例风险的特点,又供应了处理简单非线性关系、交互作用力量的好方法。离散时间模型常用的模型有:输出层为单个结点:模型的输出层只有一个神经元结点,是最简洁的神经网络模型,生存时间被分成两个区间,当讨论者仅仅对某一时间点的预后感爱好时,例如猜测癌症患者的5年生存状况,如欲猜测多个时间点,则需建立多个神经网络模型(每个模型对应一个时间区间):输出层为多个结点:生存时间被分成几个离散的区间,估量某个时间区间大事发生的概率,Liestol法是常用的离散时间模型。还有讨论者在建立多个时间区间模型时将时间也做为一个输入变量,也有学者将神经网络纳入Bayes方法的讨论框架。一般采纳
13、灵敏度、特异度、全都性指数C(COnCOrdanCeindeX)作为猜测精确性的评价指标,神经网络在生存分析中的应用主要在于11:个体患者预后的猜测,讨论预后因子的重要性,讨论预后因子的相互作用,对于猜测变量的影响力强弱及解释性,还有待进一步研讨。应用国外RUthM.Ripley等9将7种不同的神经网络生存分析模型(3种离散时间模型,4种连续时间模型)用于1335例乳腺癌患者复发概率的猜测,并对其精确性、灵敏度、特异度等猜测性能指标进行比较,结果证明神经网络方法能成功用于生存分析问题,可以提取预后因子所蕴涵的最大可能的信息。AnnyXiang等12采纳MOnteCark)模拟讨论方法,在9种试
14、验条件下(不同的输入结点、删失比例、样本含量等)对Faraggi-Simon法、LieStOI-AndCrSen-AnderSen法、改良Buckley-Jamcs法处理右删失生存数据的性能与Cox回归作比较,讨论结果提示神经网络方法可以作为分析右删失数据的一个有效的方法。D.J.Groves13等将CoX回归与神经网络方法对儿童急性淋巴母细胞白血病的预后进行了比较,LucilaOhno-Machado等口4建立输出层为4个结点的离散时间神经网络模型做为AlDS预后讨论的工具,并使用ROC曲线下面积、灵敏度、特异度、阳性猜测值、阴性猜测值对不同时间区间的猜测性能做了评价。国内用于生存分析方面的
15、讨论还较少,黄德生15等采用BP神经网络建立time-codedmodel和SingIe-timepointmodel用于肺鳞癌预后猜测,贺佳16等把BP网络用于猜测肝癌患者术后无瘤生存期,也有学者对AIDS、恶性肿瘤的预后做了相关的讨论。2.3BP神经网络在其它方面的应用近年来Bp神经网络在疾病筛查中的的应用引起学者的关注,例如在乳腺癌、宫颈癌、糖尿病的筛查都有成功的应用170神经网络在法医学讨论领域具有有用性和广泛的应用前景,法医学家将其用在死亡时间推断、死因分析、个体识别和毒物分析等讨论中180在药学讨论中也有肯定的应用,例如在定量药物设计、药物分析、药动/药效学讨论中,都有成功的应用案
16、例,相秉仁等19对其做了具体的综述。曹显庆20等还将神经网络用于ECG、EEG等信号的识别和处理、医学图像分析中,取得了较好的结果。人工神经网络是在讨论生物神经网络的基础上建立的模型,迄今为止有代表性的网络模型已达数10种,人工神经网络不需要精确的数学模型,没有任何对变量的假设要求,能通过模拟人的智能行为处理简单的、不确定的、非线性问题。在医学讨论领域,变量间关系往往特别简单,为了探测变量间的简单模式,神经网络正渐渐变成分析数据的流行工具。目前国际上已消失很多闻名的神经网络专业杂志:NeuralNetwork,NeuralComputation,IEEETransactiononNeuralNetWorkS等,同时已有很多商业化的神经网络开发软件,如MalIab软件,S-PIUS软件,SNNS(StuttgartNeuralNe