《高质量呼吸音数据库建设及管理规范专家共识(完整版).docx》由会员分享,可在线阅读,更多相关《高质量呼吸音数据库建设及管理规范专家共识(完整版).docx(8页珍藏版)》请在第壹文秘上搜索。
1、高质量呼吸音数据库建设及管理规范专家共识(完整版)摘要人工智能(artificialintelligence,AI)进入新的发展阶段,在医疗领域,应用Al诊疗新模式和新手段建立快速精准的智能医疗体系是智慧医疗的重要发展目标。建立标准呼吸音数据库是基于医疗大数据的呼吸系统疾病辅助诊疗和家庭慢性肺部疾病管理系统研发和应用的基础。为了能规范建立高质量的呼吸音数据库,提高呼吸音Al研究的效率,促进Al大数据呼吸音研究的发展,本共识就呼吸音数据库建设,对呼吸音采集设备、采集流程、数据标准、质控要点、数据库架构和数据安全等内容进行推荐,为进一步开发Al算法研究奠定基础。关键词呼吸音;数据库;高质量;人工智
2、能肺部听诊是利用听诊器对气流通过气管支气管树产生的声音进行判断的方法,也是呼吸系统疾病筛查、诊断、评估和随访的重要工具,迄今仍无可替代。在获取临床症状的基础上增加肺部听诊可以提高诊断的敏感性1-2和准确性。传统听诊器的雏形是法国医师雷奈克(ReneLaennec)在1861年发明的。传统听诊器使用简单便捷,易于获取,医疗成本低,不依赖大型设备,无辐射,无痛苦,短时间内可以反复听诊。但传统听诊器也存在一些缺陷,包括呼吸音信息无法记录和保存,分享和交流困难,无法进行呼吸音持续监测,且呼吸音判别结果需依赖医师的临床经验和听觉感知能力,具有一定的主观性3-4o传统听诊器存在的短板问题严重阻碍了呼吸系统
3、疾病管理和监测的效能。利用电子听诊器(digitalstethoscope,DS)采集呼吸音,同时使用人工智能(artificialintelligence,AD技术进行自动分析是克服这些局限性的优化方式5-7。近年来AI技术的发展日新月异,基于医疗大数据的AI辅助决策技术已经成为迅速提高诊疗水平和拓展医疗资源的重要手段。数据、算法、算力和场景是构成Al的四要素,其中在医疗场景的Al研究中,主要依靠临床专业人员提供高质量的数据二AI通过机器学习和神经网络模型,对大量完成呼吸音标注的声音数据进行快速学习,最终实现呼吸音的自动分析。呼吸音的自动识别和分类主要分为2步:(1呼吸音数据的特征提取;(2
4、)利用提取的特征进行呼吸音的识别和分类8。AI在呼吸音领域的发展过程中,面临的主要问题是缺少可以用于研究算法并对不同算法进行比较的公共高质量大型呼吸音数据库,也是AI在呼吸音领域发展面临的主要困境。上海市医学会儿科分会呼吸学组、福建省医学会儿科分会呼吸学组和江苏省医学会儿科分会呼吸学组的儿科专家在分析国内外现有的呼吸音数据库的基础上,结合本领域的工作成果,共同制定高质量呼吸音数据库建设及管理规范专家共识,规范呼吸音采集设备、采集流程、数据标准、质控要点、数据库架构和数据安全,进而为儿童常见呼吸系统疾病,特别是下呼吸道感染、支气管哮喘为代表的标准化、规范化诊疗提供新的方法。1、呼吸音数据库的现状
5、和局限性呼吸音数据库作为重要诊疗信息的一部分,近年来有了快速发展。尤其是部分数据呈现开源共享模式,有利于不同数据的比对分析,制定统一标准,形成高质量数据库。在2017年之前,共有13个开放的公共呼吸音数据库8在临床研究中使用,其中4个是在线存储,9个是书籍附带的光盘资源,使用最广泛的是R.A.L.E.在线数据库(http:WW.rale,ca)和UnderstandingLungSOUndS(第3版)附带光盘内的呼吸音数据库,前者共有50余条儿童呼吸音数据和相关临床资料,每条时长10s:后者光盘内呼吸音数据总时长为60min。但这些呼吸音数据库的数量和种类比较有限,最初建立的目的是进行教学培训
6、,因此绝大部分是理想状态的呼吸音,并不适合用于真实环境中呼吸音数据算法模型的建立。葡萄牙和希腊的研究团队在2017年共同构建的呼吸音数据库(InternationalConferenceonBiomedicalandHealthInformatics2017,ICBHI2017)9,共纳入126例患者的920条呼吸音,其中儿童49例,每条呼吸音平均长度21.5s,获取6898个呼吸周期,1898个哮鸣音片段和8877个湿啰音片段。目前,在ICBHl2017开放的公共数据库(https:/bhichallenge.med.auth.gr)平台上,共有1864个湿啰音片段,886个哮鸣音片段和50
7、6个同时包含湿啰音和哮鸣音的片段。ICBHl2017已经成功进行了多种呼吸音Al算法模型的研究10-14,但该数据库也存在局限性,主要包括缺乏健康对照组,且均为单人标注数据,不符合金标准的标注要求,最终会影响数据库的质量。2021年,中国台湾建立了目前为止最大的呼吸音数据库HF_Lung_Vl(数量共279例,年龄均大于20岁,来自台湾地区,呼吸音数据共9765条,每条呼吸音时长15s,共包含湿啰音片段15606个,哮鸣音片段8457个和喘鸣音片段686个。但HF_Lung_Vl数据库同样存在局限性,缺乏健康对照组,其中261例患者的临床信息丢失,呼吸音数据均为单人标注。根据公共呼吸音数据库的
8、现状,现有的呼吸音数据库存在健康对照组缺乏;不同DS采集跨信道失配;数据库病例数量少,儿童呼吸音数据数量有限;呼吸音数据多为单人标注,缺乏质控,不符合“金标准”要求,精准度和可信度等明显不足,造成现有的呼吸音数据库在质和量方面均有明显缺陷,制约了AI在呼吸音领域的发展进程15-16,建立高质量的呼吸音数据库迫在眉睫,也是Al技术在本领域发展的基础。2、呼吸音数据库入库数据类型要求呼吸音AI研究主要在于呼吸音的识别和分类。呼吸音是胸部体格检查的重要体征,可以快速、准确、客观的反映疾病状态和病情变化,为临床诊治提供重要的依据。呼吸音数据是呼吸音数据库的主体部分,需力求信息完整、标注准确。2.1呼吸
9、音数据的采集设备呼吸音数据库的呼吸音数据需要通过DS采集获取。DS具有以下特点:采集的呼吸音数据通过数字信号传导,而非传统听诊器的声学振动;可以收集覆盖面更广的音频范围,进行数字信号转换;可以同步形成视觉声音图谱显示,在听到呼吸音的同时可以看见呼吸音的波形图谱,有助于对听诊技术进行调整获得更准确的听诊结果17。在呼吸音的临床研究中应用最多的听诊器是美国3M公司的LittnlannTMDS(Model3200),其他包括澳大利亚ClinicloudTMDS和美国ThinklabsTMDS。不同DS的设备参数存在差异,其中应用最多的LittnlannTMDS的声音可以放大24倍,带宽频率范围202
10、OOOHz,采样频率4kHz,分辨率16位,尚不能充分满足呼吸音AI算法研究的需求。同时LittmannTMDS价格非常昂贵,不适合在医疗机构内广泛使用而导致临床应用受限,同时对DS推广到社区和家庭也造成很大的困难。近几年,国产DS研发受到关注,其中以云听系列DS具有很好的代表性,性能参数包括声音放大64倍,带宽频率范围202000Hz,采样频率8kHz,分辨率16位,其参数水平高于LittmannTMDS,已经获得国家食品药品监督管理总局(CFDA)认证并应用于Al算法的临床研究,可以获得有效的实验室研究结果7。2.2呼吸音采集流程使用DS在相对安静的环境内进行呼吸音数据的采集,推荐在独立房
11、间内进行。呼吸音采集时,被采集者可以取坐位、仰卧/俯卧位,年幼儿童可以由照护者怀抱进行采集。采集过程中,被采集者和照护者需要保持安静,被采集者不需要进行深呼吸以配合采集5,70使用DS进行呼吸音采集时,要求采集者手持DS紧贴皮肤或单层轻薄衣物表面,手部保持平稳,避免抖动或接触点部位的摩擦产生噪音影响采集的呼吸音质量。呼吸音采集的部位和数量可以根据听诊习惯、研究内容和研究对象的配合程度进行选取,可以选择的采集部位包括前胸、后背和胸部侧面(腋下)(图1),可以根据年龄和数据采集要求进行选择18-19o每个部位采集的时长通常是915s,如果低龄儿童无法很好的配合,考虑到儿童每个呼吸周期持续时间较成人
12、短,在9S的时间内至少可以采集到2个呼吸周期,因此可以在每个呼吸音记录的部位至少完成9S的采集即可7,19。某些特定的呼吸音采集设备,可以根据临床需要,采用长时间的持续监测和数据记录15。3、呼吸音数据标准3.1呼吸音基本信息和描述信息上传到呼吸音数据库的标准呼吸音,需要包含与呼吸音相关的文本信息,其中呼吸音基本信息和描述信息需要按照以下标准提供。3.1.1呼吸音基本信息呼吸音基本信息需要附注以下内容:(1)患者的一般信息包括姓名、年龄、性别、身高、体重、疾病诊断和基础疾病;(2)呼吸音采集的基本信息包括采集时间、采集单位名称、采集设备型号、采集地点(门诊/住院)、采集周围环境,如声音分贝等;
13、(3)呼吸音采集当天的临床信息包括呼吸音采集时段的体温和当日呼吸道症状评分(咳嗽评分、咳痰/痰鸣评分和喘息评分),症状评分标准为O分代表没有症状;1分代表轻度;2分代表中度;3分代表严重;4分代表非常严重(表1);(4)呼吸音采集当时的呼吸音分类信息。3.1.2呼吸音描述信息呼吸音描述信息作为呼吸音数据的重要补充,需要附注以下信息、:(1)呼吸音数据规范命名、数据格式、呼吸音数据加工处理信息等;(2)呼吸音数据特征描述信息包含呼吸音数据质量和呼吸音具体类别。呼吸音质量分为声音质量较好、声音质量一般和声音较差或听不清楚。声音质量较好是指呼吸音清晰可辨,噪音控制良好;声音质量一般是指呼吸音可以辨认
14、,但噪音较明显并对呼吸音的分辨存在干扰;声音较差或听不清楚是指噪音严重影响呼吸音的识别,无法得出辨认结果。呼吸音具体类别分为正常呼吸音和附加呼吸音(adventitiousrespiratorysounds),后者包括湿啰音、哮鸣音、鼾音、喘鸣音、胸膜摩擦音及其他少见呼吸音类型等20。3.2呼吸音标注信息为满足Al算法模型的开发、调整和验证,呼吸音标注环节在呼吸音数据库的建立过程中至关重要。呼吸音的判断受到医师临床专业和工作经验的影响,具有主观性,对于呼吸音判别“金标准的制定,需要借鉴其他AI研究,如影像图片或心脏听诊等“金标准”的判定方式21-22。呼吸音标注需要分为两个步骤:首先是具有呼吸
15、音数据标注资格人员的多人标注;其次是设置呼吸音标注质控人员对呼吸音标注结果进行质控。最终,2人以上标注结果一致并质控合格的呼吸音数据进入呼吸音数据库。标注人员资质建议呼吸专业工作经验3年以上,并接受良好培训的人员。质控人员资质建议呼吸专业工作经验10年以上,并接受良好培训的人员。呼吸音标注时,需要在每条呼吸音数据中对不同呼吸音特征的片段标注起止时间戳+标签,标注区域需要尽可能的准确和详细。如果待标注的呼吸音有明显噪音影响判别或其他原因无法识别,则整条呼吸音标注为无法识别。上述标注方法已经在多项临床研究中应用并获得认可5,74、呼吸音数据质控要求为满足不同来源的呼吸音数据入库和测试,呼吸音数据质
16、量要求为WaV文件格式的原始音频数据;呼吸音数据采集设备的采样频率28kHz,分辨率在16位以上;单个部位的呼吸音采集时长29s;符合呼吸音储存和命名格式;呼吸音特征信息完整,可以进行识别和标注,最终达到金标准”要求;呼吸音数据的基本信息和描述信息需准确完整。呼吸音数据未达到入库质量标准时,建议进行以下调整:(1)非原始呼吸音数据,需要收集来源设备采集的原始呼吸音数据进行替换;(2)呼吸音采集设备不符合入库要求,建议更换采集设备;(3)单个部位呼吸音采集时长不足9s,建议重新采集;(4)呼吸音数据储存和命名格式不准确,建议根据数据库统一命名和格式的要求进行修改;(5)呼吸音信息特征不完整,被2名标注者或至少1名标注者和1名