《声纹检测通用规范.docx》由会员分享,可在线阅读,更多相关《声纹检测通用规范.docx(7页珍藏版)》请在第壹文秘上搜索。
1、ICS17.140.99CCSL70B34安徽省地方标准DB34/TXXXX-2023声纹检测通用规范Generalspecificationofvoiceprintdetection(征求意见稿)在提交反馈意见时,请将您知道的相关专利连同支持性文件一并附上。XXXX-XX-XX发布XXXX-XX-XX实施安徽省市场监督管理局发布本文件按照GB/T1.1-2020标准化工作导则第1部分:标准化文件的结构和起草规则的规定起草。请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。本文件由科大讯飞股份有限公司提出。本文件由安徽省经济和信息化厅归口。本文件起草单位:科大讯飞股份有
2、限公司、浙江讯飞智能科技有限公司、安徽省质量和标准化研究院、合肥智能语音创新发展有限公司、合肥产品质量监督检验研究院、智音检测认证服务(合肥)有限公司。本文件主要起草人:声纹检测通用规范1范围本文件规定了声纹检测的术语和定义、检测准备和检测步骤。本文件适用于电机制造及电机组装设备(例如家电、汽车、仪器仪表等)的生产线异音检测。2规范性引用文件本文件没有规范性引用文件。3术语和定义下列术语和定义适用于本文件。31声纹voiceprint用电声学仪器显示的携带特征信息的声波频。注:本文件所指的声纹仅指在工业生产线发出的声音。3J声纹检测voiceprintdetection通过在产线集成声纹采集设
3、备,利用声纹识别、异音诊断等技术,对电机产品发出的声音进行标注和训练,以实现产品缺陷自动识别报警的自动化检测过程。标注label标注人员根据所收集的设备声音样本性质不同进行分类的过程。声音采集soundcollection采用拾音设备对被检测对象所发出的声音进行采集,形成声纹文件。15异音abnormaInoise具有缺陷的工业产品在运行时发出的异常声音。4检测准备d1标准声音采集4.1.1 总体要求多次声音采集过程中的环境参数、采集方式、采集音频参数、采集样本时长和总量应保持一致。4.1.2 采集设备通过高保真麦克风设备采集音频样本。4.1.3 采集环境4.1.3.1应在低噪声环境下进行,确
4、保音频采集过程的环境噪音类型与产线部署过程的环境噪音一致,采集过程中避免出现其他人为异响。4.1.3.2环境噪声标准:A记权分贝值W30dB(八)4.1.4采集方式4.1.4.1麦克风设备与被采集对象应固定放置,确保采集音频稳定性。4.1.4.2麦克风设备与被采集对象距离固定在IoCm左右,采集方向应正对被采集对象发声位置,使采集的音频满足4.1.5中所规定的峰值幅度值范围,若不满足,可通过拉进拉远距离的方式进行调节。4.1.5采集音频参数4.1,5.1编码格式:PCM编码。4.1,5.2采样率:48Ko4.1.5.3量化精度:16bito4.1.5.4峰值幅度:2T8dBFS且W-3dBFS
5、4.1.6采集样本样本应覆盖所有对样本进行的标注类别(即正常类和异常类),样本时长和总量包括:a)单条样本时长:10s;b)样本总量:每个类别2500条。42标注4.2.1标注方法4.2.1.1在计算机上对标准采集到的声音样本进行标注,对样本所进行的标注包括两种标注类别(即正常类和异常类),每个样本应仅有一种标注类别。4.2.1.2检测人员使用计算机上的音频播放软件对待标注样本进行辨听,再进行标注结果记录,若无法判断是否为异常可注明无法判断。4.2.2标注格式标注完成后形成标注记录,存储于关系型数据库中,相关字段说明见表1。若待标注样本为正常声纹,则异常开始时间和异常结束时间一栏为斜杠符(/)
6、。表1声纹样本标注字段说明字段名称字段类型字段描述备注VoiceIdString音频IDMarkTimeLong样本时长单位:毫秒MarkPersonString标注人员编号录入人员编号AbnormalString声纹类型标签正常/异常/无法判断StartPointDouble异常开始时间单位:亳秒EndPointDouble异常结束时间单位:亳秒d3模型建立对检测人员标注为正常/异常的声音样本提取声学特征,利用卷积神经网络算法对声学特征进行建模,得到可区分正常和异常的声纹分类模型,用于进行后续声纹检测任务。5检测流程图检测流程图见图1。准得阶段依君阶段图1检测流程图6检测步骤61现场声音采集
7、6.1.1总体要求多次声音采集过程中的环境参数、采集方式、采集音频参数、采集样本时长和总量应保持一致。6.1.2采集设备应符合4.1.2规定的要求。6.1.3采集环境应在生产线环境下进行,周围环境噪声的A记权分贝值W30dB(八),采集过程中避免出现其他人为异响。6.1.4 采集方式应符合4.1.4规定的要求。6.1.5 采集音频参数应符合4.L5规定的要求。6.1.6 采集样本采集样本时长和总量如下:a)单条样本时长:10s;b)样本总量:10条。6.1.7 2模型判定6.2.1将现场采集的10条声音样本传输至计算机,使其分别通过4.3中可区分正常和异常的声纹分类模型,得到10条模型判定结果。6.2.2若其中5条以上(不包括5条)被判定为正常,则被检测对象判定为正常状态;若其中5条以上(不包括5条)被判定为异常,则被检测对象判定为异常状态;若其中5条判定为正常,5条判定为异常,应重新进行现场声音采集和模型判定流程,直至被检测对象判定为正常或异常状态。63检;则结果输出若被检测对象判定为正常状态,则计算机屏幕上显示“正常”字样;若被检测对象判定为异常状态,则计算机屏幕上显示“异常”字样,同时出现红色色块闪烁进行告警提示,检测结束。