《声纹鉴定浅述》 关键词:声纹 语图 鉴定 声纹,也称"语图",是由专用的电声转换仪器(语图仪)将声波特征绘制成的波谱图形。声纹鉴定就是把未知人的语声和已知人的语声,通过语图仪分别制成声纹图谱,再依据声纹图上的特征进行分析、比较和判断,确定二者是否为同一人的语声。它是文检技术中近些年发展起来的语音识别的先进科学手段。 一、声纹的意义 在实际生活中,我们都有切身体会:每个人说话时的语声,都有自己的特点。很熟悉的人之间,可以只听声音而相互辨别出来,这就是语声人各不同的特性。 为什么人的语声会人各不同呢?因为人的发声器官实际上存在着大小、形态及功能上的差异。发生控制器官包括声带、软颚、舌头、牙齿、唇等;发声共鸣器包括咽腔、口腔、鼻腔。这些器官的微小差异都会导致发声气流的改变,造成音质、音色的差别。此外,人发声的习惯亦有快有慢,用力有大有小,也造成音强、音长的差别。音高、音强、音长、音色在语言学中被称为语音"四要素",这些音素又可分解成九十余种特征。这些特征表现了不同声音的不同波长、频率、强度、节奏。语图仪可以把声波的变化转换成电讯号的强度、波长、频率、节奏变化,仪器又把这些电讯号的变化绘制成波谱图形,就成了声纹图。 人的发声具有特定性和稳定性。从理论上讲,它同指纹一样具有人身识别(认定个人)的作用。虽然由于技术和经验的问题,暂时不能说完全达到了指纹那样的精确程度,但它已经被越来越多的国家认可为法庭科学的一项新技术。一九八一年在美国密执安州成立了"国际声纹鉴定学会",旨在进一步完善声纹鉴定技术,加强推动、培训和宣传,促使声纹鉴定成为世界公认的一种人身识别的科学方法。 目前,许多国家都己把声纹鉴定作为辨认犯罪嫌疑人的重要手段,为侦查工作提供新的线索和证据。 (1)在获得了犯罪人的语声录音资料时,如在电话中进行的恐吓、勒索,或在其他性质的犯罪中录到了罪犯说话的声音,那么可以通过收集嫌疑人语音样本进行声纹鉴定,为认定或否定犯罪人提供鉴定结论。 (2)在案件的侦讯或审理中(包括民事案件),通过声纹鉴定可以审查录音证据材料的其伪。 (3)通过声纹分析,判断说话人的性别、年龄、方言(生活地区)特征,为侦查工作提供方向和范围。 二、声纹鉴定的步骤和注意事项 目前应用的语图仪可以制作七种声纹图:宽带声纹、窄带声纹、振幅声纹、等高线声纹、时间波谱声纹、断面声纹(又分宽带、窄带二种)。其中,前二种显示语声的频率与强度随时间推移的变化特征;中间三种显示语音强度或声压随时间变化的特征;断面声纹只是显示某一时间点上声波强度和频率特征的声纹图。 在声纹鉴定中最常用的是宽带声纹图。它是用带宽为30OHZ的带通滤波器分析出来的声纹。声纹图的横坐标为时间,纵坐标为频率,浓淡表示音强(见附图)。每一字的声纹前部(乱纹)是清辅音的频谱,后部是元音频谱;元音频谱中由加强的纵线条构成的水平方向的黑带为共振峰。共振峰的数量、走向及其频率是声纹分析的重要特征。 声纹鉴定依如下程序和要求进行: 1、 采集检材语声(录音) 在采集犯罪人或证人的语声作检材时,录音宜采用高保真录音机。采集语声的要求是: ①录音应当尽量在不被对方发觉的情况下进行,以减少假象的干扰,保证语声的真实。 ②应尽量防止环境噪声和录音设备的干扰。"麦克"与被录对象保持适当距离。尽量不用失真大的袖珍盒式录音机,电源最好用市电,保持电流稳定。电话录音时应使用传感器,不要将听筒直接对着"麦克"录音。磁带应选用优质新带。 2、采集样本语声(录音) 除了遵照采取检材时要求的器材和注意事项外,应尽量保持同采集检材时相同、相近的语声环境、距离、设备及速度;并保证在样本中有与检材相同的词句,以供特征比对。 3、审听和选择 鉴定人员要先对捡材和样本分别反复审听和记录,从中选择正常而清晰的语声段落,再进一步选取相同的字、词、句,作为供比较的部分。然后使用语图仪分别将选好的检材与样本中的字、词、句做出声纹图。 4、声纹特征的选择 在被比较的两种声纹图谱中,分别选取明显、稳定的特征作为比较特征。一般说,共振峰的频率值及其走向是最稳定的特征,而且具有很强的特定性,利用价值最高;而时长、音强、波形等特征稳定性较差,可做参考。在鉴定过程中,还可以从同一个人的语声中选择多个相同字、词或句的语图,在分析比较中抓住其稳定而特殊的特征作为依据。 5、比较 比对检材与样本中相同字、词的声纹中的同类特征(如共振峰频率、走向及波形),进行比较分析,找出相同点和差异点。 6、综合评断 ①如果被比较的全部特征完全吻合;或者稳定性强的特征完全吻合,而只是稳定性差的特征有些差异,均可做同一认定结论。 ②如果被比较的稳定性强的特征差异较大,还可以补充样本再做语图比较,倘仍有差异,又无法解释,则可做否定结论。 7、声纹送检时的注意事项 说话人在不同的环境和不同的心态下,以及不同的语气、不同的健康状况都会引起语音的某些变异。录音环境(噪音、回声、距离)的干扰以及录音设备不良,也会使录制的语音产生假性变异。因此,送检时,要把录制检材和样本时的环境状况、录制距离、录制方式、使用机器、以及在什么情况下录制等情况加以详细记载,一并提交鉴定人,以便对差异点进行客观的分析评断。 三、声纹鉴定的发展状况 辨声之举,自古有之,说明人早知道声音人各不同。但那仅仅是凭听觉器官的分辨能力。科学的声纹研究是以完善的录音设备为基础的,而且最先是为战争服务的。第二次世界大战后期,为了提高军事通讯效率的需要,美国电话电报公司的贝尔实验室研究和发明了"音响光谱图象显示器",把声波用光谱图象加以显示。战争结束,这项研究亦中止。 到了五、六十年代,美国纽约市的绑票、电话恐吓案件骤增,为了侦讯工作的需要,贝尔实验室受执法部门委托,恢复对声纹的研究。他们对一百二十三名健康美国人的"I、you、it(我、你、是)等词语的二万五千个声纹图进行了五万多项鉴定分析,个人识别的准确率达到97- 99·65%。一九六二年,L·G•克斯特发表了《声纹鉴定》一书。从一九六六年开始,贝尔实验室开始培训警官,推广应用这项技术。至七十年代,日本、罗马尼亚、西德等都相继开展了声纹鉴定技术,以对付恐怖犯罪活动。随着科学技术的进步,声纹鉴定手段也日益先进。目前,国际声纹鉴定并行两套系统:一是声纹的自动识别系统,它以电子计算机为主体,具备分析、储存、检索、鉴定多项功能,可以根据语声进行全自动分析,最后给出结论。但这种结论的准确性同专家设定的特征吻合量(阈值)有关。二是声纹的人工识别系统,它以语图仪为支持,鉴定人直接观察和分析声纹,寻找特征,测量数据并进行比较与评断,最后得出结论。 在声纹资料的存储技术上,已发展到激光光盘存储。先以激光源对待储声纹图谱进行扫描,获得付利叶光谱,再通过电脑把光谱记录的声纹特征转换成数据,最后通过电脑控制的激光针将待储声纹特征的数据存入光盘纹线中。当需检索时,再用激光针通过电脑系统输出光盘中的信号,即可进行声纹比较。这种存储技术容量很大,一张光盘可以储存数百万人的声纹。 过去,我国对声纹鉴定技术长期持保守态度,因而起步很晚。直到一九八八年,中国刑警学院才率先在文检系成立了全国第一个声纹鉴定实验室,引进了美国KAY公司生产的7800型语图仪,进行实验研究,并推动了在办案中的实际应用。一九九0年,公安部第二研究所文检室引进了美国KAY公司5500型语图仪。目前这两家均已应用于办案,取得了很好的成效。南京、上海也已同有关部门合作,进行了声纹鉴定的研究与应用。 (兰绍江) (原载于天津《警察学研究》1994年第4期) (本文资料受益于中国刑警学院岳俊发、王英利,谨此致谢) |