温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,汇文网负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。
网站客服:3074922707
2023
声纹
识别
渐近
声纹识别渐行渐近
王梦然
当下,声纹识别开始进入生活,涉及社保、公安、金融等领域。相对于其他生物识别技术,声纹识别平安性能更高。中科院院士张钹就曾指出,现在的图像识别存在局限性,只需加一点点的干扰,机器就会将一个“炮兵阵地〞错误识别为“一群羊〞,甚至是任何其他东西,很“脆弱〞“很不平安〞,从目前来看,各种生物特征识别技术里相对平安性能较高的就是声纹识别。
所谓声纹,就是人的声波频谱。人类语言的产生是人体语言中枢与发音器官之间一个复杂的生理物理过程,人在讲话时使用的发声器官——舌、牙齿、喉头、鼻腔、肺在尺寸和形态方面每个人的差异很大,所以每个人的“声纹〞都是唯一的。
事实上,声纹技术在远程身份认证中的重要性正变得越来越突出,逐渐应用在社保、金融、公安等领域。前阶段,我国“声纹+〞身份认证云工程落户内蒙古,将为更多百姓带来网络身份认证的平安与便利。相关人士指出,未来2至3年将是“声纹〞开展的关键期,声纹认证将逐渐从内蒙古辐射到宁夏、甘肃等地。
也有科学家根据人的面部、身高等数据合成、模拟人的声音的。最近,日本音响研究所的铃木松美提出一个观点——“蒙娜丽莎〞不仅容貌与达·芬奇的自画像相似,且用声纹技术从数量上证实“蒙娜丽莎〞的声音与达·芬奇一模一样。“人的声音是由振动声带并通过喉咙在口腔或鼻腔共振而发生的,因此声带的形状或大小以及从喉咙到口腔的容积,成为决定个人声音的主要因素。〞科学家们认为,假设有容颜的形状或身高的数据,借助语言合成器,就有可能惟妙惟肖地模仿出历史人物的声音。
在日本科学家开发出的声音发生器PC-6001MKII系統中,至少要输入12项数据,包括颧骨的宽度,从眼睛下到鼻尖每隔1厘米的大小以及从其下到下巴每隔1厘米的大小,嘴宽,从两眼间中心到嘴的位置,鼻尖和枕骨部每隔1厘米的大小,身高、年龄、性别等。如果数据缺乏,也可设定最相近的值补充。不过,这种“标椎的〞合成音剔除了人的个性习惯、方言影响等社会因素,要到达“乱真〞的程度恐怕很难。
不同人在发出同一语音时,会产生有一定差异的声纹,这种差异就表达了个人特征,所以声谱仪可以帮助人们分辨语言。有时即使言语很模糊,甚至词不达意,也都可以辨明。目前,声纹已成为侦破刑事案件的重要手段之一。
据大脑机械论专家统计,一分钟内一个人所说词句的完整声纹图含有近200万比特。而普通人大脑里处理信息的速度不超过每秒45比特。换句话说,我们大约只利用了词句声纹图的千分之一,就能懂得其中含义,其余大量多余的声纹不仅能使我们了解交谈者,还能从成千上万的其他人中识别出他。
虽然目前声纹识别还没在智能 这样的消费级产品中普及,但在银行交易和国防平安等领域已广泛应用。据外媒报道,巴克莱银行、汇丰银行、哈利法克斯银行等多家英国银行目前都支持声纹识别。2022年4月,汇丰银行宣布,自2022年推出声纹识别以来,声纹识别系统已被160万客户使用了1500万次,阻止了价值3.3亿英镑的银行诈骗,未来还可能通过声纹帮助警方抓捕那些难以追踪的诈骗者。
“开展大数据产业,必须从源头开始高度重视个人信息保护。是否有利于个人信息保护,应成为评估新兴技术是否适合大数据构建和应用的关键考量。〞国家信息中心首席工程师李新友认为,未来声纹技术将在电子政务方面发挥更大优势。
此外,声纹识别还成为社保领域实现远程身份验证的关键技术。声扬科技CEO李亚桐介绍,公司之前为印尼国家公务员保险储蓄基金公司提供了一套解决方案,即通过声纹识别和智能语音技术实现远程身份验证,解决了印尼250万离退休人员的养老金领取难题。“这一案例具有典范性,声纹识别不久将在更多国家的社保领域成功实施。〞业界认为,根据不同的场景进行有针对性的“声纹识别〞的开发,将产生巨大的商业价值和社会价值。
声纹识别作为身份认证领域的新兵,虽然逐渐被人们了解并接受,但从技术开展来看,还存在不少挑战。
“声纹识别需要提高抵抗其他因素干扰的能力。〞 清华大学语音和语言技术中心主任郑方谈到,一方面,发声会随着用户身体状况、年龄的改变而变化,而不同情感、语气、语速情况下的声音也会有变化;另一方面噪声干扰、远程收录也给声纹的“精准识别〞带来挑战。此外,识别、阻止机器伪造声音,还有“超短语音〞的识别,也成为当前的技术挑战。
为标准和正确引导声纹识别开展,国内已公布多项关于声纹识别的标准。2022年,原信息产业部正式公布实施了自动声纹识别(说话人识别)技术标准,这是我国第一个关于声纹识别的行业标准。2022年12月2日,公安部公布实施了安防声纹确认应用算法技术要求和测试方法。2022年10月9日,中国人民银行正式对外发布移动金融基于声纹识别的平安应用技术标准金融行业标准,这是第一个被金融监管部门认可的生物识别标准,为声纹识别技术进入移动金融领域解决了标准难题。央行标准的公布,让金融科技一跃成为声纹识别时下最热门的应用领域之一,2022年也因此成为中国声纹技术的应用“元年〞。
众多的挑战预示着声纹识别的完善之路还很长。而相关标准的发布,标志着声纹识别正受到国内各界的认可,并吸引了越来越多的从业者进入此领域。然而技术开展自有其规律,热度之下仍需冷静,有序推进方为正道。相信在标准的正确引导和业界的共同努力下,声纹识别未来定能在各个领域开花结果,走进更多普通人的生活。(据新华日报)