老大哥在听着你:美国情报部门如何监听全世界
文章来源: The Intercept , TECH2 IPO/创见 陈铮编译,译文创见首发,转载请注明出处
很多人都已经意识到曾经被视为个人隐私的电子邮件和其他数字通讯方式在今天都已经成为了他们个人档案中永久记录的一部分。
然而在越来越多的人使用 app 来进行交流时,大多数人都没有意识到那些他们发出的语音信息其实也不再属于私人信息。
从斯诺登披露的 NSA(美国国家安全局)绝密档案中可知如今美国国家安全局已经可以通过生成粗略的通话文本自动识别语音通话的内容,这些语音内容文本还可以进一步进行搜索和储存。被披露的文档中还显示 NSA 的分析人员们对于自己的语音内容检索技术领先了「Google Voice」近十年之久感到欣慰。
虽然表现完美的自然语音对话转录文本技术依然是各国情报人员不懈的追求,但是在斯诺登所披露的材料中已经向人们展示了在语音中搜索关键字的广泛使用,以及如何设计计算机程序提取和分析语音对话内容,甚至是采用复杂的算法对情报人员感兴趣的对话进行标注。
在这些披露出来的文档中包含了一些生动的例子,比如 NSA 如何在伊拉克和阿富汗等交战地区以及拉丁美洲的重点区域使用语音识别技术。但是这些披露出来的内容并没有明确反映出美国情报机构到底在多大的范围之中使用了该技术,尤其是在这些监听项目中是否还覆盖了大量居住于美国本土的人士以及美国公民的通话内容。
对于国际电话进行监听一直是美国国家安全局的主要工作之一,但是如果使用人力进行监听工作就意味着在浩如烟海的通话中只能够低效地监听到其中很小的一部分。使用自动识别语音内容技术同时也意味着美国国家安全局进入了大规模监听的时代。
这件事情并没有引起公众的警觉,也没有相关的听证会和立法活动对其进行制约。美国国会到现在为止都没有表现出已经察觉此事的迹象。
美国国会正在讨论的美国自由法案并没有包含相关议题,不过即使法律对此有所规定,根据斯诺登披露档案中所显示的美国国家安全局相关工作机制,来自美国以及世界范围之内的大量无辜民众的短信和语音通话依然会处于被监视当中。
一些公民自由方面的专家表示美国国家安全局这种将语音内容转化为可搜索文本的技术能力非常令人不安,它让情报部门在数字世界中肆无顾忌地侵犯个人隐私成为可能。
「一旦情报部门具备了这种能力,我们接下来想知道的就是他们会如何使用这项技术。他们会储存所有美国人的通话内容吗?他们会将这些语音通话都转为可搜索内容的文本吗?他们现在可能并没有这样做,但是他们已经具备了做这些事情的能力,谁知道他们什么时候就会开始监听呢?」斯坦福大学网络与社会中心的主任,人权学者 Jennifer Granick 表示出了担忧。
的确,在此之前美国国家安全局官方一直对于转化语音为文本的能力守口如瓶,也从未透露过他们的监听范围,这让人们对于其监听的电话数量产生了很多想象。
这个一直被情报部门秘而不宣的数字就是此问题的关键。「我们不知道到底有多少无辜的人被牵连其中。」
监听一切的能力
Thomas Drake 曾经是一名受雇于美国国家安全局的语音处理专家,他在该机构中一直工作到了 2008 年。据他透露,在 2001 年 911 恐怖袭击事件发生之后,美国国家安全局对于如何将数量庞大的语音通话转化为更有用的形式需求迫切。仅凭人力是无法完成如此浩大的工作,「我们用于监听的人手是有限的。」
由新系统提供的语音转换文本内容并非完美,「虽然通话信息不是百分百转录,但是我们已经可以从中获取足够多的信息,而且针对这些文本还能进行关键字搜索,这比用人来听还是省力的多。」
将语音转化为文本的技术让美国国家安全局分析其监听内容更加方便,在这方面的技术突破使得 NSA 能够在最大范围内监听更多的人。
更多数据,更大权利,更高效的监听工作
美国国防部通过美国国防先进研究项目局(DARPA)在上世纪 70 年代初就开始资助学术与商业机构的语音转换技术研究。他们针对语音转化文本的工作采用了多种系统,虽然该技术进展缓慢,但是美国情报部门分析语音情报的能力还是在不断提高。
在一次采访中,DARPA 信息创新办公室主任丹•考夫曼(Dan Kaufman)表示情报部门对于语音内容的自动转化能力还是有限的。「语音内容转化文本是非常困难的工作,因为在通话信号中存在着很多噪音,还有很多莫名其妙的俗语与行话。」
考夫曼表示情报部门也感到处理海量语音的工作非常棘手,最理想的语音环境当然是像新闻演播室一般的场合,美国情报部门针对这一类型的语音处理已经可以做到相当准确。
语音识别方面的专家表示在过去的十年中,语音内容识别的技术已经得到了长足的发展。随着技术进步,信息存储工作变得越来越便宜且有效率,语音技术开发公司能够在他们的服务器中储存大量的语音数据,这使得他们能够通过这些数据不断更新与改进技术模型。巨型处理器所支持的类似「深层神经网络」能够像人类大脑一样工作,生产出更多清洁文本。
事实上,美国国家安全局在在语音识别系统方面的技术工作已经开展了十年之久。第一代系统被称作 RHINEHART,它让情报人员在海量语音内容中进行关键搜索成为可能。对于语音中关键词的识别能够使分析人员根据情报内容发现情况并优先考虑拦截对话。
在一份被披露的 NSA 备忘录中显示,参与反恐的情报部门分析人员可以在语音内容中识别出制作炸弹的相关词汇,如「雷管」和「过氧化氢」,以及一些敏感的地名与人名如「巴格达」和「穆沙拉夫」。
RHINEHART 系统支持实时搜索,它能够针对指定的一组关键词在语音中自动检索。除此之外它还能够进行回顾式搜索,情报分析人员可以针对过去几个月的语音通话反复搜索。而美国国家安全局在之后还推出了一种更为复杂的 HLT(Human Language Technology)技术,新的 VoiceRT 系统在伊拉克战争中在巴格达投入使用,一名独立的情报分析人员在一天中就可以对被拦截的数百万语音通话进行处理,并且专注于其中与反恐相关的那一小部分内容中。
在美国本土之外被广泛使用的监听
根据斯诺登所披露的材料可以发现,美国国家安全局针对国际语音通讯广泛地使用了语音转换文本的技术手段进行内容监控,尤其针对伊拉克、阿富汗、墨西哥和一些拉丁美洲国家。在 2005 年时,新任美国国家安全局局长 Keith B. Alexander 曾经表示:「我们想要获取关于伊拉克的一切信息,每一条短息,每一则通话,每一封邮件都应该被安全局强大的电脑所监控。」
RTRG(Real Time Regional Gateway)系统在美国针对伊拉克的反恐行动中起到了至关重要的作用,它监控了伊拉克叛乱分子的通信网络,并且有效地减少了每个月在爆炸袭击中的人员伤亡。这一项针对语音进行检索并拦截可疑通话的技术在 2006 年开始投入了伊拉克使用,在 2008 年这项技术也开始进入了针对阿富汗的情报工作中。
关键词定位技术也曾经成功地在针对伊朗的情报工作中得以施展。根据一份 2006 年的备忘录中显示,RHINEHART 系统曾经被掌握波斯语的情报分析人员成功地用来在伊朗的语音通讯中搜索关键字如「协商」、「美国」等,RHINEHART 系统定位了一则非常重要的通话,通过语音转录文字的技术从中获取了伊朗高层政治人物针对新的伊拉克政府的讨论。
而根据 2011 年的一份备忘录,美国国家安全局针对拉丁美洲的监听工作进行了严密的部署,监听网络甚至延伸到了各国的大使馆。在备忘录中提到语音转录文本的情报分析人员对于西班牙语的掌握已经非常熟练,国家安全局遍布拉丁美洲的各个站点对于西班牙语的语音通话中的关键词能够进行非常有效的扑捉。情报分析人员曾经利用 RHINEHART 系统中利用关键词搜索发掘出了拉丁美洲的目标人物卷入了贩毒当中,而安全局在此前并未收到相关情报。而在另一个案例中一名参与了拉丁美洲情报工作的安全局人员也表示他们曾经通过 RHINEHART 系统找出了身处美国的古巴的情报人员的活动时间。
美国国内使用情况未可知
目前我们还不知道美国国家安全局这一项语音转录文本的技术是否也针对美国人进行了监听,安全局对于该问题也没有作答。
美国国家安全局的发言人 Vines 曾经表示:「国家安全局为了进行针对外国的情报工作采用了多种技术手段,这些技术都由来自安全局内部与外部的多个专业人士进行操作。使用这些技术的目的是帮助打击国际恐怖分子活动、贩卖人口、网络犯罪以及其他会危及我们的公民和盟友的活动。」
话虽如此,但是 Vines 并没有回应关于安全局通过监听国内外语音通讯侵犯公民隐私的质疑。不过她在邮件中也写道:「美国国家安全局严格遵循在 2014 年 1 月由总统直接颁发的保护个人隐私的法案,这不仅仅是适用美国民众,也适用外国人。」
然而在隐私和公民自由监督委员会 (PCLOB) 的公开报告中却没有提到「语音技术」。该监督委员会主席 David Medine 说:「我们去往情报部门要求他们公布相关材料,绝大多数的资料已经解密了,但是还有一部分涉及到国家安全的材料还处于保密中。」
如果美国国家安全局掌握的将语音转化为文本的能力会涉及公民隐私问题,那么安全局对于这些涉及美国公民个人的语音材料的储存与传播就应该控制在最小程度上。
「很显然随着这种能力的增长,政府将会监听更多的电话信息。政府有能力监听更多民众的电话,因此我们监督委员会在过去曾经提起的各类隐私侵犯问题也会增加。」David Medine 补充道,「我想要讨论的不是政府该不该这么做,我只是希望大家能够认识到这种技术被滥用的后果。」
呼唤新的监管规则
史迪威高级研究中心执行主任 Kim Taipale 从十年前开始就为此呼吁,他想让决策者认识到现有的监管法律已经跟不上全球通讯网络的发展以及语音转化文本技术的不断升级。
「我们生活的世界中有很多事情是稍纵即逝的,而现在这些事物竟然会成为关于我们个人的永久记录。现在我们面临的问题就是这些记录技术所带来的后果是什么?我们要如何处理这些后果?」
「在某些特殊情况下,我们可能不得不忍受政府使用语音转化文本技术采取的大规模监听,但是至少需要有明确的使用规则与监督条款来确保这些信息在符合宪法原则下只使用于法律允许的情况或者是国家安全目的。」
不过 Kim Taipale 也表示使用计算机对于语音内容进行分析相比用人来监听对于隐私的侵犯性会小一些,因为使用真人进行监听可能会出现信息滥用以及错用的情况,毕竟每一个情报分析人员对于隐私的关切程度是不一样的。
但是美国公民自由联盟的高级政策分析师 Jay Stanley 认为使用人力还是计算机来进行监听对于隐私条款来说都是无关紧要的,因为他们一样都是在侵犯隐私,最终就是导致人们噤若寒蝉。
「人们只关心最终的结果,这种对于个人隐私的不断侵犯最终会导致人们不敢再开口说话。假以时日,人们会像害怕被人窃听电话一样对电脑窃听自己的生活感到恐惧,因为这两者带来的结果都是隐私的暴露。」
广告:再不做天使投资就晚啦!想投资到下一个滴滴打车、大姨吗、黄太吉?参投最高质量的创业项目,就上 天使汇 AngelCrunch !
标签: 监听 语音通讯 文本搜索 情报