偶然相遇—— 随机数传奇

偶然相遇——随机数传奇

如果不是因为随机数短缺,历史上最有名的一个间谍网恐怕就永远不会暴露。这一短缺发生在1941年末,也就是第二次世界大战开始两年后。当时,希特勒的军队企图踏平莫斯科,苏联领导人斯大林下令重要人员撤离该市。在随后的混乱中,苏联情报机构、克格勃的前身——内务人民委员部(简称NWD)犯了一个错误,导致试图渗透美国绝密计划——“曼哈顿”(美国原子弹研发计划)的苏联间谍全军覆没。

上述错误与NKVD的密码册有关。这些密码册都只一次性使用。它们运用随机数扰乱字母、单词和短语组合顺序。任何一次性密电的随机数密钥都只有密电发送和接收者知道。没有密钥,就不可能解读加密电文。一次性密码使用一次就销毁,如果使用得当,密电就完全不会被破解。但制作随机数密钥需要印刷大量随机数。外界无人知道苏联人怎样产生随机数,毕竟当时计算机还处在雏形阶段。有一种说法是,NKVD雇佣一批女性在一个房间里随机说出数字。还有一种说法是,NKVD使用了一种类似彩票机的装置,利用号码球形成随机数。

据退休女物理学家简后来回忆,苏联当时无法快速制造所需的足够随机数。面对加密数万份密电的需求,NKVD官员图省事,印制了超过3.5万张复制的随机数密钥分配给战地间谍。这一致命错误让美国译码员通过寻找加密电文中的重复模式,破译了原本牢不可破的密电。

两年后,即1943年,美国军方的信号情报局(国家安全局的前身)开始执行旨在监视苏联外交电报的“维罗纳”计划。1946年12月,年轻的美国语言学家及译码员加德纳破译的一份密电中提到了参与“曼哈顿”的美国科学家名字。这最终导致向苏联泄露美国原子弹计划的所有间谍曝光,其中包括在1953年被处决的一对夫妇。“维罗纳”在美苏冷战中的重要角色直到1995年才为公众所知,当时该计划被最终解密。

简告诉记者,直到1980年,美国情报部门依然通过“维罗纳”破译苏联密电。简的丈夫理查也是洛斯阿拉莫斯国家实验室的退休物理学家。“二战”期间,就连洛斯阿拉莫斯镇的存在也是高度机密,参与“曼哈顿”的科学家均使用当地的同一个邮箱。

目前产生随机数的方式不可持续,网络并非那么安全。那么,能否找到一种不怕黑客破坏的随机数产生方式?

简和理查都对随机数的现状感到担忧。一个鲜为人知的事实是,如果没有随机数,国际互联网和全球大部分经济都无法运作。作为网络安全的源泉,随机数保护着从国家电网到机票销售的一切事物。就像间谍使用的一次性密钥,联网电脑互发随机数作为密钥来解锁数字密码。当然,电脑密码不是为了保护间谍身份不被泄露,而是为了加密网上密码、信用卡数据等等。

其实,你每次在网站购物或输入信用卡信息,你所使用的电脑都会从其核心部位产生一个随机数,它把你与电脑的交互和你的身份与任何他人与电脑的交互及其身份区分开。虽然随机数导致经济崩溃的危机并非迫在眉睫,但产生随机数的技术显然已难以跟上互联网流量的无限制增长。诸如亚马逊这样的巨型网络零售商的电脑,可能需要同时处理上万桩交易,其中每一桩都需要一个独特的随机数密钥。6年前的一项研究发现,在互联网使用的近2.7万个密钥(抽样样本)实际上不是随机数,因而无法抵御黑客侵袭。所以,目前产生随机数的方式是不可持续的,网络并不像人们以为的那么安全。

能否找到一种不怕黑客破坏的随机数产生方式?这一任务比听起来要困难些。

随机性必须具有不可预测和不可复制特征。随机性的本质特征是可重复,即两种概率相等的状态中有一种可能出现得多得多。

究竟什么是随机数?计算机怎样产生随机数?随机性并不总是容易识别。考虑这串数字:1.41421356237309504880168872420(简称数字串A)。它看起来当然是随机的——它没有任何可识别的模式。任何随机数都必须满足的标准之一是:随机数串当中每一个数都独立于它之前那个数(比如不能是1248,因为这个数字串中每个数都等于它前面那个数乘以2)。数字串A显然符合随机数的这个标准。但数字串A并未达到密码学所要求的随机性程度。虽然看起来是随机分布的,但数字串A是可预测的:它是2的平方根。因此,数字串A不能被用作一个密钥来加密数据——任何懂一些数学的人都能识别这串数字。为了高水平安全,只有复杂性是不够的,还必须有不可预测性和不可复制性。

大多数人都对随机性的本质有所见识。人的直觉在随机性王国中失败的一个经典例子被称为“赌徒悖论”,即相信过去的结果会影响未来的结果。例如,如果前10次抛硬币的结果都是落下来的硬币正面朝上,那么你很容易相信第11次的结果是反面朝上。但实际上,正面或反面朝上的概率均为50%。西方人在不经意间对“赌徒悖论”的信奉,毫不奇怪让许多赌场赚了大钱。这方面的一个著名案例出现在1913年8月18日的摩纳哥(欧洲西南部国家)蒙特卡罗赌场。当时,一只轮盘(赌博工具)的轮子连续26次停在黑色位置。在此过程中,赌徒们不断加倍对轮子停在红色位置的下注额。那一天,由于赌徒们对随机事件不能重复的笃信,赌场简直赚翻了天。事实上,既然是随机的,就不是均衡的,如掷硬币时反复多次出现正面向上的结果,而不出现或很少出现反面向上的结果。也就是说,随机性的本质特征就是重复性,即两种概率相等的状态中有一种可能(重复)出现得多得多(这叫作偏倚)。

作者:刘安立
       来源:《大自然探索》2019年第01期