9、跳舞小人

在领导的直接过问下,中大和中科院牵头对FAST的发现启动了新的研究计划。这里面涉及了一大堆事情,尤其是60K黑体辐射信息的破解研究,汪海成都是事后才知道的。

就在他要被潜伏在漆黑异界的心魔夺走神智,吸入无边无际的真空时,现实的锁链把他拉了回来,紧紧捆回地面。锁链泛着铜锈,肮脏恶臭。

房主电话打来的时候,白泓羽发现导师脸色骤变,一通电话来回变了好多张脸孔。汪海成挂了电话,她担心地问:“还好吧,老板?”问了两遍,汪海成才反应过来看她。

“不好。”汪海成答道,“很不好。”身为导师,汪海成也知道这些破事儿跟白泓羽说不着。但这些天的连续刺激让这对师生的神经都脆弱了不少,在贵州射电望远镜旁熬过了几个孤寂的夜晚后,两个人好像结成了奇特的联盟,那几天,只有两个人类相互支撑着,对抗着诡异难明的黑暗天顶。

回到珠海后,这个联盟不自觉地延续了下来。

汪海成简单地告诉了白泓羽有关房子的事情。“我要起诉。”他下了决心。汪海成原以为学生会支持自己,没想到白泓羽咬着嘴唇一言不发地看了汪海成半天,轻声说:“如果这房子最后买不到呢?”

这话里满是关切,类似事情发生得太多了。每个大城市,在某个特定的时候,都会像超新星爆发一样迎来一波房价暴涨,每波暴涨之后就会有许多原本一样的人被分成了两队:一队人落地生根,房子成为自己人生的最大财产,然后房子像镣铐一样把他们和这座城市束缚在一起,无论雾霾还是拥堵,都对城市不离不弃;另一队人被怒涛拍得老远,一步步看着之前还下得去手的房子变成下不去手,继而变成没钱下手,最后变成限购没有资格下手。几年之后,他们不得不跟那个生活了多年的城市告别,离开自己熟悉的工作,和结交多年的朋友。再过几年,两队人就成了从立场到身份都彼此迥异的两个阶层。

白泓羽跟汪海成道别,汪海成忙着打电话找人推荐房产律师。不知为何,白泓羽之前欲言又止的样子一遍又一遍地浮上他的心头。这是一个活泼得经常让人忘记她有多漂亮的姑娘,自己虽然老开玩笑问她怎么还没找到一个可以谈婚论嫁的男朋友,但对于自己的学生是一个女人这事儿,他一直没有太实在的感知。

汪海成是浙江人。据说往上数五代,也是名门望族,但那是新中国成立前的事情了,汪海成出生的时候,父母都是普通工薪阶层,和大多数江南地区的人一样,一来重教育,二来讲经济。汪海成小时候喜欢音乐,想学小提琴,家里就在他上小学的时候出钱请了小提琴老师,给他买了琴,每个月的学费大概占父亲三分之一的工资。学了四年小提琴之后,老师告诉父母,孩子的兴趣远比天分突出,于是重教育就让位给了讲经济。而那把小提琴也由老师牵线卖给了别的小朋友,毕竟一把琴也不便宜。

为了这个事情,汪海成和家里很是哭闹了一段时间,对天文的兴趣也是在这个时期慢慢占了上风——可能也跟家里的经济状况有关,看星星不用花太多钱,也不用请老师,没有级可考,自然就不会因此被父母终止,星空也是不可能被夺走的。虽然天文不像音乐特长那样有考试加分,但漫溢到物理和数学的兴趣却能换来更好的成绩,家里没有任何反对的理由——天文也不像音乐那样容易引起早恋,这就更让父母满意了。

如果家里有钱,自己是不是还在高高兴兴地拉着没有天分的小提琴?汪海成心里是没有谱的,也许自己一样早就放弃了,但那时他才十岁,幻想着小提琴是属于自己的世界,那个世界被生生夺走,留下了一个巨大的伤疤,一直没有愈合好。伤疤细长,一边连着对自己才能的自卑,另一边勾着对家里不够有钱的怨恨——这种怨恨隐匿着,不能说出口,和其他许多糟糕的欲望一样顽强地潜伏着。

伤疤就是一条毒蛇,哪怕汪海成今日已经是副教授,但依然被它咬着。而现在,房子又一次引发了他的伤痛:没本事赚到靠自己买房子的钱,家里也不富裕,支援了二十来万首付,再多就拿不出来了。但那时候汪海成还没意识到疤痕是怎么扭曲了自己的生活:他自认为是因为太宅,爱好太无趣才不敢向喜欢的女孩子告白,实际却是源于自卑。就像才能不足而失去了小提琴一样,不够优秀的自己也一定会失去心爱的女孩,伤疤的恐惧让他在爱情面前畏缩不前。

现在,很不幸的,社会偏见更加剧了汪海成在爱情方面的自卑,珠海的楼盘广告就飘着扎眼的文字:“不下手,别人见的是丈母娘,你见的只是阿姨。”他年纪也不小了,家里催着他早点考虑终身大事。事业、爱情,最后还是落在了房子上——至少广告、同事、朋友、亲戚,他们所有人都是这么说的。

这位中山大学的年轻副教授抱着这样复杂的愤怒,根据朋友的推荐,去见了房产律师。虽然律师事务所和学校间有公交直达并不远,他还是叫了出租车,双方签字盖章按手印的购房合同被他裹了一层又一层,放在双肩包里紧紧地抱在胸前,生怕出什么幺蛾子。

律师看完合同条款的第一句话是:“从你提供的资料看来,这么说吧,我们有很大把握能胜诉。简单地说是这样的,上个月深圳刚判了一个案子,跟你的情况基本一样,赢了。”

就在汪海成他走进律师事务所的同时,中科院联合中山大学搭好了信息破译小组的班子,开始破译那个连续几天都在深夜里化作怪物,把汪海成从梦中惊醒的60K黑体辐射信息。

戴森云是汪海成他们在FAST上的独立发现,但60K黑体辐射异常则被全球射电天文台观测到了——地球上每个天文台,不管当时天线在扫描哪个位置,都记录下了同样的异常辐射。这也是汇报之后破译小组加紧成立的原因:没有信息优势,就必须有效率优势。

为了大致搞清楚辐射信号的分析工作进展,白泓羽还专门恶补了密码学的基本知识。

早在几千年前,人类就开始使用密文来进行通信,借以掩饰所需传递的实际信息。根据考古资料记载,公元前古罗马恺撒大帝就已经开始使用被称为“恺撒密码”的加密方式和自己的朋友通信。直到二十世纪之前,准确地说,是两次世界大战之前,人类的加密方式都停留在恺撒密码的水平上。

这种最初级的加密方式又被称为古典加密法,也就是置换法——根据预先设定的特定规律,用特定的符号替换明文原文,生成一套无法直接辨别的密文。随着二十世纪初连续两次世界大战的爆发,战争双方通信和谍报需求暴涨,古典加密法就显得过于简单了。它只使用一套固定的加密算法和密码字典,密文本身虽然不知所云,但依然保持了加密前明文的语言规律。柯南?道尔的经典小说《福尔摩斯之跳舞的小人》非常完美地揭示了破解这种密码的办法:通过密文里出现的符号进行频率分析,再和语言规律进行对比,一步步确认密文可能对应的原文。只要有足够的密文样本来分析频率规律,总能把密码还原成原始语言。

相互监听和破译直接关系到战争的命运,而这时的古典加密法已经很容易被破解,为了满足战争的需要,更有效的加密方式应运而生。

一个思路是直接使用不为普通人所掌握的原始明文进行加密,比如二战期间美军曾利用印第安少数民族纳瓦霍人的语言作为战场密码——正是因为无法理解原始语言的规律,这一度成为日本军队无法破译的神秘密码。但是,当信息论和语言学被引入密码学之后,这样的手段失去了意义。不过,这倒产生了巨大的连带价值——大量曾经无法解读的考古文字被重新破译了。学者们发现人类毕竟还都是人类,不管他们使用什么样的文字,无论是象形还是注音,他们所要表达的意思内涵总是相同的,只要样本量足够大,总是能找到对应规律,通过频率分析找出答案。

频率分析手段面对自然语言几乎是无敌的,只要样本量够,一定有办法破解,所需要的只是足够的计算力而已。这直接导致了战争各方对运算能力的需求急速增长。从草稿纸到计算尺,再到电子打孔计算机,算力演进的军备竞赛成了决定战争胜负的重要因素。

在二战刚刚结束的1946年,算力的军备竞赛创造了一个伟大的成果,为破解德军密码而研发的ENIAC姗姗来迟。ENIAC,这个迟来的人类第一台计算机从此改变了我们文明的进程,地球走进了由恐怖运算能力构成的信息时代。

白泓羽这时才第一次意识到,密码学是人类二十世纪科技大爆炸的最重要肇因之一!

然而,她并没有意识到,人类文明已经再次站在因为密码而骤变的路口。

随着频率分析这个无敌武器的泛滥,加密方式终于不得不进行革新——用复杂密钥字典来代替简单密钥字典,以掩盖密文的频率规律。换句话说,原文的A在某些时候会被加密成X,在某些时候又会被加密成Z。密文字频与原文字频的联系被破坏,除非找到对应的加密字典,否则很可能永远无法解开密码。

二十世纪的冷战时期,间谍曾一度使用唯一的一次性密码字典:没有任何规律的解码字典所含的信息量已经远远超过了密文本身。除了发信人和收信人,任何人都无法破解密文的内容。但这种手法失败得出人意料:许多情报因为一次性密码字典丢失而变成了废纸。

冷战之后,随着计算机的普及,二进制数据代替自然语言成了通信的基本载体。语言频率分析法最终宣告失效——二进制数据文件有无数种可能的格式,要进行频率分析,第一步必须了解原文文件的编码规律——图像、语音等各种文件的频率复杂度远在语言文字之上。

然而,加密手段在计算机可怕的算力模型下飞速发展,区块链、公钥、私钥,加密算法的多重叠加达到了难以想象的程度,复杂字典也终于被抛弃了——在没有密钥的情况下,单纯依靠密码碰撞来破解,需要全球算力运行几千年。

但无论如何,加密逻辑依然是不变的:将明文原文通过特定的加密算法进行加密,加密算法结合特定的密钥,两者决定加密的实际过程。如果既不知道密钥,也不知道加密算法,密码的破解是非常困难的。

虽然白泓羽只是粗浅地研究了密码学,但作为一个科学素质满分的专业人才,这已经足够让她意识到问题了。

所有的人类语言学分析也好,密码频率分析也罢,都基于一个关键基础:人类的世界共识。

因为大家都是人类,身体都是由蛋白质、脂肪、糖类、水等元素构成,人类无论在哪里生活,都以基本成分相同的物质作为食物,需要水分和氧气;有两个性别,女性怀孕,胎生;双目视觉,有立体景深,视觉能侦测的电磁波范围在380nm-760nm,通过520nm(绿色)、480(蓝色)、700nm(红色)三种原色组合理解视觉空间。人类一切智慧交互的信息都围绕着这些物质基础进行理解:食物可能在不同文化中指代面包、米饭、烤肉,但不会指代月亮。这些物质共识决定了信息的组织结构:人类的嘴作为消化道的入口和发声器官,语言里自然会把说和吃的语意进行混合,同样如果人类是腔肠动物,食物的消化和排泄都通过口器进行,那么“吃饭”和“拉屎”很可能是同一个词。

那么,一个信息不是来自人类,甚至不是来自地球,我们要怎么去破解这些信息的智慧内容?

白泓羽想起一些科幻作品里人与外星文明的交流,这时候就觉得很滑稽。想要理解来自人类以外的信息,必须和对方面对面地用同样的指代一对一完成语意对应。但是这也很难,你怎么知道外星文明往看起来像嘴一样的器官里塞东西是吃饭,而不是**?你怎么确定外星文明是单性繁殖还是多性繁殖?

白泓羽眼前似乎出现了一群章鱼一样的奇异生命,悬浮在高密度的维生液里,隔着透明的落地窗和自己交流,自己和汪老师站在落地窗的一边。汪老师拿起一个面包放进嘴里,说:“食物,吃饭。”然后章鱼心领神会地抓起什么东西塞进可能是头部的一个孔里。一串咕吱咕吱的怪响过后,章鱼像是颈部的体表出芽似的长出一圈小号的章鱼头颅,然后几十个头颅挣扎着从母体分离出来,长出触手,扑上去把母体分尸吃了个精光。之后,几十条小章鱼异口同声地在落地窗另一头叫着:“阿库达,阿库录!”

想象着这样混乱的场面,白泓羽就忍不住低头捂嘴——妄想里汪老师吓得张大了嘴,半个面包从嘴里掉下来的样子栩栩如生。白泓羽控制不住的那些稀奇古怪的想象,既让自己感到无语,同时又忍俊不禁。如果汪老师在,看到她莫名其妙地发呆,然后又呵呵傻笑,肯定会大叫:“正常一点,姑娘,记住自己是一个正常的人类女性。”

想要完全理解一段首次接触的信息的智慧意义几乎是绝无可能的,但是能不能判断出这些信息是否来自智慧文明,信息中包含文明意义呢?

不好说,当年人类射电望远镜第一次发现脉冲星的时候,因为它精准的周期性电磁信号,也曾被认定是智慧生命的广播。天文学对于宇宙的了解还太少,要判断一堆规律信号到底源自天体规律还是文明智慧,未必像人们想象的那么容易。

正陷入这种失落情绪的时候,白泓羽接到了院长的电话。

“小白,我记得你有生物硕士学位,对吧?来逸夫楼一趟,四楼,407。”

“院长,出什么情况了吗?”

电话那头传来一声沉重的呼吸,“60K黑体辐射信息,我们怀疑有了结果。”

白泓羽看了下表,从向领导汇报完毕到现在,还不到六个小时。

领导过问之后,60K黑体辐射信息的破译工作作为绝密级项目开始运行。在这样的保密要求下,找核心研究人员就是一件很麻烦的事情。能力够强,又要政治过硬,关键是还能在很短时间内借调过来。这样的人选自然要先从有军工背景的研究机构里找,乐观估计,一周之内能筛选出初步人选就不错了;之后再安排人事手续,评估,政治考核和保密培训,运气好的话,一个月后或许可以开始工作。

这个时候,项目只有一串编号,连名字都还没有,谁也没想过连专业研究员都没有加入时能出什么成果。

所以仅仅六个小时之后,他们得到一个结果的时候,可以想象相关人员都是什么表情。他们的第一反应不是“是什么结果?”,而是“哪儿来的什么鬼结果?”。

搞出结果的是军区信息所的初级工程兵,叫赵侃。瘦高个子,尖嘴猴腮,一口武汉口音的塑料普通话。之所以派他过来,一是因为信息所就他一个人没有急活儿缠身,二是需要有人提前准备研究设备、保密网络、监控程序、沙盒数据库之类。等真正负责的专家来了,肯定还需要有人维护软硬件打打下手,解决点杂事儿,这也是他的工作。赵侃有权接触数据,但是谁也没指望他能独立开展什么有成效的工作。如果在企业里,他这样的人就是修电脑的网管,在互联网公司里则被称为“IT”。

因为知道专家短时间内还无法到位,而办公室保密网络既没有外网,更别提什么娱乐,赵侃实在闲得无聊,于是决定折腾点事儿。60K黑体辐射数据量很大,播放了大概有二十四小时,这些辐射有非常明显的峰谷波动。赵侃也不懂什么高级的数据处理算法,他用原始办法建了一个数据表,电磁波峰记录为1,平缓的波谷记录为0。这些数据他一个个手动输入,足足打了一个小时,直到记录了一大堆二进制数据之后,他终于觉得累了,这才停了下来。

赵侃的第一个想法,是可以当作摩斯码,把01当作点划来处理,看看能得到什么结果。这次翻译尝试以一堆乱码告终,但这让他发现二十四小时的播报实际是周期循环的,换句话说,有效的部分并不长,大约只有十来分钟的信息,然后这段信息不断重复了二十四个小时。

接下来,赵侃把连续峰值的部分都加了起来,用0作为间隔。111011010111101换成了302010401,这让他发现了一个基本但重要的事实,即连续的峰值最多重复四次,绝对没有出现过四个以上的连续波峰。如果去掉0这个明显的间隔符号,数据就变成了元素只有1到4的数列:32141……这时候,有效信息量已经变得非常小,只有几百比特,也就是不到1KB的量。

这个结果是很让人失望的,几百比特如果用字符来表达,只有短短几百个字。这个信息量小得太离谱,完全不足以用来分析其中的语意——如果这里面真有的话。对于赵侃来说,这倒谈不上多失望,因为他并不真正理解地外文明信息的意义。

以赵侃一个中专毕业,靠技术培训上岗的信息工程兵的水平,这些简单的信息处理已经是他能力的极限了。

随后他又花了一个多小时,把所有的60K黑体辐射信号按这个简单的编码方式处理成了数据。如果赵侃系统学习过数学,那他肯定知道这些数据符合四进制数据的规则。而他现在输入的记录本身违反四进制数据的记录方式——四进制的标准记录方式是使用0到3的数字,不是1到4。

可能只是出于好奇心,赵侃在结束自己的没事找事前做了一个违反操作规程的事情:他把这个数据丢进了信息所的爬虫天网。

爬虫天网是一个大型的分部式网络预警系统,通过不断过滤互联网数据里的信息进行自我学习,最终从网络热点中监控和预判各种可能出现的异常。毕竟互联网很早以前就已经代替了所有媒体,成了最重要的传播方式,在新的形势和挑战下,敌对势力为了达到对网络信息的利用和攻击,窃密早已是公开的秘密。要应对各式各样的渗透和攻击,光靠亡羊补牢是行不通的,爬虫天网就是以A.I.自进化学习的方式预判可能发生的信息攻击,提前堵住漏洞。

这套系统的建设和实验已经进行了很长时间,爬虫天网的数据触角早就渗透了QQ、微信、微博、论坛、网站后台等绝大多数常规网络数据,暗网的隐秘空间也被基本覆盖,但因为自我学习效率还不是很高,实际效果并不理想。反倒是信息收集效果意外地好,几乎可以说是无所不知,只是它还不知道该怎么利用和处理这些无所不包的信息。需要调查的特征观测数据被丢进爬虫天网之后,系统会查找爬虫触角所有的相关信息,去核对这个特征数据的可能模式。

两个小时之后,爬虫天网反馈了一个非常奇特的结果:来自南京大学模式动物研究所的非公开数据库。数据库的题头是“国家遗传工程:小鼠资源库”。

以赵侃的知识水平,他没法判断这其中可能隐含什么意义。因为这些操作多少都有点违规之嫌,他还犹豫了一下是应该上报,还是把这些结果都抹掉——这个结果看上去也没啥关联性,可能连巧合都算不上。

最后,这个信息工程兵还是老老实实把结果报给了自己的领导。

二十分钟之后,白泓羽被叫了过去。

这时的汪海成还在忙着准备材料,跟律师沟通如何起诉,为了在这个房价不断暴涨的时代维护自己的一点权益而努力挣扎。

展开全部内容
友情链接