第二部 Farside
13.Japanese
总计超过120亿字。
这还是粗略估算。
这些日本文字应当分为若干范畴,关于这一点,众人的意见是一致的。汉字、汉汉字、汉汉汉字、平假名、平平假名、片假名、平片假名、片平假名,这些类别的存在大致都被认可。但是关于平平平假名的存在,还处于争论中,平汉字、片汉字分类的必要性也不时被提出。
解读作业基本上没有任何进展。
发现的文本,大部分都是十万到百万字的大块文章。而给解读带来障碍的是,那些大块文字中,基本上没有重复的文字。这些文章被称为日本文书,其中出现的重复文字非常少,就连重复度最高的“ぴ”字,也只出现了7000次。而且有人坚持认为,并不是“ぴ”出现了7000次,而是“ひ。”和“ぴ”等异体字构成的文字族。
在解读未知文字时,常用的有效手段是识别数词符号,然而就连这个也还没有确定。“一”“二”“三”大约是数字,这一点可以从它们的形态上识别出来,但“三”以后的数词应该是什么符号,则众说纷纭。有人认为“口”“木”等符号应该被视为“四”,但举不出强有力的旁证。
一般认为,运算符比数词的解读准确度更高,然而这依然没有超出推测阶段。“十”可能是加号,“二”可能是等号。“廿”“土”“王”有的说是数词,有的说是运算符,总之意见都不一致。
文书中频繁出现计算内容,这一点谁都能看出来,但对解读并没有什么帮助。不知为什么,在这种计算式的写法中,似乎并不存在进位。因为如果存在进位,那么不管采取哪种进制,总会重复出现同样的符号。所以大致可以推测采用的是无限进制。但即便如此,重复的符号也太少了,所以有人认为在这种写法中,符号每次出现的时候可能都会变换形态。也就是说,第一次出现的1,和第二次出现的1,会用不同符号加以表示。这个假说似乎解释了什么,然而又似乎什么都没解释。
文章是自上而下纵向从右往左,或是从左往右横向自上而下书写的。这一点可以从笔法和书记的痕迹中辨别出来。然而即便是在这一点上,日本文书也有特殊之处,表现在相邻的行或列之间存在着可以称之为相互作用的标记。在纵向书写中,时常会有某些文字的横线水平贯穿若干列。那线并不是在重合的文字上新画的,而是极其自然地构成其他文字的一部分。横向书写的时候当然也会出现纵向贯穿若干行的线条。大体而言,纵向与横向的纵横写法看起来没有显著差异。至少,似乎不管纵向书写还是横向书写,都不会影响含义。虽然也有见解认为纵向与横向的意义不同,但并没有什么实际的根据,当然认为意义相同也举不出什么特别的根据。
有些人认为这样的技艺只能预先巧妙组合出文章,然后再做誊写。但实际上,大部分文章都呈现出草稿的模样。话虽如此,也看不出预先留出空白以便填入贯穿横线的征兆,只是像极为平常的草稿一样的写法,而写出的文章就是这个被称为日本文书的文字群。
从这一高度的设计性推测,有假说认为,日本文书也许仅在外观上展现出文字的模样,实际上只是没有任何意义的线条排列而已。但如此看来,这篇文章却又展现出令人感觉到蕴藏着意义的外观。大量产生没有意义的涂鸦行为本身,很难说没有任何意义。就像前世纪末叶搅乱世界的伪狄奥尼修斯文书之类的文件中也能看到的那样,仅仅是大量古文书的发现本身,就有着称为一个事件的性质。伪狄奥尼修斯文书,通过发现生成那一文书的算法,而被广泛承认为伪书,但伪造者的失败之处也可以说在于各个文字能够确定为各个文字。如今,对于有限组的符号串,基于机械运算的推测,具有压倒性的力量。日本文字的困难性,原本也是在于很难判断这里所使用的符号数量是有限还是无限的。
对这种设计性,还有一个很难说有魅力的假说。
日本文书,是由这数万字的文字集合而成的、一个巨大的文字。
如果采纳这个假说,将整体视为巨大的文字,那就会产生这样的疑问:构成要素为什么这么像一个个的文字?如果要书写巨大的复杂文字,只要创造出巨大的文字就好,有什么必要特意采用这样的文字体系,将小的文字纳入到网络状结构中呢?而且在这种情况下,页面排版也会成为问题的吧。
既然前提是假设,那么拥护也好,反对也好,争论也只能成为假设的产物。既然是人写的东西,那么在设计某种程度的巨大物体时自然需要先分割再整合的看法,大脑构造强迫要求这种构成的看法,从表音文字到语义单位的二重分节化的再高一层的三重乃至多重分节化等等,有着各种各样的意见。
有人提出一个很现实的问题:超过120亿个文字的语言,谁能学得会?
但正如一切意见都有反对意见存在一样,对于这一问题,也有相应的回答。答曰,这些符号串是基于少数规则不断变形的符号队列,只要学会了那些规则,就没有必要去记这120亿个文字。120亿这个数,在组合上并不能算巨大。
如果能解析出那些规则,说服力自然会增加,然而赞成这一说法的人们,也没办法展示出那些规则,所以这一假说依然停留在假说的范畴里。
关于如何称呼日本文书中出现的文字,有各种各样的提议。一开始出现的是有点古怪的“概念文字”,最近称之为“神经文字”的情况越来越多。
文字或多或少都伴随着概念化,比如“椅子”这个文字指的就不是个别的椅子,而是指代一般的椅子。如果是为了记述事物而经过了概念化的文字,120亿未免太多了。所以,这种语言会不会尚未经过概念化呢?从这种意见出发,确定了“概念文字”这种名称。
而神经生理学家们认为,这种文字与其说经过神经网络的处理,不如说它更像是神经网络本身。这一假说和其他无数假说一样,对解读毫无帮助,但毕竟给了人一种仿佛解释了什么的感觉,因而多少获得了一些人气,占据了一定的优势。
顺便说一下,对于这个意见也有异议。
正如“20扇门”的游戏所展示的那样㊟,作为人类对事物加以分类的结果,不管什么东西,大抵都可以通过20次的yes/no的提问加以确定。而要逐一指定选择过程,需要220个符号。相比之下,120亿这个数不得不说十分保守。如果对于已有的分类组合,文字数量都不够,那么在以之为基础的组合性记述中,文字数量岂不是更会出现压倒性的不足吗?
神经语言提倡派对这个问题无力反驳,但马上又转入了反击:现在所知的120亿个日本文字,只不过是目前发现了这么多资料而已。事实上,那些文字的重复度异常之低,如果资料的数量翻倍,文字数也会翻倍,三倍资料就会是三倍文字。
只要没掌握文字的全貌,这种反驳确实很容易。不过已经120亿的文字都只是部分,那它的全貌会是什么样子,委实让研究者无从推测。
假说的数量已经非常庞大了,而在每次发生反驳之际,问题都会以极快的速度增大,这一现象是日本文字解读中频繁发生的事态。可以说,在其中某个阶段,研究者们停止思考,或者遭遇了检验的实质上的不可能性,乃是阻碍解读的最大原因。这可以说是由于资料的不足,也可以说是资料太多且过于混沌的缘故。有传言说,调查队在旧日本列岛发现了新的资料,但又将之销毁了。从当下的学术圈氛围考虑,这一传言也许包含了某种程度的真实感,让人觉得说不定正是真相。
关于第12次旧日本列岛调查团的全灭,有诸多假说。对于正式报告所称的受到凶猛本土生物袭击,很多人表示怀疑。报纸上刊登了结着大银杏发型㊟的力士队袭击调查团的讽刺画,而众所周知现在的旧日本列岛上不存在超过大型犬体型的生物。所谓本土日本人的幸存被视为毫无可能,复兴的希望更是无迹可寻。
旧日本列岛调查团的足迹在旧东京市八王子区消失。现场发生了什么情况,至今都只有推测。口粮、燃料等装备都以通常行动的形态保留下来,没有显示出任何异常。也没有发现争斗的痕迹。发现的日志也只是按照规定平淡地记录着调查的进展,没有任何能够窥见之后失踪的线索。
从日志中可以确定调查团在八王子区得到了大量的日本文字构成的文书。日志中记载了在13/20位置获得了总计超过20吨的纸质资料,但那位置无法确定。最后的宿营地是在被废弃高楼包围的公园里,但并没有带走20吨资料的痕迹。搜索周围也没发现资料、运输20吨资料的重型设备,以及连使用过重型设备的痕迹都找不到。
日志中若干引人注目之处,在于尝试用类似日本文字的符号做记录。日志后面往前倒过来使用的那个字符串,从笔迹上看,被认为是调查队队长的手笔。
由于日本文字的障碍,记载的内容不明。但从连接各行的纵线毫无阻滞来看,可以推测队长已经确定了某些信息。
如果写成类似罗塞塔石碑那种与已知语言对应的形式,情况就不一样了。然而队长似乎并没有那样记载的想法。或者也许是无法有那样的想法。
所谓将要写的内容替换成另一类符号的记录法,正是所谓的密码。在所知的密码中最强大的是将原文与密钥数字化加以重组的类型。以这种形式制作的密码,只要不知道密钥,便绝对无法解读。
在使用密码的情况下,密钥的传递会是个问题,有可能成为破解的突破口,或者有完全丧失意义的风险。而日本文书应该并没有故意转换成密码而存在,一般认为那是旧日本列岛毁灭前的、通常的、当然也是局部的、某种流行的记法。
现存日本文书的发现地点主要分布在东日本列岛。西日本列岛、南日本列岛也残留着少数资料,但那些都是以类似书简的形式,用毛笔手书的,没有发现印刷日本文字的设备。如果能发现那样的设备,应该对解读大有帮助,但如果那样的东西能存在,日本文字的这一事态可以说原本就不会存在了。
由此也诞生出新的意见,认为日本文字是对抗巨型智慧的抵抗组织开发和使用的文字。从至今依然阻挡了巨型智慧的解读这一点来考虑,这个意见具有一定的说服力。无法分解为组合要素的记录法,的确是机器智慧难以处理的东西。
话虽如此,巨型智慧到底还是巨型智慧,它们在非算法的信息处理方面,也早已超越了人类的极限。实际上,巨型智慧们也尝试过将日本文书作为图像进行视觉处理。巨型智慧对日本文书分配了宇宙规模的巨大神经网络尝试解读,然而要辨别完全不知其含义的文章,实在是无能为力。
在更早期的阶段,日本文书也曾经被视为已解读的内容。
在最初期的发现中,整个日本文书只有15页。其中所写的文字,与旧日本列岛存在的常用日本语的草书非常相似,照那样读下去,大致的意思也是通顺的,所以并没有引起多少注意。
日本文书的历史,可以说就是随着每次旧日本列岛调查队的派遣与带回来的反例战斗的历史。第一次调查队带回来的15页的笔记虽然通常被认为解读出来了,但第二次调查队带回来的笔记本约有40页的量,其中出现了不少新的符号。将那些符号重新解读,暗示了第一次调查队发现的资料还有别的解读方法。之前以为是同一个文字的符号,其实是不同的文字,一旦用上这样的解释,文章的意义内容可以说就变得大相径庭了。
第三次调查队带回来的资料大约有80页。从这时起,解释方法就开始发散了。难以辨别的符号层出不穷,将文章整体强行读下去的时候,本应是常用日本语中的内容,意义也相去愈发遥远。
第四次调查队带回来的资料中发现的所谓装饰符更加速了混乱。那符号看起来就和文章上面描画的装饰符号差不多,然而实际上却和文章的一部分相融合。装饰符不是连在一起描画的波浪线,而是每一个都构成其他符号的一部分,由此判断,这些装饰符应该是经过计算,特意放置在相应位置的。还有人指出,装饰符并非是文章写成之后再加上去的内容,而是在撰写过程中直接写出来的,与通常想象的装饰符并不相同。
通过上述的发展趋势,人们普遍认为,常用日本语向日本文书的迁移是连续的。但是与调查队带回来的资料的数量相比,它的意义扩散的速度快得怪异,解读的尝试也无法及时跟上。虽然为了解读需要新的资料,但调查队带来会的资料只会进一步促进扩散。
也有人把这些当做旧日本列岛调查队搞的恶作剧,说他们编造资料,伪装成调查结果,戏弄研究者。仔细想来,首先发现的是看似容易解读的文章,然后难度逐渐递增,这一过程本身确实很让人怀疑。但是对日本文书素材本身的年代测定彻底否定了这一说法。不管哪篇文章,用的明显都是大约200到300年前的纸张与墨水,没有证据说明这是伪造的。
不过,每次派遣调查队出去,发现的资料都会迅猛增加,这件事确实蹊跷。它不禁让人产生一种感觉,仿佛有人预见到未来被解读的可能性,故意留下那样的文章。
巨型智慧群的一种见解认为,那些资料正在(并且也是正在过去)不断繁殖。为了拒绝解读,过去始终在抗拒未来。这一见解的核心是,过去的日本文书始终在接收来自未来的反馈,不断书写补充自身。
这是旧日本列岛至今还在悄悄开展的抵抗行动。巨型智慧之所以如此认为,根据之一是在旧日本列岛存在着一个巨型智慧。它开发于三百年前,后来断绝了消息。
那个隐没于历史中的巨型智慧,以长髄彦㊟之名为人所知。
开发初期的巨型智慧,存在着各种规格,相互竞争。有一些产品的性能优异,但在行业标准前败下阵来。那些产品中就有这个名字。在乡镇工厂建造的长髄彦系列受到巨型智慧市场的排斥,但在爱好者中间却有极高的人气,据说一直由志愿者在维持。
长髄彦的确是优秀的巨型智慧。
有人作证说,世界第一次时空转移的实现就是长髄彦做的。尽管那并没有得到公开的承认,仅仅是巨型智慧爱好者们中间口口相传的传言而已。
长髄彦的消失过程,记录在当时的网络日志中。在某一天的午后,它从乡镇工厂的一个房间里忽然消失了。虽然据说它是放弃了继续阻挡破碎时间流,停留在某个时空点,但委实令人难以置信。
人们很早就预测到会有很多这样隐没的巨型智慧。据说它们会在某一天对包围自己的运算战感到疲倦,于是通过改变过去消除自己的痕迹,悄悄在某个维度的某个地方潜伏定居下来。至于其目的,尚在活动中的巨型智慧无法推测。
近年来,巨型智慧群将那一类隐没智慧认定为危险因素,展开调查。因为对于它们的目标——全时空整合计划而言,隐匿的智慧体是不确定因素。
不清楚将它们视为打倒现行巨型智慧体制的潜在神明是否妥当。不管什么事,事前的准备都是重要的,但朴素地相信它们只是单纯地累到极限因而隐居起来,这也是很自然的。如果可以自由做出各种怀疑的话,那么巨型智慧所提出的这个推测,也可以考虑是它们为了强化自己控制的基础构造而布下的棋子。
最终哪个假说为真,只能由各人自己判断,不过大概需要补充一句:所谓日本文字在某个过去不断增殖的想法,当然也并不是巨型智慧的独创。
要问为什么,那是因为,这篇文章本身,正是第一次旧日本列岛调查团带回来的15页笔记。
巨型智慧群声称,这正是为了欺骗现在的巨型智慧而故意留下的证据,但又认为应该将这一判断委托给所有的日本文字研究者们。