第739章 文字、编码、碱基序列
第739章 文字、编码、碱基序列 (第2/3页)
按照我的理解,如果用DNA序列当做编码记录信息,那么应该是一种四进制编码。
“而我们的计算机用的是二进制编码,单从数学上来说,四进制编码可以记录的信息是二进制的两倍。
“二进制需要四位数才能记录的信息,四进制只需要两位数就能完成。
“两倍的差距,其实不算大,所以如果用生物的基因序列记录信息,那么所用的编码方式,应该不会有太大的区别。
“陨石文明,我们暂时将这个在微生物基因序列中记录信息的文明叫做陨石文明好了。
“陨石文明用的肯定不是汉字,但无论用的是什么文字,表达情感、思想的作用是不会变的。
“也就是说,陨石文明把他们的语言,用四进制编码写在了微生物的基因序列里,那么我们可以通过我们的语言特征,对陨石文明的文字编码做一些推测。
“大家都懂电脑,应该知道,一个汉字占用两个字节。而一个字节,换成二进制编码,其实是8位数。
“也就是说,在我们的计算机编码里面,一个汉字需要16位二进制数字才能表示。
“我们的汉字有几万个,但其实1000个常用字就覆盖了92%的书面资料,剩下的几万个生僻字,是很少用到的。
“这些生僻字平时用不到,但是必须要在编码里给这些生僻字留位置。
“这就导致了这些代表生僻字的编码,很少会出现,常用的那1000个字,则会重复出现。
“我不知道陨石文明的文字是什么样的,但文字和语言,应该会有相似的特征。
“这些特征会影响到碱基编码的排列,当某些编码片段重复出现的时候,就符合文字编码的特征,有可能就是陨石文明留下来的文字。”
牛大志被说得一愣一愣的:“为什么你说得每一个字我都知道,连在一起就完全听不懂了。”
“听不懂就对了,你只要产生听起来很厉害的感觉就足够了。”伊芙对此很满意。
牛大志好像找不到反驳的理由,
(本章未完,请点击下一页继续阅读)