摘要:年,奥戴德·申卡尔从商业视角著述《中国的世纪》。年,第七届芒克辩论会以“21世纪属于中国吗”,从经济、外交、民生等领域进行了激烈辩论。大家们宏大叙事纵横千里。笔者年管窥信息输入、存储、传输,拙小文《21世纪属于中国之证明》。今值张首晟老师僊游四周年之悼日,再从文字、货币、算力出发,微观底层捉刀,容窃妄语证明。讲好中国故事自奉首肯之告慰。
关键词:21世纪中国汉字形论数论维度
一、形
文字的本质是线条。香农说:信息是不确定性的消除。笔者解读为:信息为区别。
1.1文字之形的本质
亚里士多德说:语言是思想的符号,文字是语言的符号。人类整个思想体系和文化建构全部基于文字符号。只有文字符号的发生,才能引导和建构思想的伸展。人类的思想是在符号系统上运行的。
《易经》是前文字符号系统,三千三百年前甲金文都未发明之先,最早最原始的非文字符号系统(极语言编程传承薪用)。前文字符号是比文字更幼稚、更简单、更原始的符号,它所承载的信息量要比文字系统小得太多。用数学术语叫二分法。用极简的阴和阳,概括生死、天地、南北等等。古人观察细微。以眼睁区分生死(生阳死阴)。当升级到文字系统,画眼珠列为生物,例如鸟、目。以阳光照射区分方位。太阳能照射到均为阳,背阳为阴。如汉阳、洛阳、衡阳;淮阴、华阴、湘阴。
语言是从口到耳的传递,文字是从手到眼的传递。文字最初是生活场景中的一幅画。随着文字的发展,必须和语言结合才能有效使用。于是那些可以用单音节,即一个发音表达的符号才被保留下来。凡是早期图形过度复杂,须用一大堆语言才能把它说明的,这些文字符号被时间抛弃。如古埃及象形文字和古巴比伦楔形文字(象形文字的变种)。中国的象形文字和古埃及的象形文字有明显的差别。中国的象形文字半抽象化(凸显骨骼),而古埃及象形文字非常具象。比如人,古埃及画得非常逼真。中国甲骨文用二根线条,勾画出作揖侧影形态。再如牛,古埃及把一头牛囫囵完整画出来。中国甲骨文用三根线条,将牛最特别的牛角勾勒凸现。[1]
文字是刀笔刻画而成。为什么古埃及象形文字十分具象而中国甲骨文线条极简?是因为书写工具与承载材料不同。古埃及产纸莎草。把草拨开,形成类似纸张的书写材料。尼罗河边拔根芦苇秆,沾上草木灰黑水,即可在纸莎草上流畅地画画。因此他们的象形文字无需节约线条。中国没有这种草,纸张是汉代以后才发明。中国古人书写材料选的是硬质的龟甲或牛肩胛骨,用石刀或青铜刀在硬甲骨板上刻写。书写材料极硬,中国古代象形文字不得不简约线条而抽象化。
文字之形的本质是线条。在环地中海地区,由于开放地貌,种族部族之间来往密切,或经商或战争,民族扰攘文化交流不断。当来到另一个部族,既看不懂象形文字,也听不懂说话。只剩一个办法,就是把对方说话的发音用音标标注下来。慢慢地大家最终在交流中只使用这个音标体系,而把各自原来使用的象形符号丢掉,这就是拼音文字的来源。它一定发生在半隔离半开放的地理环境之中。注定它是象形文字晚辈。中国东海南山西沙北原地处摇篮,所以象形文字至今。地理决定着历史及文化。公元前一千年,腓尼基发明了拼音文字,26个罗马字母中近似22个。拼音、象形文字均线条构成。
1.2汉字之形
汉字随着时间演化至今之简体。基本笔画就四种(米),折弯钩是基本笔画的连续(连笔)。
1.3汉字之形高效率
极简画就是线条。线条本质属性最终是长度和方向。线条长宽比为1是正方形,无法区别(信息熵接近0,无效用)。汉字笔画四元素,在字宫里,紧凑有序,承载高效。
下图:横坐标是斜率(0-度)。纵坐标是长宽比:1为正方形,假设4为汉字宫格边长。红色区域为笔画元素居所范围。在笔画最高区别度前提下,红色区域致密紧凑。汉字最大程度做到了“消除不确定性”,即信息量最大化。
汉字笔画极简本质
二、数
物理学家:信息的本质是能量差(专业语:能量梯度)。数学家:itfrombit[2]
2.1信息熵
信息论之父香农于年10月发表于《贝尔系统技术学报》上的论文《AMathematicalTheoryofCommunication》(通信的数学理论)作为现代信息论研究的开端。香农给出了信息量——熵的定义:
香农定律:信息熵
质量是衡量物质的量,单位是千克kg。信息熵是衡量信息的量,单位是奈特nit。在计算机里叫比特bit,1nat=1.44bit。计算机是以半导体二极管电流的通或不通进行运算,本质是能量差来记录信息。
2.2汉字信息熵
单个汉字是9.56;单个英文字母是3.9。[3]
2.3汉字信息熵高浓缩
以《联合国宪章》为例。按