Friday, November 28, 2025

同音词和中文字母化

王玉江:同音词和中文字母化

最近《华夏文摘》有一条线讨论同音词和中文字母化。起因是有人认为,由于所有的拼音方案都没有解决同音词问题,因此中文无法字母化。这种论调不是现在才有,可能从一百多年前有人反对中文字母化就存在了。本文就谈谈同音词和中文字母化。


一,同音词

中文里有同音词是因为中文里有大量的同音字。新华字典收录约一万个汉字。汉字的读音如果不算四声只有四百来个,平均一个读音对应25个字。不过它们不是平均分配的,有的读音只对应一个字,最多的yi对应134个字。如果我们说话时用一个声音代表一个意义,写下来就是一个字。但我们说话不全是用一个声音代表一个意义,有时候是用两(多)个声音代表一个意义,写下来是两个字,这就是一个词。

同音词就是读音相同字不同的词。例如“树木”和“数目”,它们写成汉语拼音都是shumu。单独看拼音确实看不出代表哪一个同音词,可是我单独读“树木”和“数目”这两个词,你也听不出它是哪一个同音词。再说我们说话不会只说shumu,在有上下文的句子里,它代表哪一个同音词我们分的清清楚楚。说汉语拼音无法区别同音词的人,会例举很多同音词让你用汉语拼音来区别,来证明他的理论正确。你可以让他把那些例子写在文章里,看他能不能写出概念混淆的同音词,我敢肯定他一个也写不出来。

同音词的本质是一词多义。英文里可能除了极少数科技专业术语,绝大多数的英文word都是多义。如果你查稍微大一点的dictionary,有的word的解释多达十几个甚至几十个。多义会不会造成混淆?肯定不会。原因是我们不论口语说话还是写文章,如果发现概念混淆会自动调整。例如,上个世纪六十年代,人们刚刚知道癌症。癌字原来读yan,这样癌症和炎症变成了同音词,很容易混淆。一段时间后,大家实在不能容忍这种情况,癌字就改读ai了。再举一个例子,期中考试,期终考试,很容易混淆,现在很多学校已经改说期末考试了。

中文里也有很多一词多义。例如“千金”有三个意义。1,指很多的钱。2,形容贵重。3,敬称别人的女儿。你单独看“千金”肯定看不出代表哪一个意义,但是你在文章里就能看出是哪一个意义。一词多义是效率高的表现。明明一个“千金”就解决问题,你非要整出三个同音词,那是自找麻烦。汉语拼音可以把多个同音词写成一个word也是高效率表现。退一步说,如果真的需要,字母文字也可以写同音word。例如,to too two,by bye buy,see sea,council counsel,cereal serial,gorilla guerrilla,weather whether。照理说我们说话听不出同音字,我们写文章就不需要同音字。英文中的同音word是历史原因还是习惯使然,我没有研究。但有一点可以肯定,那就是对阅读还是有一定帮助。

总之,字母文字根本不存在什么同音词问题。同音词问题是反对汉字改革的人想当然杜撰的。原来都使用汉字的朝鲜和韩国就是一个有说服力的例子。现在朝鲜文里没有一个汉字,韩文里仍然有少量汉字。这个例子说明这种现象和文字无关,当然也和同音词无关,而是和两国政府字母化的政策有关。朝鲜政府令行禁止,韩国政府执行力度不如朝鲜,对待人民群众由于习惯而继续使用汉字睁一个眼闭一个眼。道理就这么简单。既然中文没有字母化的原因肯定不是同音词,那么中文至今没有字母化的原因究竟是什么?我们先简单回顾中文和汉字的历史。


二,中文汉字的历史

最早的中文是甲骨文。甲骨文是考古的发现,历史上没有记载,应该说对现在的中国文字没有什么影响。汉字起源于秦始皇书同文。秦始皇统一中原后,他要原来的各国使用他的新文字。推行一种新文字不能一蹴而就,新旧两种文字需要并行一段时间过渡,等到大多数人习惯了新文字,使用新文字也就理所当然了。书同文应该名垂青史,但秦始皇急于求成遭到强烈抵抗,他焚书坑儒在历史上留下暴君骂名。无奈秦朝时间太短,文字从弯弯扭扭的篆字变到长方形的隶字,到汉朝才定形,因此秦始皇书同文的文字不叫秦字,叫汉字。

当时用汉字写的文章叫文言文。文言文是书写工具落后的产物。因为竹简笨重,在竹简上写字能少写一个好一个,少到不能再少就是文言文。文言文和口语说话脱节,像外文一样难以理解和学习,是中国落后重要的原因。秦朝的隶书是扁扁的长方形,也是为了在竹简上多写几个字。东汉蔡伦改进了造纸技术,东汉末年汉字就变成了正方形的楷书,也就是我们现在汉字的形状。改进的造纸术也促进了民间写白话文。例如南北朝的“木兰辞”还有很多朗朗上口的唐诗几乎就是白话文。到了唐朝为了传播佛教出现了变文,变文就是白话文。白话文不登大雅之堂主要原因是思想保守的文人反对。

从秦朝到唐朝,中原大地以西安为政治中心。唐朝末年五代十国群雄奋起,最后形成南北割据。北方以北京为政治中心,开始使用字母文字。辽朝使用的契丹小字是根据回鹘文创建。回鹘文追根溯源来自欧洲。金朝灭辽朝后使用根据契丹文创建的女真文。由于使用了字母文字,北方的口语开始统一。南方的北宋和南宋分别以河南开封和浙江杭州为国都,仍然使用汉字,因此南方方言众多。

元朝统一中国后至今中国政治的中心一直是北京。元朝除了使用也是根据回鹘文创建的老蒙古文,还创建了巴斯巴字母。明朝赶走元朝,迁都北京继续使用汉字。清朝灭了明朝,使用的是根据蒙古文创建的满文。辽朝的契丹文,金朝的女真文,元朝的蒙古文,清朝的满文,它们是有传承关系的字母文字。

我们再看汉字白话文在民间的发展。从唐朝出现变文,到元朝的话本,一直到明清的白话文小说。白话文是字母文字的前身,白话文里的形声字已经有提示读音的功能。日本就是先用汉字写白话文再简化汉字,汉字简化到不能再简化,创造了日文字母(假名)。文字是工具应该不断地改进,哪种先进就使用哪种,但有狭隘的民族主义思想的文人视汉字为图腾,不仅导致汉字没有变成字母,而且还放弃了中国已经使用的字母文字。


三,切音字运动

清朝末年国门打开后,很多知识分子发现中国落后开始寻找原因。当时中国的文盲很多,就认为汉字难辞其咎,汉字改革就成了有识之士的共识。民间开始了切音字运动。切音就是拼音,切音字就是拼音文字,也叫字母文字。古时候给汉字注音方法叫反切,就是用两个认识的汉字给汉字注音。具体的方法是用第一个汉字的声母和第二个汉字的韵母相拼。例如冬,都宗切。就是用“都”的声母d和“宗”的韵母ōng,相拼就是dōng冬的读音。

1908年流亡日本的章太炎搞了一个切音字方案。就是目前台湾还在使用的注音符号的前身。民国成立后,经过修改整理,1918年教育部公布时叫注音字母。1930年改名为注音符号,因为字母有文字之嫌。这不是杞人忧天,等到注音字母普及后,即使政府不承认是文字,一个运动,字母文字就瓜熟蒂落。就像白话文,经过从唐朝的变文到明清白话文的普及,文人再说不登大雅之堂也没用,一个白话文运动就水到渠成。

1920年全国开始推广注音字母。注音注的是白话文的音,因此小学语文课改为白话文,用注音字母给课本里的汉字生字注音。白话文加注音符号,从1920年到1958年近40年的时间对中国统一汉字的读音起了巨大的作用。


四,简体字的争议

谈到汉字改革不能不谈简体字。1935年民国教育部颁布了《第一批简体字表》,由于国民党大佬戴季陶坚决反对,蒋介石没有焚书坑儒只能收回成命,最后不了了之。民间使用了千年的简体字不被官方认可,即使蒋总统赞成也没用。新中国成立后继续文字改革。这一次是双管齐下,同时推行简体字和中文字母化。搞简体字方案比较容易,因为民间已经使用,不是重新创造,只要搜集整理即可。1956年公布《汉字简化方案》,1957年大鸣大放也遭到反对,随后的反右运动,这些人受到了批判,中国终于推行了简体字。

很多人认为简体字有助于扫除文盲,从现在仍然使用繁体字的台湾来看,这个观点并不成立。但我还是支持简体字,原因是汉字笔画多难写是事实,在手写汉字的年代简体字至少可以提高书写的效率。现在又有了一个新问题:使用字母文字就能扫除文盲吗?欧洲早已使用字母,可是到了中世纪绝大多数人仍然是文盲。再说中国的元朝和清朝都使用过字母文字,仍然是一大堆文盲。可见中文字母化并不能保证中国扫除文盲,那中文字母化的意义又何在?


五,为什么中文应该字母化

虽然我们的直觉汉字比字母文字落后,但直觉不能说服人,一定要说出让人信服的道理。比较文字,可以量化比较的方法只有一个,那就是比较组成文字的单位(也叫基本单位)。我们用单位来代表意义(概念)。单位越多,概念越多,文字越先进。下面我以中文和英文为例进行比较。

我们首先要找出中文和英文的单位。英文(的句子)里除了标点符号只有word,因此word就是英文的单位。中文(的句子)里除了标点符号只有汉字,因此汉字就是中文的单位。比较它们的数量很简单,找出新华字典和英文dictionary,上面早已统计好数量。中文的单位比英文的单位少得多,这就是中文比英文落后的根源。

新文化运动的先贤们没有发现这个根源可以理解,因为他们不是专业人士,但是为什么中国很多语言学教授也没有发现这个根源?一个重要的原因是中国语言学界有一个非常荒诞的理论:“词是语言的单位”,这个理论导致他们不知道中文的单位是什么。这个理论荒诞之处是世界上根本就不存在“语言的单位”这个东西。我们只能讨论文字的单位,具体地说就是只能讨论“中文的单位”或者“英文的单位”。如果你能举一个既不是“中文的单位”也不是“英文的单位”的例子,就能证明我错了。“语言的单位”这个概念就是忽悠人。

还有,一个“词”至少要有两个字,也就是说一个“词”至少是两个单位。切记,判断是不是一个单位,不是根据大脑理解的意义,而是根据书写的文字。例如英文turn on,turn off,give up,look after,代表的都是一个意义,但是没有人认为它们是一个word。

我们一定要知道中国语言学界这个理论是错误的,才能找到中文的落后的根源。中文单位少严重限制我们的思维,现在中文里大量概念尤其是科学概念都是从日本和西方传来的,这就是中文为什么一定要字母化的原因。下面继续谈为什么中文没有字母化。


六,为什么中文没有字母化

据说毛主席一开始主张中文字母是民族形式。可是所有的民族形式的方案大家都不满意,其实原因很简单,使用了四十年的注音字母已经是成熟的民族形式。文字改革委员会主任吴玉章向毛主席建议采用拉丁字母,毛主席同意了。

1955年国务院有关部门委托周有光主持制定《汉语拼音文字方案》,因为周有光写过一本关于字母的小册子,很有名。周有光不负众望,1957年底提请全国人民代表大会审议。照理说毛主席同意,通过应该没有问题,没想到在1958年全国人民代表大会上遭到强烈反对。周总理只能和稀泥,他想了个换汤不换药办法,方案内容一字未改,只把标题去掉文字二字改成《汉语拼音方案》,对反对派说,汉语拼音不是文字,而是为汉字注音的符号,方案终于通过。

这个结果应该算是双赢。对反对派来说,不仅仅是心理安慰,而是从法律上确保中国不拿汉语拼音当文字。对改革派来说,当务之急是在全国推广汉语拼音。不推广,承认是文字也没有用。方案通过确保了在中国推广汉语拼音合法。从1958年秋季开始,全国小学生开始学习《汉语拼音方案》,中国推广汉语拼音如火如荼,一直到1966年文革爆发学校停课。文革后中国急于搞经济建设,顾不上汉字改革,文字改革委员会也改名文字工作委员会。汉字改革偃旗息鼓。

中文落后对我们日常生活影响并不大,对科学技术影响较大,但现在高端科技人员大多数是海归,可以直接使用外文尤其是英文。加上现在英文已经大举入侵全世界,byebye已经快要取代再见,GDP已经进入《现代汉语词典》,因此汉字改革的迫切性大不如前。

从1958年算起中国推行汉语拼音已经超过一个甲子了,虽然断断续续,但是由于电脑的普及,尤其是智慧型手机人手一个,汉语拼音已经普及,中国使用字母文字的条件也基本成熟。将来中国不论是使用汉语拼音文字还是直接使用英文,我都支持,因为它们都是字母文字,都增加了文字的单位。不过我认为直接使用英文可能更省事,更有利于中国的发展,而且是一步到位。到那时中国人可以只学习一种文字,不一定非要学习第二种。


最后我重申,中文没有字母化的原因和同音词无关,而是和现在大多数人没有迫切需要,以及中国政府还没有承认汉语拼音是文字有关。


2025-11-27

参考:http://my.cnd.org/modules/newbb/viewtopic.php?topic_id=105663&forum=2&92


http://hx.cnd.org/?p=253055






Monday, March 31, 2025

语言习得是先天还是后天

 王玉江:语言习得是先天还是后天?

我们先定义一下语言,习得,先天和后天。

1,“语言”有两个意思。第一个是“语言和文字”的语言,也就是口语。第二个是语言学的语言,这个语言除了口语,还包括手语和书面语等。这篇文章标题里的“语言”指的是口语,不包括手语和书面语,因为书面语习得肯定是后天,至于手语习得是先天还是后天,没有人讨论。为了严谨,本文标题应该改为:口语习得是先天还是后天?

2,“习得”这个词来自英文 acquisition。习得的字面意思是学习得到,一般的学习是指有意识的学习,习得强调儿童学习口语是自然而然,无意识的学习。

3,“先天”这里是指先天的能力,也叫本能,就是不学就会的本领。例如直立行走是人的本能,健康的儿童到了一岁左右自然而然就会走路。

4,“后天”这里是指需要经过学习才能获得的能力,凡是不是先天的能力都是后天的能力。例如从一个地方到另外一个地方,除了步行我们还可以骑自行车,开汽车。由于这两种能力都使用了交通工具,工具是身体以外的东西,因此和先天无关。事实也是如此,骑自行车和开汽车都需要学习。

口语习得是先天还是后天?这个问题在语言学界众说纷纭,主要观点可以归纳为三种。

1,先天论(天赋说)以乔姆斯基 Chomsky 为代表,他认为人类大脑中存在普遍语法 Universal Grammar,和一种先天的口语习得机制 Language Acquisition Device,使儿童能够快速习得口语。先天论强调口语能力是与生俱来的。

2,后天论(经验说)。代表人物有斯金纳 Skinner,皮亚杰 Piaget 等。后天论认为口语是后天通过模仿学习获得的,婴儿出生时大脑是一张白纸,儿童通过与成人的互动学习口语。后天论强调口语能力是经验的产物和社会互动的结果。

3,相互作用论。这种观点认为口语习得即是先天也是后天,是两种因素相互作用的结果。实际上,先天和后天是矛盾关系 Contradictory Relation,一个人的口语习得不是先天就是后天,二者必居其一,不可能既是先天又是后天,因为这自相矛盾。相互作用论是和稀泥理论。

如同儿童到时候就会走路一样,听力正常的儿童,两岁左右一定会开口说话。根据这一点,口语习得好像应该是先天的。但是,生活在世界各地的儿童习得的并不是同一种口语,而是各地不同的口语,这说明口语习得和生活的地方(环境)有关。从这个角度看,口语习得又不应该是先天的。

还有聋哑儿童,他们不能习得口语。如果他们的父母不是聋哑人,他们也无法习得手语。这时候他们就会和他们的父母共同创造出一种只有他们一家人懂的家庭手语。英文叫 home sign,也叫 kitchen sign。家庭手语是一种全新的手语,因此不可能是先天的。从家庭手语我想到一个问题。手语是在交流中创造,手语的学习也是在交流中完成。口语的情况和手语相似,手语和口语都无法自学。那么口语习得就不可能是先天的,因此我同意后天论。

口语是用口腔发出的声音表达意思。人类口腔发出声音的能力是先天的,毋庸置疑。但是口腔发出的声音并不是口语,只有经过了约定俗成代表了意思的声音才是口语。我们只要把口腔发出声音和口语分开,先天还是后天这个问题就迎刃而解了。

最后总结一下,这个问题的答案是:人类口腔发出声音的能力是先天的,口语(能力的)习得是后天的。理由有两个:1,使用口语是一种能力,这种能力并不存在我们的DNA里。因为如果存在我们的DNA里,那么全世界应该说同一种口语,这显然与事实不符。2,儿童口语习得不仅不是不学就会,而且还无法自学。口语习得至少需要两个人才能完成,因此口语习得不可能先天。这个问题争论不休的原因也有两个:1,把口腔发出声音和口语混为一谈了。2,“习得”这个词把儿童口语学习神秘化了。


2025-03-23


参考:https://www.youtube.com/watch?v=kS2UUPgkd6w

Language Acquisition Through The Eyes of Skinner, Piaget, Chomsky, and Bruner

从斯金纳、皮亚杰、乔姆斯基和布鲁纳的视角看语言习得

先天和本能的区别。简单来说,先天是一个更广泛的概念。先天包括生理特征和行为特征。本能是先天的一部分,先天包括本能。例如,婴儿的吸吮反射是先天的,也是一种本能。眼睛的颜色是先天特征,但不是本能。



Tuesday, January 14, 2025

文字的发展

 王玉江:文字的发展


文字原来的意思是指汉字,本文里的意思是指书写系统。例如,中文,英文,日文,朝鲜文等。


一,文字的记录功能

文字是记录思维(思想)的工具。思维是大脑在想事情。人类思维的本质是通过眼睛耳朵等感官,认识世界上的事物。这些认识(知识)在大脑里,别人看不见摸不着,要想让别人知道,没有发明文字的时候人类只能通过口语表达,聋哑人通过手语表达。有人说语言是思维的工具。这种说法把表达思维和记录思维混为一谈。语言除了文字还有口语(和手语)。口语只能表达思维,不能记录思维。文字比口语多了记录功能,从这个角度看,文字比口语更有用。


文字的记录功能对于人类思维,乃至社会发展影响巨大。口语由于话说完就消失了,人类掌握的知识要受到记忆力的限制。口语必须面对面交流,在交通不便的古代,每种口语说的人很少,不能集思广益。因此没有文字的时候,人类掌握的知识极其有限,那时候人类是原始社会,和其他动物没有多大区别。


文字有记录功能,文字表达的知识不需要每时每刻记忆在大脑里。人们看到文字就能想起这些文字表达的知识,相当于提高了记忆力。人类知识的增加主要是靠文字的发展,和口语没有什么关系,就连口语的发展都依靠文字的发展。文字先进,口语就先进,思维也先进;文字落后;口语就落后,思维也落后。文字和口语的发展,文字起主导作用。

二,书写工具的发展

文字的发展可以从文字本身和书写工具两个方面来看。书写工具的发展影响文字的发展,书写工具越方便,文字效率越高。我们先谈书写工具的发展。书写工具有笔和纸。最早的楔形文字是用芦苇杆在泥板上压出痕迹,笔是芦苇杆,纸是湿润的泥土压平的泥板。中国的甲骨文是把坚硬的石块打磨锋利,在龟甲或者动物骨头上刻字。泥板笨重,甲骨不易雕刻。这些落后的书写工具不可能发展出先进的文字。古埃及人把芦苇杆削尖,蘸上墨水,在莎草纸上书写。这种书写工具稍好,但是芦苇杆容易损坏,后来欧洲人改用鹅毛管。莎草纸是莎草茎压平晒干制成,容易破碎,后来中国的造纸术传到欧洲解决了这个问题。


在中国,造纸术解决了竹简笨重的问题,没有解决笔的问题。中国的毛笔是软笔,不容易控制,书写效率低。用毛笔写字很不方便,能少一个字好一个字,于是产生了文言文。明清中国出现了白话文小说,白话文容易理解,读文章的人喜欢。但是白话文字数比文言文多,写文章的人不高兴。文言文难懂,白话文字多,两权相害取其轻,白话文仍然不登大雅之堂。清朝末年西方的钢笔进入中国,钢笔使用方便,思想再保守的人也不反对,中国的白话文运动水到渠成。


毛笔是中国古代使用文言文的重要原因。如果没有西方发明的钢笔,中国现在可能还在之乎者也。现在全世界普遍使用圆珠笔,圆珠笔更方便,不需要装墨水,而且还便宜。最近人类开始使用液晶显示屏,字都不用写了,用键盘输入,甚至还可以语音输入,写字变成说字。全球化让全世界都使用相同的,最先进的书写工具,将来也会使用相同的,最先进的文字。下面谈文字本身的发展。


三,意义单位

文字表达的意义可以分为四类。1,一篇文章表达的意义叫中心思想,或者主题思想。2,文章由段落组成,一个段落表达的意义叫段落大意。3,段落由句子组成,一个句子表达的意义叫句意。以上三类意义我们都没有办法数,因为数不胜数,我们只能数第四类意义。4,句子由意义单位组成,一个意义单位表达是句子里独立存在的,最小的意义。严格地说,我们并不能数意义,因为意义在我们的大脑里,我们只能数意义单位。其实我们也不用数,字典已经帮我们数好了。字典条目 entry 的数量就是意义单位的数量。意义单位也叫基本单位,最小单位,表意单位。


文字的意义单位越多,表达的意义越多,表达的意义越清楚。意义单位分两种。1,使用表意符号的意义单位,特点是一个意义单位就是一个符号。例如汉字。2,使用表音符号(也叫字母)的意义单位,特点是一个意义单位由多个符号组成。例如英文 word。


原始的文字,不论是五千多年前两河流域的楔形文字和古埃及的象形文字,还是三千多年前中国的甲骨文都使用表意符号。由于一个意义单位使用一个表意符号,要增加意义就要增加符号,符号多了就复杂难写,而且不易记忆,因此文字发展靠增加符号是不可持续的。只使用表意符号的文字迟早都会被淘汰。现代文字基本上都使用表音符号。


四,表音符号

现代文字都使用表音符号,也就是字母。只要几十个字母就可以组成数十万,甚至上百万的意义单位。字母的发明极大地增加了意义单位,也极大地促进了人类的思维。科学就是在人类发明字母以后出现的。发明字母是文字发展的一个里程碑。表音符号可以分两类:1,音素符号。2,音节符号。


日文假名是典型的音节符号。中文白话文里的汉字本质上也是音节符号。中文有大约四百个读音(音节),如果只使用四百个汉字,那就是音节符号。中文由于使用了大量的同音字来表意,汉字失去了提示读音的功能。


世界上大多数文字都使用音素符号。音素符号可以分为两种:1,元音字母。2,辅音字母。大多数文字两种都使用,少数只使用辅音字母,例如阿拉伯文。由于没有元音字母,提示读音的功能打折扣,因此阿拉伯语有不少方言不能互相交流,有点类似中国南方使用汉字的方言。值得一提的是朝鲜文,既是音节符号,又可以算是音素符号,是用几个音素符号组成一个音节符号。


表音符号有提示读音的功能。这一功能使字母文字和口语紧密联系,紧密到人们把它们当成一种 language。例如 English 既是英语又是英文。English 翻译为英语或者英文都不准确,应该翻译为英国语文,可以简称为英语文。同样的道理,一个国家的 official language 应该翻译为法定语文。


表音符号(字母文字)让口语说话有了标准,使用字母文字的地区会形成通用语。例如原来使用汉字的日本和朝鲜,使用字母文字以后很快就形成日本语和朝鲜语。汉字提示读音的功能很差,秦始皇书同文以后,中原地区没有形成通用语。中国现在的通用语(普通话)起源于以北京为中心辽金元的字母文字。字母文字都有对应的口语。例如,英文对应英语,日文对应日语,朝鲜文对应朝鲜语,但是中文没有对应的中语。原因后面再谈。


五,中文的历史

我们现在使用的中文是汉字白话文。汉字白话文的历史可以追溯到明清白话文,中国正式使用白话文才一百多年,民国初期白话文运动时才登上大雅之堂。古代中国人写的文章是汉字文言文,汉字文言文的历史可以追溯到秦始皇书同文,因为秦朝之前没有汉字。文言文是书写工具落后的产物,已经被淘汰。古人用毛笔写字很不方便,字能少一个好一个,创造了文言文。就像以前我们发电报,为了省钱也是少一字好一字,还好后来电话普及了,否则我们现在可能还不会放弃文言文。


很多人喜欢说汉字历史悠久,汉字是一种书写符号,起源于秦始皇书同文,汉朝定型所以叫汉字。汉字和甲骨文可能没有关系。甲骨文在河南安阳发现,战国时期属于魏国,秦始皇的秦国在陕西咸阳,两地距离超过千里,因此甲骨文很可能不是秦国文字的源头,要是也应该是魏国文字的源头,而魏国文字被秦始皇书同文灭了。甲骨文是被古人抛弃的文字,历史上没有记载,要不是清朝末年一次偶然发现,没有人知道。


一种文字是否先进,不是看这种文字的历史多么悠久,而是看这种文字能否高效率地准确表达我们的思维。就像我们使用的斧头是哪一年制造,无所谓,即使能追溯到原始人用的石斧也没有意义。欧洲文字都起源于菲尼基字母,腓尼基字母起源于五千多年前的古埃及象形文字,欧洲好像没有人为此自豪。一般来说,工具历史悠久不是什么好事,很可能是落后的标志。


六,普通话的历史

秦始皇统一中原只书同文没有语同音,中国古代没有统一的口语(通用语),一个重要原因是中国没有使用表音符号(字母文字)。只有使用字母文字才能有通用语,因为字母有提示读音的功能。中国现在的通用语(普通话)当时叫官话,一般认为起源于元朝,因为元朝使用巴斯巴字母文字。实际上唐朝灭亡后,中国进入五代十国。中国北方以北京为中心的辽国创造的契丹文小字就是字母文字。金国灭了辽国,参考契丹文创造了女真文。定都北京的元朝统一中国时,中国北方使用字母文字已有三百多年,应该已经初步形成通用语。


明朝赶走了元朝,恢复使用汉字。由于官话在中国北方已经流行,民间就用汉字写官话,创造出汉字白话文。汉字指示读音的功能低下,很难统一口语,所以中国南方仍然说方言。清朝灭了明朝,中国使用满文。满文是根据蒙古文创造的字母文字。官话在中国进一步扩大。满文和汉字白话文是两种文字对应同一种口语(官话)。中国国门打开时是清朝,所以西方叫中国 China 清国,中文叫 Chinese 清文,中国人说的官话叫 Mandarin 满语。那时候,白话文还不登大雅之堂,汉语根本就不是一种口语,而是很多种方言。官话后来改叫国语,现在叫普通话,官话从来不叫汉语。


中国的中是中华的简称,没有中央之国的意思。中华作为国名最早的是中华大清国。之前中华作为地名是指以北京为中心的燕云十六州。明朝太祖朱元璋北伐口号就是驱除胡虏恢复中华。唐朝以后的五代十国,中国处于分裂状态,燕云十六州先是契丹人建立的辽国,后是女真人建立的金国,再后来的元明清,民国,共和国,都是以北京为首都。可以说辽金是中华的起源。


中国文字和口语的发展以及政治上可以分为三个阶段。1,秦朝之前,中国不是统一的国家,没有统一的文字,也没有通用语。2,秦朝到唐朝,中国政治上以西安洛阳为中心,有统一的文字(汉字文言文),没有通用语。3,从辽金元明清到现在,中国政治上以北京为中心,使用字母文字和白话文,有通用语(普通话)。文言文起源于秦始皇书同文的汉字;白话文的源头是官话的辽金元的字母文字;它们不是一脉相承。这就是白话文使用汉字却不叫汉文,和白话文对应的普通话不叫汉语的原因。这也是中文没有对应的中语的原因。


七,中文的词不是单位

意义单位是组成句子的单位。英文句子由 word 组成,word 就是英文的意义单位。中文句子由汉字组成,汉字就是中文的意义单位。有人说,词是中文的基本单位(意义单位),这种说法是错误的。中文句子是汉字组成,不是词。例如“我爱你”这个句子里只有三个字,没有词。我们不能因为英文 word 是意义单位,word 翻译为单词,再简称为词,就说中文的词是单位。单位是有形式(标志)的,英文的单词前后有空格,中文的词前后没有任何标志。计算机不会骗人,它只能告诉你一篇文章有多少个汉字,不会告诉你有多少个词。


意义单位的数量非常重要。一种文字的意义单位越多表达意义越清楚,这种文字也越先进。意义单位的多少是判断文字先进与落后的一个重要标准。由于符号不能大量增加,只使用表意符号的文字不能大量增加意义单位,迟早会被淘汰。东亚地区原来使用汉字的国家都完成了向字母文字的过渡。中文现在已经出现字母词,开始向字母文字过渡。下面继续谈文字本身的发展。


八,标点符号

使用标点符号 punctuation 是文字的重大发展。早期的字母文字没有标点符号,例如古希腊文和古拉丁文都是字符连续体 scriptio continua,也就是字母紧密排列不用空格划分 word。看文章的人要辨别哪几个字母是一个 word,有点像看文言文要句读一样,很麻烦。为了提高阅读理解的效率,各种标点符号陆续发明。有两个标点符号值得一提。第一个是空格 space。有些人不知道空格是标点符号,实际上空格是使用最多也是效率最高的标点符号,因为不需要写。前面说的把字母组成意义单位 word 就是使用了空格这个标点符号。


第二个是句号,句号表示哪几个意义单位是一个句子,句子表达 a complete thought 一个完整的意思。划分句子的重要性,读过文言文的人都知道。读不分句子的文言文,先要句读,才容易理解。句读很麻烦,而且不同的句读还能读出不同的意思,这时候作者究竟是什么意思要靠猜。顺便说一下,句号和句读的区别是,句读是读者画的,句号是作者写的。没有句号的文言文,按现在的标准只能算是半成品。西方使用标点符号的历史很短,只有几百年;中国更短,只有一百多年。虽然中文现在也使用标点符号,但是由于没有使用字母,中文无法利用空格让中文的词变成意义单位。


九,字典和文法

编写字典 dictionary 和文法 grammar 也是文字的重大发展。不论中文还是英文,文章都是一个个句子组成,句子由一个个意义单位组成。字典的作用就是解释每个意义单位的意思。文法的作用是告诉你句子里各个意义单位之间的关系,谁修饰谁。读文章只要知道每一个意义单位的意思,清楚它们在句子中的关系,很容易理解句子的意思。按照字典和文法的规定写出来的文章,别人也容易看懂。编写字典把意义单位的意义从约定俗成变成了明文规定;编写文法把写句子的规则从凭感觉变成了有据可查。字典和文法提高了文字表达意思的效率。


文法这个概念来自英文 grammar,有人翻译为语法。不过这个翻译有点误导人,因为文法是写文章的规定,和口语无关。例如文法里关于大写字母和标点符号的规定,和口语一点关系也扯不上。文法是人为的规定,不是天生的。英文文法规定句子开头字母要大写,结尾有句号。句子一定有主语和谓语,主语一定有一个名词,谓语一定有一个动词。形容词修饰名词,副词修饰动词。还规定了各种从句的标志,以及标点符号的用法。中文目前还不具备编写这种文法的条件,主要原因是中文的词不是意义单位,无法像英文那样划分名词,动词,形容词,副词等性质。2005年《现代汉语词典》第五版开始给中文的词分类,由于词不是一个意义单位,我们不知道红旗到底是名词,还是形容词加名词。文字自从发明以来经历了三次重大发展。1,发明字母。2,使用标点符号。3,编写字典和文法。这才有我们今天使用的文字。


十,两条路

文字落后导致思维落后,思维落后导致社会发展落后。中文落后是中国科技落后的一个重要原因。现在中国科技上取得一些进步主要是靠海归科学家。使用中文培养不出杰出的科技人才。中国要想现代化,一定要使用字母文字。现在有两条路。1,使用汉语拼音文字。2,使用英文。英文是成熟的文字,汉语拼音文字还不成熟。使用还不成熟的文字要经过长时间不断地改进,英文拿来就可以使用,使用英文更容易见成效。还有英文现在是国际上通用的文字,每个国家的人都要学习英文,即使我们使用汉语拼音文字,仍然需要学习英文,使用英文可以一举两得。


文字没有专利。英文不属于英国,更不属于美国。先进的工具,谁使用谁得利。现在中国有不少人反对使用英文。我们能放弃毛笔使用钢笔,为什么不能放弃中文使用英文?一个原因是从使用毛笔到使用钢笔,一看就会,而从使用汉字到使用英文需要学习,尤其是老年人早已过了学习的最佳年龄。中国使用英文不是立即放弃中文,文字改革要有一个过渡期。学习和使用英文要从小孩和年轻人开始,等老一代一死文字改革就自然而然完成。互联网时代,使用英文是获取最新信息最快的方法。反对学习使用英文实际上是反对中国现代化,反对中国融入世界。


十一,双语文教育

新加坡是华人为主的国家,1965年建国,李光耀坚持 English 是主要的法定语文,短短几十年新加坡进入发达国家行列。学习和使用 English,台湾走在大陆前面。台湾领导人赖清德2014年在台南市推出 English 为第二法定语文的十年规划,蔡英文2020年在就职演说中提出2030年实现双语文国家的目标。台湾是华人社会,把 English 作为法定语文,领导人需要远见和勇气,这可能和台湾领导人从李登辉起,除了陈水扁,都有留学经历有关。台湾人民大多数都支持把 English 作为第二法定语文。


大陆由于前三十年闭关锁国,现在的老年人大多数不懂 English。改革开放后出现留学潮,现在科技界有很多海归留学生。虽然不少人反对使用 English,但是群众的眼睛是雪亮的,中国有条件的家长会悄悄地送孩子出国留学,去不了欧美就去东南亚。没有条件的也会送孩子上 English 学校,或者课外补习 English。现在中国的年轻人懂 English 的越来越多,这是中国的希望。


十二,结束语

由于文字有记录功能可以增加人的记忆能力,因而可以提高人类认识世界的能力,促进人类社会的发展。在人类历史长河中,文字的历史很短,只有五千多年,但是文字的发展给人类社会带来了翻天覆地的变化,文字是人类最伟大的发明。


2024-10-20 初稿

2025-01-04 定稿