王玉江:同音词和中文字母化
最近《华夏文摘》有一条线讨论同音词和中文字母化。起因是有人认为,由于所有的拼音方案都没有解决同音词问题,因此中文无法字母化。这种论调不是现在才有,可能从一百多年前有人反对中文字母化就存在了。本文就谈谈同音词和中文字母化。
一,同音词
中文里有同音词是因为中文里有大量的同音字。新华字典收录约一万个汉字。汉字的读音如果不算四声只有四百来个,平均一个读音对应25个字。不过它们不是平均分配的,有的读音只对应一个字,最多的yi对应134个字。如果我们说话时用一个声音代表一个意义,写下来就是一个字。但我们说话不全是用一个声音代表一个意义,有时候是用两(多)个声音代表一个意义,写下来是两个字,这就是一个词。
同音词就是读音相同字不同的词。例如“树木”和“数目”,它们写成汉语拼音都是shumu。单独看拼音确实看不出代表哪一个同音词,可是我单独读“树木”和“数目”这两个词,你也听不出它是哪一个同音词。再说我们说话不会只说shumu,在有上下文的句子里,它代表哪一个同音词我们分的清清楚楚。说汉语拼音无法区别同音词的人,会例举很多同音词让你用汉语拼音来区别,来证明他的理论正确。你可以让他把那些例子写在文章里,看他能不能写出概念混淆的同音词,我敢肯定他一个也写不出来。
同音词的本质是一词多义。英文里可能除了极少数科技专业术语,绝大多数的英文word都是多义。如果你查稍微大一点的dictionary,有的word的解释多达十几个甚至几十个。多义会不会造成混淆?肯定不会。原因是我们不论口语说话还是写文章,如果发现概念混淆会自动调整。例如,上个世纪六十年代,人们刚刚知道癌症。癌字原来读yan,这样癌症和炎症变成了同音词,很容易混淆。一段时间后,大家实在不能容忍这种情况,癌字就改读ai了。再举一个例子,期中考试,期终考试,很容易混淆,现在很多学校已经改说期末考试了。
中文里也有很多一词多义。例如“千金”有三个意义。1,指很多的钱。2,形容贵重。3,敬称别人的女儿。你单独看“千金”肯定看不出代表哪一个意义,但是你在文章里就能看出是哪一个意义。一词多义是效率高的表现。明明一个“千金”就解决问题,你非要整出三个同音词,那是自找麻烦。汉语拼音可以把多个同音词写成一个word也是高效率表现。退一步说,如果真的需要,字母文字也可以写同音word。例如,to too two,by bye buy,see sea,council counsel,cereal serial,gorilla guerrilla,weather whether。照理说我们说话听不出同音字,我们写文章就不需要同音字。英文中的同音word是历史原因还是习惯使然,我没有研究。但有一点可以肯定,那就是对阅读还是有一定帮助。
总之,字母文字根本不存在什么同音词问题。同音词问题是反对汉字改革的人想当然杜撰的。原来都使用汉字的朝鲜和韩国就是一个有说服力的例子。现在朝鲜文里没有一个汉字,韩文里仍然有少量汉字。这个例子说明这种现象和文字无关,当然也和同音词无关,而是和两国政府字母化的政策有关。朝鲜政府令行禁止,韩国政府执行力度不如朝鲜,对待人民群众由于习惯而继续使用汉字睁一个眼闭一个眼。道理就这么简单。既然中文没有字母化的原因肯定不是同音词,那么中文至今没有字母化的原因究竟是什么?我们先简单回顾中文和汉字的历史。
二,中文汉字的历史
最早的中文是甲骨文。甲骨文是考古的发现,历史上没有记载,应该说对现在的中国文字没有什么影响。汉字起源于秦始皇书同文。秦始皇统一中原后,他要原来的各国使用他的新文字。推行一种新文字不能一蹴而就,新旧两种文字需要并行一段时间过渡,等到大多数人习惯了新文字,使用新文字也就理所当然了。书同文应该名垂青史,但秦始皇急于求成遭到强烈抵抗,他焚书坑儒在历史上留下暴君骂名。无奈秦朝时间太短,文字从弯弯扭扭的篆字变到长方形的隶字,到汉朝才定形,因此秦始皇书同文的文字不叫秦字,叫汉字。
当时用汉字写的文章叫文言文。文言文是书写工具落后的产物。因为竹简笨重,在竹简上写字能少写一个好一个,少到不能再少就是文言文。文言文和口语说话脱节,像外文一样难以理解和学习,是中国落后重要的原因。秦朝的隶书是扁扁的长方形,也是为了在竹简上多写几个字。东汉蔡伦改进了造纸技术,东汉末年汉字就变成了正方形的楷书,也就是我们现在汉字的形状。改进的造纸术也促进了民间写白话文。例如南北朝的“木兰辞”还有很多朗朗上口的唐诗几乎就是白话文。到了唐朝为了传播佛教出现了变文,变文就是白话文。白话文不登大雅之堂主要原因是思想保守的文人反对。
从秦朝到唐朝,中原大地以西安为政治中心。唐朝末年五代十国群雄奋起,最后形成南北割据。北方以北京为政治中心,开始使用字母文字。辽朝使用的契丹小字是根据回鹘文创建。回鹘文追根溯源来自欧洲。金朝灭辽朝后使用根据契丹文创建的女真文。由于使用了字母文字,北方的口语开始统一。南方的北宋和南宋分别以河南开封和浙江杭州为国都,仍然使用汉字,因此南方方言众多。
元朝统一中国后至今中国政治的中心一直是北京。元朝除了使用也是根据回鹘文创建的老蒙古文,还创建了巴斯巴字母。明朝赶走元朝,迁都北京继续使用汉字。清朝灭了明朝,使用的是根据蒙古文创建的满文。辽朝的契丹文,金朝的女真文,元朝的蒙古文,清朝的满文,它们是有传承关系的字母文字。
我们再看汉字白话文在民间的发展。从唐朝出现变文,到元朝的话本,一直到明清的白话文小说。白话文是字母文字的前身,白话文里的形声字已经有提示读音的功能。日本就是先用汉字写白话文再简化汉字,汉字简化到不能再简化,创造了日文字母(假名)。文字是工具应该不断地改进,哪种先进就使用哪种,但有狭隘的民族主义思想的文人视汉字为图腾,不仅导致汉字没有变成字母,而且还放弃了中国已经使用的字母文字。
三,切音字运动
清朝末年国门打开后,很多知识分子发现中国落后开始寻找原因。当时中国的文盲很多,就认为汉字难辞其咎,汉字改革就成了有识之士的共识。民间开始了切音字运动。切音就是拼音,切音字就是拼音文字,也叫字母文字。古时候给汉字注音方法叫反切,就是用两个认识的汉字给汉字注音。具体的方法是用第一个汉字的声母和第二个汉字的韵母相拼。例如冬,都宗切。就是用“都”的声母d和“宗”的韵母ōng,相拼就是dōng冬的读音。
1908年流亡日本的章太炎搞了一个切音字方案。就是目前台湾还在使用的注音符号的前身。民国成立后,经过修改整理,1918年教育部公布时叫注音字母。1930年改名为注音符号,因为字母有文字之嫌。这不是杞人忧天,等到注音字母普及后,即使政府不承认是文字,一个运动,字母文字就瓜熟蒂落。就像白话文,经过从唐朝的变文到明清白话文的普及,文人再说不登大雅之堂也没用,一个白话文运动就水到渠成。
1920年全国开始推广注音字母。注音注的是白话文的音,因此小学语文课改为白话文,用注音字母给课本里的汉字生字注音。白话文加注音符号,从1920年到1958年近40年的时间对中国统一汉字的读音起了巨大的作用。
四,简体字的争议
谈到汉字改革不能不谈简体字。1935年民国教育部颁布了《第一批简体字表》,由于国民党大佬戴季陶坚决反对,蒋介石没有焚书坑儒只能收回成命,最后不了了之。民间使用了千年的简体字不被官方认可,即使蒋总统赞成也没用。新中国成立后继续文字改革。这一次是双管齐下,同时推行简体字和中文字母化。搞简体字方案比较容易,因为民间已经使用,不是重新创造,只要搜集整理即可。1956年公布《汉字简化方案》,1957年大鸣大放也遭到反对,随后的反右运动,这些人受到了批判,中国终于推行了简体字。
很多人认为简体字有助于扫除文盲,从现在仍然使用繁体字的台湾来看,这个观点并不成立。但我还是支持简体字,原因是汉字笔画多难写是事实,在手写汉字的年代简体字至少可以提高书写的效率。现在又有了一个新问题:使用字母文字就能扫除文盲吗?欧洲早已使用字母,可是到了中世纪绝大多数人仍然是文盲。再说中国的元朝和清朝都使用过字母文字,仍然是一大堆文盲。可见中文字母化并不能保证中国扫除文盲,那中文字母化的意义又何在?
五,为什么中文应该字母化
虽然我们的直觉汉字比字母文字落后,但直觉不能说服人,一定要说出让人信服的道理。比较文字,可以量化比较的方法只有一个,那就是比较组成文字的单位(也叫基本单位)。我们用单位来代表意义(概念)。单位越多,概念越多,文字越先进。下面我以中文和英文为例进行比较。
我们首先要找出中文和英文的单位。英文(的句子)里除了标点符号只有word,因此word就是英文的单位。中文(的句子)里除了标点符号只有汉字,因此汉字就是中文的单位。比较它们的数量很简单,找出新华字典和英文dictionary,上面早已统计好数量。中文的单位比英文的单位少得多,这就是中文比英文落后的根源。
新文化运动的先贤们没有发现这个根源可以理解,因为他们不是专业人士,但是为什么中国很多语言学教授也没有发现这个根源?一个重要的原因是中国语言学界有一个非常荒诞的理论:“词是语言的单位”,这个理论导致他们不知道中文的单位是什么。这个理论荒诞之处是世界上根本就不存在“语言的单位”这个东西。我们只能讨论文字的单位,具体地说就是只能讨论“中文的单位”或者“英文的单位”。如果你能举一个既不是“中文的单位”也不是“英文的单位”的例子,就能证明我错了。“语言的单位”这个概念就是忽悠人。
还有,一个“词”至少要有两个字,也就是说一个“词”至少是两个单位。切记,判断是不是一个单位,不是根据大脑理解的意义,而是根据书写的文字。例如英文turn on,turn off,give up,look after,代表的都是一个意义,但是没有人认为它们是一个word。
我们一定要知道中国语言学界这个理论是错误的,才能找到中文的落后的根源。中文单位少严重限制我们的思维,现在中文里大量概念尤其是科学概念都是从日本和西方传来的,这就是中文为什么一定要字母化的原因。下面继续谈为什么中文没有字母化。
六,为什么中文没有字母化
据说毛主席一开始主张中文字母是民族形式。可是所有的民族形式的方案大家都不满意,其实原因很简单,使用了四十年的注音字母已经是成熟的民族形式。文字改革委员会主任吴玉章向毛主席建议采用拉丁字母,毛主席同意了。
1955年国务院有关部门委托周有光主持制定《汉语拼音文字方案》,因为周有光写过一本关于字母的小册子,很有名。周有光不负众望,1957年底提请全国人民代表大会审议。照理说毛主席同意,通过应该没有问题,没想到在1958年全国人民代表大会上遭到强烈反对。周总理只能和稀泥,他想了个换汤不换药办法,方案内容一字未改,只把标题去掉文字二字改成《汉语拼音方案》,对反对派说,汉语拼音不是文字,而是为汉字注音的符号,方案终于通过。
这个结果应该算是双赢。对反对派来说,不仅仅是心理安慰,而是从法律上确保中国不拿汉语拼音当文字。对改革派来说,当务之急是在全国推广汉语拼音。不推广,承认是文字也没有用。方案通过确保了在中国推广汉语拼音合法。从1958年秋季开始,全国小学生开始学习《汉语拼音方案》,中国推广汉语拼音如火如荼,一直到1966年文革爆发学校停课。文革后中国急于搞经济建设,顾不上汉字改革,文字改革委员会也改名文字工作委员会。汉字改革偃旗息鼓。
中文落后对我们日常生活影响并不大,对科学技术影响较大,但现在高端科技人员大多数是海归,可以直接使用外文尤其是英文。加上现在英文已经大举入侵全世界,byebye已经快要取代再见,GDP已经进入《现代汉语词典》,因此汉字改革的迫切性大不如前。
从1958年算起中国推行汉语拼音已经超过一个甲子了,虽然断断续续,但是由于电脑的普及,尤其是智慧型手机人手一个,汉语拼音已经普及,中国使用字母文字的条件也基本成熟。将来中国不论是使用汉语拼音文字还是直接使用英文,我都支持,因为它们都是字母文字,都增加了文字的单位。不过我认为直接使用英文可能更省事,更有利于中国的发展,而且是一步到位。到那时中国人可以只学习一种文字,不一定非要学习第二种。
最后我重申,中文没有字母化的原因和同音词无关,而是和现在大多数人没有迫切需要,以及中国政府还没有承认汉语拼音是文字有关。
2025-11-27
参考:http://my.cnd.org/modules/newbb/viewtopic.php?topic_id=105663&forum=2&92
http://hx.cnd.org/?p=253055