Saturday, January 6, 2018

谈谈汉语的单位

谈谈汉语的单位

不仅仅是在华夏文摘评论区,不少人会使用汉语的单位这种说法。单位在语言学里通常是指文字里,例如中文英文里最小的单位the smallest unit,中国语言学界叫基本单位,简称单位。
我从来不使用汉语的单位这种说法,因为汉语是指中国人说的口语,例如普通话,广东话,上海话等。人类说话发出的是一串串语音流,口语的单位就是语音流里的一个个语音段,搞计算机语音识别就要研究口语的单位。不使用音频文件audio file和多媒体工具multimedia device无法讨论口语的单位。
我不搞语音识别,所以我从不使用汉语的单位这种说法。普通语言学研究的是文字的单位,所以我说中文的单位,英文的单位。中国的语言学教科书和语言学教授喜欢说语言的单位,他们认为语言的单位是词。如果你问他们:语言分口头语言和书面语言,你说的语言究竟是哪一种语言?他们肯定不会回答你提的问题,而是顾左右而言他,因为哪一个的单位都不是词。这是我个人的经验,屡试不爽。

下面我以华夏论坛区C先生评论里的一段话为例,谈谈语言的单位。C先生说:
字能表意不等于字就是汉语的基本单位。拼音文字里也有比词小的单位,也能表意。为甚词根、前后缀(以及词中缀)不叫做基本单位?你能因为词根和___缀这些比词小的单位能表意就说使用拼音文字的语言的基本单位不是词吗?
C先生这段话里有4个问题:
1,字不是汉语的单位,而是中文的单位。理由前面已经说过。
2,英文(拼音文字)里最小的单位是单词word,英文里没有比word更小的单位。除了极端的情况,字母letter一定是以word的形式出现在英文里。
3,词根词缀morpheme这些东西是分析word时候使用的概念。除了极端的情况,这些东西不能在英文文章里独立存在,如果独立存在,就不叫词根词缀,而是叫word,所以词根词缀不是英文的单位。
4,是不是文字的单位,不是以能不能表意为标准,也可以说单位和意义无关。意义大脑里的思维,是抽象的东西,没有具体的单位。
文字writing system是各种符号的顺序排列。文字的单位以符号在句子里的形状为标准。中文单位的标志是一个个方块形的符号,英文单位的标志是空格space。文字的单位是客观存在,即使一个文盲也能数清楚一篇文章里有多少个单位。用意义来分析文字的单位是画蛇添足。
语言学是科学,如果中文以偏旁部首为单位,或者以词为单位,英文以morpheme为单位,那么一篇文章里有多少个单位,肯定是公说公有理,婆说婆有理。

为什么语言学教授会使用“语言的单位”这种经不起推敲的概念?问题出在语言学中文术语的定义上。例如:
1,语言,有两个不同的定义。第一个定义是口语,不包括文字。第二个定义是language。这时候语言的意思除了口语,还包括文字和手语。
2,文字,也有两个不同的定义。第一个定义是汉字。第二个定义是书写系统writing system,例如中文和英文。
3,词,原来只有一个定义,就是中文的词。由于有人把英文word翻译为单词,这时候问题还不大。糟糕的是很多人把“单词”简化为“词”,这时候中文的词和英文的word,两个不同的概念就混为一谈了,他们忘记了单词不是词。

一个字(词)有不同的定义叫一字多义,是高效率的表现,前提是不能引起概念混乱。除了一语双关pun,一字多义不是一个字可以同时代表两个意义。在一个句子里,一个字只能代表一个意思。为了严谨,科学术语会尽量避免一字多义。会引起概念混乱的一字多义,违反同一律The Law of Identity。
中国语言学里这几个最基本的术语都是一字多义,因此中文的语言学论文常常是以其昏昏使人昭昭。所以中国语言学界至今还在纠结,语言的基本单位究竟是字还是词(简称字本位词本位之争)。如果他们先定义一下语言,单位,词,这些术语,或许根本就不需要争论,因为什么是中文的单位,是一个fact。学术讨论,概念一定要明确,绝对不能违反同一律,否则一定是错误的观点。

总之,我们讨论的不是汉语的单位,而是中文的单位。单位是指文章里最小的单位。中文最小的单位是字,英文最小的单位是word。只有明白了什么是中英文的单位,才能比较中英文,才能知道为什么中文落后。拿汉字和英文字母相比,拿英文word和中文的词相比,那是关公战秦琼。


参考:
华夏文摘论坛区链接  http://my.cnd.org/modules/newbb/viewtopic.php?viewmode=flat&order=1&topic_id=95704&forum=2

回到新概念语言学

No comments: