Thursday, September 28, 2017

一个字是一个词吗?

一个字是一个词吗?

要回答这个问题,首先要定义什么是一个字,什么是一个词。字也叫汉字,方块字。汉字就是你现在看的这篇文章里的一个个正方形的符号。知道什么是一个字,什么是一个词就简单了。一个词就是句子里,连起来代表意义的几个字。最常见的词是两个字,其次是三个字。四个字也是一个词,不过很多四个字的词,我们习惯上叫成语。五个字以上的词很少了。大家一定要牢记,字和词的关系是单数和复数,这是关键的关键。

俗话说,一是一,二是二。一不可能是二。所以,一个字不可能是一个词。可是,中国很多语言学教授却说,一个字是一个词。他们这样说,违反了思维三定律 Three Laws of Thought 的第一条,同一律 Law of Identity。同一律要求人们在同一个思维过程中,使用的概念必须保持一致,不能任意变换。凡是说一个字也是一个词的人,都违反了同一律,他们逻辑思维出了问题。
这些语言学教授犯这个错误的原因是概念不清。或者说,他们字和词的定义有问题。中国语言学教授一般不给“字”下定义,有的干脆不承认有汉字。他们认为汉字就是词,单字词。他们给“词”下的定义是:语言里最小的、可以自由运用的单位。如果你问他们,你说的语言是什么语言?是口语,手语,还是书面语?他们通常是顾左右而言他,或者干脆不回答。因为他们没有办法回答,一回答就自相矛盾。因为在书面语里,也就是中文里,词根本就不是一个单位。中文的单位是汉字,中文是汉字组成的。

据说把词当作中文的单位,把字当作语素(词素)的始作俑者是赵元任。由于赵元任是语言学大师级人物,再加上吕叔湘等大师也同意赵元任的语素理论,三人成虎。现在大多数的语言学教授只能人云亦云。这些人看到我的文章,基本上是假装没看见,就像古代那个卖矛又卖盾的人,弗能应也。
把一个汉字叫做一个词,是张冠李戴,混淆概念。一个汉字是字,两个以上的汉字才能叫一个词。匪夷所思的是,小学生都能听懂的事情,中国很多语言学教授竟然想不明白。


回到新概念语言学

参考:
1,【词】语言里最小的、可以自由运用的单位。
《现代汉语词典》第六版211页
2,词cí在句子里能自由运用的最小语言单位,如“人”、“马”、“水”、“商品”、“竞争”等。
《新华字典》第十版71页
3,字,1、文字,用来记录语言的符号:汉字,字眼儿,字体,常用字。
《新华字典》第十版647页


Sunday, September 17, 2017

什么是语素?

什么是语素?

语素是一个语言学术语。《现代汉语词典》的解释是:语素是语言中最小的有意义的单位。词典给你举的例子是:人、手、究、吗、疙瘩、逍遥、巧克力、奥林匹克(注1)。所谓的语素就是汉字,或者汉字组成的词,换了个名字而已。
语素这个概念来自英文 morpheme。英文语素是某些单词 word 的组成部分。虽然这些单词是不代表意义的字母组成的,但是这些单词可以分成两个,或者多个有意义的部分。这些部分就叫语素。例如,unbreakable。这个单词可以分成三个部分,un 有不的意思,break 有分开的意思,able 有能够的意思。因此这三个部分就叫语素。
英文语素在句子里不能独立存在。也就是说,英文句子里找不到语素,语素只能在单词里找。可是,汉字在句子里是独立存在的,中文的句子就是汉字组成的。所以,所谓的中文语素和英文语素风马牛不相及,根本就不是一回事。

为什么会出现这种荒唐的事情?原因是语言学界把英文的单词和中文的词混为一谈(注2)。英文句子是单词组成的,中文句子是汉字组成的,语言学里,中文和英文单词对等的是汉字。英文 word 的正确翻译是字。
由于很多英文单词翻译成中文是一个词,例如 apple 翻译为苹果,是一个词。某些语言学家就以为英文 word 相当于中文的词。于是他们就把英文 word 翻译从字改为单词,再简化为词。这样英文的 word 就变成中文的词了。
这是一个以偏概全的错误,因为还有一些英文词组 phrase 的中文翻译是一个字。例如 last name,姓。我们不能因此把英文词组 phrase 翻译为字。文字代表的意义和句子的结构不是一码事。

把英文单词和中文词混为一谈导致 morpheme 翻译为词素(注3),中文的汉字也就变成词素了。可是,中文句子是汉字组成的,也就是说,中文句子里到处是词素,英文句子里却找不到一个词素。这个翻译显然逻辑不通。没有办法,他们就把词素改为语素,绕一个圈,这样你就不容易发现问题,发现问题也不容易说清楚了。
为了自圆其说,中国语言学界现在不承认中文的词是汉字组成的,这个小学生都知道的常识。《新华字典》词的解释是:在句子里能自由运用的最小语言单位,如人、马、水、商品、竞争等。这里汉字已经改名叫词了。
汉字不是词,英文单词也不是词。可是《现代汉语词典》单词的解释却是词(注4)。乡下的农民都知道,地瓜不是瓜,土豆不是豆,有的语言学家竟然不知道,单词不是词。

那么,到哪里去找中文的语素?英文语素只存在英文单词里。中文的语素只能到汉字里找,因为单词是英文的单位,汉字是中文的单位。
英文单词是字母组成的。组成一个单词的字母,如果分成几个部分,每个部分代表意思,这些部分就是语素。汉字是笔画组成的。组成一个汉字的笔画,如果分成几个部分,每个部分代表意思,这些部分就是中文的语素。这些部分也叫偏旁部首。

英文语素分为独立 free 语素,和不独立 bound 语素。独立语素单独写是一个单词,不独立语素单独写不是一个单词。例如 redo,undo 这两个单词。do 单独写仍然是一个单词,do 就是独立语素。re 和 un 单独写不是一个单词,它们就是不独立语素。不是所有的单词都能这样分,有的单词分开来不代表意思,这种单词就没有语素。例如 cat,dog。可以分成语素的单词,都是组合起来的单词 compound word。
中文偏旁部首也可以分为独立 free 偏旁部首,和不独立 bound 偏旁部首。独立的偏旁部首,例如,木字旁,虫字旁,女字旁,舟字旁,等等。这些偏旁部首单独写就是一个字,它们就是独立语素。不独立的偏旁部首,例如,提手旁扌,立刀旁刂,草字头艹,宝盖头宀,等等。这些偏旁部首单独写不是一个字,它们就是不独立语素。有的汉字是独体字,不能分。这些独体字没有语素,例如,日月。有的汉字是合体字,例如,明。合体字就是 compound word。

中文的偏旁部首和英文的 morpheme 的性质一模一样。如果说中文有 morpheme,那就是汉字的偏旁部首。


回到新概念语言学


  • 注1、【语素】名词,语言中最小的有意义的单位。汉语的语素绝大部分是单音节的,也有一些是多音节的,如“人、手、究、吗、疙瘩、逍遥、巧克力、奥林匹克”。有的语素能够单用,是成词语素,如“我、跑、高、琵琶”,有的语素不能单用,是不成词语素,如“翔、历、们、履”。在分析词的内部结构时,有的语法书把语素叫作词素。《现代汉语词典》第六版1591页
  • 注2、词 cí 在句子里能自由运用的最小语言单位,“人”、“马”、“水”、“商品”、“竞争”等。《新华字典》第十版71页
  • 注3、【词素】词的构成成分,是最小的音义结合体,词根、前缀、后缀都是词素。有的词只有一个词素,如“人、蜈蚣”等。有的词包含两个或者更多的词素,如“老虎”包含“老”和“虎”两个词素,“蜈蚣草”包含“蜈蚣”和“草”两个词素。“图书馆”包含“图”、“书”和“馆”三个词素。参看591页『语素』。《现代汉语词典》第六版212页
  • 注4、【单词】1、词(区别于“词组”)。《现代汉语词典》第六版253页 



Monday, September 11, 2017

中文的概念

中文的概念

概念是人类为了认识和表述世界,给世界万物起的名称。概念在人的大脑里,用中文写出来就是字和词,用英文写出来就是 word 和 phrase。
不少人可能以为中文和英文的概念是一样的,实际情况是,大多数都不一样。我们先谈中英文一样的概念,再谈中英文不一样的概念。

一,中英文一样的概念
中英文一样的概念,数量不多。例如:太阳,The Sun;孔子,Confucius。除了专有名词proper noun,还有音译的概念,中英文也是一样的。例如:豆腐,tofu;coffee,咖啡。
这里要注意,一个概念可以有多种表达方法。例如:番茄,西红柿,洋柿子,是同一个概念,它们都是tomato。

二,中英文不一样的概念
我们先谈中文比英文细致的概念,再谈英文比中文细致的概念。

1,中文比英文细致的概念
中文比英文细致的概念,数量也不多。例如:brother,中文分哥哥和弟弟。再例如:cousin英文一个概念,中文分为堂哥,堂弟,堂姐,堂妹,表哥,表弟,表姐,表妹,8个概念。在家庭和亲戚成员的称呼上,中文的概念划分比英文细致,因此中文表达比英文更准确。
我曾经和我的ESL老师,一个不懂中文的老外,讨论过 uncle 这个概念。我说中文的 uncle 不仅要根据和父亲和母亲的关系划分,父亲一方的 uncle 还要和父亲的年龄比较分长幼。这个老外想了好一会,最后他问了我一句话,有必要这样划分吗?我也答不出来。

中文概念划分比英文细致,也不仅仅是家庭成员,还有一些。例如:你,你们,老外就是一个you。大米,白饭,稻子,英文就是一个rice。老外竟然不分大米饭和稻子,你说可笑不可笑。蚕丝和绸缎,老外都是silk。这些概念如果你仔细解释,老外也能分得清,当然要麻烦一点。
有的就不一定了,例如中国人结婚分为嫁娶,英文就是一个marry,就算你解释再清楚,老外也未必能明白什么是嫁,什么是娶。

2,英文比中文细致的概念
上个世纪八十年代中国流行一本英文教材,新概念英语,里面有两个单词 continuously 和 continually,中文翻译只有一个,连续地。当时我分不清,后来明白了,不过到现在还是记不住哪一个是哪一个。
英文是两个概念,中文是一个概念,这种情况很多。例如,鳄鱼,英文有两个,crocodile和alligator,一种嘴尖,一种嘴圆。听,hear,listen。看,see,watch。要解释它们的区别,还挺麻烦的。

中文一个概念,英文是两个概念,有时候问题不大,有时候问题很大。例如:钱学森写文章说粮食亩产万斤是可能的。可能,英文有两个:possible 和 probable。possible是将来有可能;probable是很容易做到的可能。
如果钱学森说,亩产万斤是 possible,这句话完全正确;如果钱学森说,亩产万斤是 probable,则是错误的。我估计钱学森想说的是possible,毛主席理解的是 probable,阴错阳差,结果中国悲剧了。是钱学森说的不对,还是毛主席理解错误?看来都不是,只能怪中文把两个不同的概念混为一谈。如果使用英文的概念,可能就不会发生这种事。

概念相同还是不同,查英文解释英文的字典,立即见分晓。请注意,一定要查英文解释英文的字典;不能查英汉字典,也不能查汉英字典,这两种字典没有用。
还有一些概念不同,字典里差查不到,要到文法grammar里找。例如,英文的虚拟语气,中文就没有。英文可数名词的单数和复数是不同的概念,中文的名词基本上不分单复数,也就是说,中文常常把英文里的两个不同的概念混为一谈。详情可以参考我的文章《单数和复数》。

中文概念和英文概念不一样,中文翻译是一个重要的原因。例如:马克思主义的proletariat,中文翻译无产阶级,我们可能会以为农村的雇农是无产阶级。其实就是文革前中国工厂里的工人,也不是proletariat,那时候中国的工厂没有资本家,工人是领导阶级,是工厂的主人。现在的农民工倒是有点像马克思主义里的proletariat,但是我们不再使用无产阶级这个词了。
我这里谈的是翻译,不是政治。我再找几个和政治无关的例子。例如:bus,过去我们翻译为公共汽车,因为那时候城市里的公共交通都是这种汽车;其实大的企业也有bus,那可不是公共汽车。train,火车,早就不烧煤,没有火了。ship,轮船,早就没有轮子,改螺旋桨了。很多人以为,英文里有一个概念,只要翻译成中文,中文就有这个概念了。这是错误的观点。

中文概念和英文概念,差距很大。有人可能会问,其他文字的概念和英文差距大吗?答案是:不大。为什么会是这样?原因是,每个汉字都代表意义,中文没有的概念,用汉字无法准确翻译(意译)。换句话说,用汉字翻译的概念,都是错误的翻译,充其量只是错误的大小程度不同而已。
要想准确“翻译”一个没有的概念,一定要使用字母。请注意,这里“翻译”是打引号的。字母文字之间,碰到没有的概念,不是翻译translate,而是直接引用,或者转写transliterate。也就是说,只有字母文字才能吸收原汁原味地新概念。详情可以参考我的文章《闲谈翻译》。

有人说中国人的思维和老外,例如美国人,不一样,主要原因是我们使用的概念不一样。中国人逻辑思维常常出问题,主要原因也不在判断和推理,而在概念。因为充要条件,三段论,因果关系和相关关系,这些都可以学习。概念不同,使用中文没法学习。
概念是思维的基础。中文的概念不仅数量少,而且和世界上其他国家不一样。中国人要想增加概念,和世界同步,最好的方法就是使用汉语拼音。虽然我们这一代已经离不开汉字,但是,我们不能让我们的后代重蹈覆辙。现在就开始使用汉语拼音,要不了几十年,中国就可以过渡到字母文字。



参考:
闲谈翻译  http://hx.cnd.org/?p=150166
单数和复数  http://hx.cnd.org/?p=152575


Thursday, September 7, 2017

妄议AI

妄议AI


为什么是妄议?因为我不是 IT 理工男,没有资格谈 AI。这是我第一篇谈论 AI 的文章,可能也是最后一篇,姑妄听之吧。AI 英文是 Artificial Intelligence 的缩写,意思是人造的智慧。有人翻译为人工智能。这里智慧和智能是同义词。
前些日子,阿尔法围棋 AlphaGo 战胜人类顶级围棋手,再一次引爆了人工智能这个话题。很多智者杞人忧天,担心人工智能会不会统治人类。我,无知者无畏。我认为人工智能只是人类的一个工具,工具永远是人类控制的。人工智能不可能控制人类,至少现在一点可能性的影子都没有。

人类还没有完全进化为人类的时候,就开始创造和使用工具了。据说最早的工具是石器。我在博物馆看到过石器,当时感觉不怎么起眼。如果我说石器就是人工智能,可能有点过。因为我们通常把劳动分为体力劳动和脑力劳动。虽然体力劳动和脑力劳动是不可分的,一个人体力劳动时,也会使用大脑。一个人脑力劳动,也需要体力。我们一般还是认为石器提高的是体力劳动的效率。
石器发展到金属工具。简单工具发展到复杂的机械,也就是机器。没有动力的机器,发展到有动力的机器。上个世纪四十年代,情况发生了巨变,人类发明了计算机。计算机提高的肯定是脑力劳动的效率,这一点应该不会有争议。其实在计算机发明之前。人类已经发明了提高脑力劳动效率的机器。例如,我们中国人发明的算盘,外国人发明的计算尺,手摇计算器。不过我们现在差不多已经忘记这些东西了。

计算机极大地提高了脑力劳动的效率。例如圆周率,是一个无理数,无限不循环小数,四千年前,古埃及人和古巴比伦人算到小数点后一位小数。一千五百多年中国数学家祖冲之算到7位小数。十九世纪有人耗费数十年,乃至毕生距离算到了几百位小数。计算机现在可以算到数十万亿位小数。这个数字,人类不要说计算,就是数,也数不清。
计算机计算能力这么强大,但是,它们只会计算,不会思维。人类能思维,因为人类有大脑。电脑不是脑,电脑没有脑。人类有生命,有大脑能思维,有意识能感觉到快乐和痛苦。这一切,这些计算机都没有,因为计算机没有生命。
人工智能,说到底就是计算机,高级的计算机。再高级的计算机,仍然是机器,是工具。
机器人是机器,不是人,它们没有生命。人工智能是人造的智慧,是人的智慧放到机器上。计算机没有自我意识,计算机是按照人类设定的指令工作。

我们接着谈下棋。最简单的井字棋 Tic-tac-toe。棋盘有9个格子,变化少,人的大脑就可以穷尽其变化。双方只要不犯错误,结局一定是和棋。
国际象棋,棋盘有64个格子,变化多,不仅人类大脑不可能穷尽其变化,计算机现在也做不到。普通人下象棋,一般只计算两三步棋,据说象棋高手可算到10步棋。1997年 IBM 开发的深蓝 Deep Blue 可以算到12步棋,所以深蓝战胜了国际象棋的世界冠军,引起世界的轰动。

围棋,棋盘有361个格子,变化更多。二十年前,计算机还不能战胜职业围棋手。虽然摩尔定律已经失效,电脑的发展速度远远超过人脑的进化。现在阿尔法围棋已经战胜人类顶级围棋手。如果将来电脑可以穷尽围棋的变化,我想围棋的结局一定也是和棋。
人脑的计算能力是有极限的,就像人的体力有极限一样。人和机器比赛力量,例如人和汽车赛跑,早就没有意义。人和计算机比赛计算能力,同样毫无意义。只不过阿尔法围棋现在还是新鲜事,大家激动一下很快就会平复。

机器提高了人类体力劳动的效率,肯定会消灭艰苦的体力劳动。我猜想,机器最终会消灭体力劳动的阶级,也就是马克思说的工人阶级。计算机提高了人类脑力劳动的效率,也会消灭繁琐的脑力劳动。说不定将来也会消灭治人的劳心者阶级。到那时,劳动不再是谋生的手段,一个幽灵,共产主义幽灵,又会在世界游荡。奴隶社会也会复辟,奴隶主仍然是人类,奴隶不再是人类,而是人工智能。剥削制度依然存在,不过不再是人剥削人,而是人剥削人工智能。


回到新概念语言学