Monday, December 11, 2017

中国落后的根源 -- 文字与知识

中国落后的根源 -- 知识与文字


一个国家落后的主要原因是生活在这个国家土地上的人的知识落后。知识是人类在认识世界的实践中得到的经验和技能。知识除了可以通过实践获得,还可以通过向他人学习获得。向他人学习知识非常重要,因为一个人的寿命是有限的,如果一个人的知识都要靠实践获得,那么这个人的知识一定是有限的。如果每个人的知识都是靠实践获得,人类社会就不可能发展。
现代社会里,绝大多数人的知识都是向他人学习获得,因为学习他人的知识可以节省大量实践的时间,效率高,而且一个人只有学习了他人的知识后,才有可能在实践中发现前人没有的知识,人类社会才可能进步。因此,学习他人的知识对人类社会的发展非常重要。
学习他人知识的媒介是语言language,没有语言就无法学习他人的知识。语言包括口语和文字。如果没有文字,口语传递的知识是非常有限的,所以文字在人类积累知识的过程中非常重要。社会发展到今天,一个人如果不识字,这个人就是低端人口。识字的人不仅可以学习他人的知识,还可以把自己实践得到的知识写下来,传给他人,所以,文字是一个人,乃至整个人类积累知识不可或缺的工具。

文字也叫书写系统writing system。常见的文字有中文和英文。不论中文还是英文,都是用各种符号character顺序排列而成的文章。文章都由段落组成,段落由句子组成,句子由各种不同的单位组成。
单位是组成句子的部件。单位,英文是the smallest unit最小单位,中国语言学界习惯说基本单位,简称单位。具体地说,除了标点符号,中文的单位就是汉字,英文的单位就是单词word。
中文的句子由汉字组成,这个很容易理解。英文的句子由什么组成?有人可能以为英文的句子由字母组成。这是错误的,英文句子由单词组成。除了标点符号,英文句子里只有单词,没有字母。即使 I 和 a,在句子里也是一个单词,因为它们前后都有一个空格。

句子里的单位有两种:
第一种单位只有一个符号,例如汉字,我把这种单位叫做独立单位。
第二种单位由多个符号组成,例如英文word就是四个符号组成的单位,我把这种单位叫做组合单位。

第一代文字,也就是原始的文字,只有独立单位。由于独立单位就是一个符号,而符号的数量是不能无限增加的,所以第一代文字是不可持续发展的文字。
第二代文字,也就是现代的文字,除了独立单位,还有大量的组合单位。组合单位是一种高效率的单位。例如,二十六个英文字母可以组成几乎无穷无尽的单位。所以,第二代文字,也就是字母文字,是可以发展的文字,高效率的文字,先进的文字。
现在全世界所有的文字,除了中文都升级到第二代文字。由于中国语言学界目前还没有搞清楚中文的单位是什么,所以绝大多数中国人不知道什么是第一代文字,什么是第二代文字。

第一代和第二代文字的差距主要在单位的数量上。例如,中文现在只有一万个单位,英文已经超过一百万个单位,这也是英文表达比中文清楚准确的重要原因。句子里的每一个单位代表的意义就是我们大脑思维的概念,从文字的角度看是意义,从思维的角度看就是概念。
单位的数量好比数码图像里的像素pixel;像素越大,图像越清晰;单位越多,表达越准确。像素小的图像无法转换成像素大的图像。单位少的文字无法准确翻译单位多的文字。一个使用落后的文字的人不能完全理解先进的文字表达的意思。

用先进的文字把知识写下来,表达的更清楚,学习知识更容易理解,也就是说,效率更高。一个人只有使用先进的文字,才有可能学习到他人先进的知识;一个人只有学习了他人先进的知识,才有可能创造更先进知识。
牛顿曾经说过:如果说我看得比别人更远些,那是因为我站在巨人的肩膀上。使用汉字的人是站在侏儒肩膀上,无论我们如何伸长脖子,我们看得都不可能比别人远。我们学习不到先进的知识,我们输在了起跑线上,这就是中国落后的根本原因。


Sunday, December 10, 2017

文字的升级换代

文字的升级换代

文字也叫书写系统writing system。世界上最早的文字是五千多年前西亚两河流域的楔形文字和古埃及的象形文字。现代的文字是字母文字,也叫拼音文字,例如英文,日文等。原始的文字是第一代文字,现代的文字是第二代文字。
不论是第一代,还是第二代文字,都是用各种符号顺序排列而成,以文章的形式出现。文章由段落组成;段落由句子组成;句子由各种不同的单位组成。单位是组成句子的部件,是文章里最小的单位the smallest unit。中国语言学界习惯说基本单位,简称单位。除了标点符号,中文的单位是汉字,英文的单位是word。

文字的单位是语言学里非常重要的概念。如果你不知道什么是文字的单位,可以说你不懂语言学。单位有两种:
1,第一种叫独立单位。独立单位就是一个符号。例如,标点符号,汉字。
2,第二种叫组合单位。组合单位是多个符号。例如,英文word,就是四个符号(字母)组合成的一个单位。

第一代文字和第二代文字的区别:
1,第一代文字只有一种单位,也就是独立单位。中文只有一种单位,因此中文是第一代文字。
2,第二代文字有两种单位,除了独立单位,还有组合单位。字母文字都有组合单位,因此字母文字都是第二代文字。

独立单位和组合单位使用的符号不一样:
1,独立单位的符号表意。
2,组合单位的符号不表意。

由于符号的数量不能无限地增加,因此,独立单位的数量肯定是有限的。只有独立单位的第一代文字是不可持续发展的文字,只要社会发展到一定程度,一定会升级到第二代文字。
组合单位的数量是无限的。二十六个英文字母可以组成大量的单位,并且可以不断地增加。现在全世界所有的文字都升级换代到第二代文字,只剩下中文了。

文字是一种工具,熟悉一种新工具需要一个过程。一个国家的文字升级换代通常需要一段适应时间,有时候甚至还会有反复。西方从楔形文字进化到腓尼基字母经历了两千多年。原来使用汉字的国家,日本经历了一千多年,韩国和朝鲜经历了五百多年,越南也经历了四百多年,才先后升级到第二代文字。
中国由于政权更迭,历史上两度使用字母文字。最后一次是满文,满文是字母文字,是第二代文字。1911年辛亥革命推翻满清政府,中国又倒退到汉字,汉字是第一代文字。汉字文言文根本不能适应二十世纪的中国,新文字一时半会也来不及创造,只能暂时使用汉字白话文来应付。白话文就是拿汉字代替字母。日本人一千多年前就使用汉字写日文白话文,这种文字叫万叶假名,万叶假名是现代日文假名的前身。
1958年中国制定了汉语拼音(文字)方案,这件事和秦始皇书同文一样,将青史留名。汉语拼音是一百多年前中国第一次改革开放的结果。目前中国的知识分子只知道汉字是历史悠久的文字,不知道汉字是第一代文字,因此中文升级换代暂时处于半停滞状态。

为什么中国语言学界不知道汉字是第一代文字?原因是他们不知道什么是文字的单位。他们现在还在纠结中文的基本单位是字,还是词。简称“字本位,词本位之争”。
为什么他们不知道什么是文字的单位?因为是他们使用的概念有问题。具体地说,汉字又叫文字,既是中文的单位,又是中文的符号,因此很多人,包括不少语言学教授,就把“文字,单位,符号”这三个不同的概念混为一谈。概念混乱,思维不可能正确。下面是这三个概念的定义:
1,文字是指书写系统writing system。例如:中文,英文。
2,单位是文字里最小的单位。例如:标点符号,汉字,word。单位都是表意的。
3,符号是文字里的各种各样的图形。标点符号,汉字,字母都是符号。符号可能表意,例如:汉字。也可能不表意,例如:字母。

文字的单位是非常重要的概念。只有知道了什么是文字的单位,才能理解什么是独立单位,什么是组合单位;才能明白什么是第一代文字,什么是第二代文字。只有知道了什么是中文的单位,什么是英文的单位,才能比较中英文。
文字是发展的;文字的发展就是增加单位。只有独立单位的中文是第一代文字,单位的数量是有限的。中文想现代化,只有使用汉语拼音字母组成组合单位,也就是升级换代到第二代文字。自古华山一条路。


为什么英文单位比中文多

为什么英文的单位比中文多

单位是组成句子的部件。单位,英文是the smallest unit最小单位,中国语言学界习惯说基本单位,简称单位。不论中文还是英文,文章都由段落组成,段落由句子组成,句子由单位组成。具体地说,除了标点符号,中文的单位就是汉字,英文的单位就是单词word。
中文的句子由汉字组成,这个很容易理解。英文的句子由什么组成?有人可能以为英文的句子由字母组成。这是错误的,英文句子由单词组成。除了标点符号,英文句子里只有单词,没有字母。即使 I 和 a,在句子里也是一个单词,因为它们前后都有一个空格。

句子里的单位有两种:
第一种单位只有一个符号,例如汉字,我把这种单位叫做独立单位。
第二种单位由多个符号组成,例如英文word就是四个符号组成的单位,我把这种单位叫做组合单位。

第一代文字,也就是原始的文字,只有独立单位。由于独立单位就是一个符号,而符号的数量是不能无限增加的,所以第一代文字是不可持续发展的文字。
第二代文字,也就是现代的文字,除了独立单位,还有大量的组合单位。组合单位是一种高效率的单位。例如,二十六个英文字母可以组成几乎无限的单位。所以,第二代文字,也就是字母文字,是可以发展的文字,高效率的文字,先进的文字。

中文只有独立单位,英文除了独立单位,还有组合单位,是英文的单位比中文多的原因。


Sunday, November 19, 2017

汉字是二维的吗?

汉字是二维的吗?

网上有人说,英文是一维的,汉字是二维的。这些人要么不解释为什么英文是一维,汉字是二维,要么解释的让你听不明白。反正至今我也没有发现哪位专业语言学人士这样说,也找不到有关的理论。在我看来,文字都是三维的,因为文字离不开它的载体,而世界上所有可以作为载体的东西都是三维的。从苏美尔的泥板,中国的甲骨文,石鼓文,钟鼎文,竹简,纸张,到现在计算机屏幕,无一例外。或许有人会认为写在纸上的文字是二维的。他们忘记了,纸再薄,也是有厚度的。二维平面是一个抽象的概念,世界上并不存在二维平面的东西。

汉字和英文字母都是字符 character。不论什么文字,在文章里,字符都是顺序排列的。有人把拼音文字的字符(字母)顺序排列,换个概念叫一维,于是拼音文字就变成一维文字了。其实中文里的字符(汉字)也是顺序排列的。如果英文是一维文字,中文也应该是。
有人把汉字看成一幅图画,图画是平面的,平面是二维的,于是他们就说汉字是二维文字。如果汉字是二维,拼音文字里的字母也应该是,它们只是笔画比汉字少一些而已。

说汉字是二维的人通常还会告诉你,电脑传递中文的信息量比英文大。理由是电脑里英文字母是1个字节 byte,汉字是2个字节。由于大多数英文单词超过3个字母(需要3个以上字节),所以汉字效率高,传递的信息量大。水平高的人还能算出汉字的“熵”值。
我不懂熵,也不会计算熵的值。但是我知道计算机储存的信息是用二进制数字表示的。我们在屏幕上看到的字符,不论是英文字母,还是汉字,计算机都是不认识的。要使计算机认识(显示)字符,就要让这些字符和二进制数字对应起来,这就是编码 Character encoding。
屏幕上显示的所有字符,叫字符集 Charset。第一个商业用途的字符集 ASCII(American Standard Code for Information Interchange)美国信息交换标准代码,只能显示英文使用的字母和符号,以及阿拉伯数字。没有中文字符集,计算机不能显示中文。

计算机是美国人发明的,当然先有英文字符集,键盘也是按照英文设计的。很快也有了其他拼音文字的字符集,唯独不见汉字的字符集。一个重要原因是键盘只有一百多个按键,对于其他拼音文字的字符,略微调整一下就能解决。中文一万个汉字,不可能造一万个按键的大键盘。
最后的解决方法:不是按一次键输入一个字符(汉字),而是按几次键输入一个汉字。这种情况有点类似一百年前的电报,莫尔斯电码 Morse code 使用点 dot 和划 dash 的不同排列组合来表示字母,阿拉伯数字,和标点符号。英文电报里这三种字符加起来不到60个。中文电报就用4个阿拉伯数字(字符)代表一个汉字,也就是二次编码。虽然多了一道手续,但是可以发中文电报了。我们不能因为发一个最难的汉字只使用四个阿拉伯数字(字符),而一个超过5个字母的单词就要使用5个字符,就认为中文比英文效率高。
顺便说一下,ASCII 字符集就是根据电报码的原理开发的。ASCII was developed from telegraph code. 当然,计算机把翻译ASCII码的过程自动化了。

汉字是二维的吗?不论是与不是,都是无稽之谈。说汉字是二维的人,目的是为了鼓吹汉字优越。英文用几十个字符,中文需要成千上万的字符,明摆着效率低下,有些人就是看不见,因为狭隘的民族主义思想遮住了他们的双眼。

Friday, November 17, 2017

因果关系和充要条件

因果关系和充要条件

因果关系是人类观察到世界上两个事件之间的一种关系。世界上的事情都能扯上关系,不过关系有的密切,有的疏远。如果一个事件发生,会导致另外一个事件发生,这种关系就是因果关系。我们把发生在前的事件叫原因,发生在后的事件叫结果,简称前因后果。例如,因为下雨了,所以地面是湿的。这是简单的因果关系。

充要条件是充分条件和必要条件的简称。这两个概念来自英文 sufficient condition 和 necessary condition。学过几何的人都应该知道充要条件。
例如,一个平面图形,如果四个角是直角,四条边相等,这个图形一定是一个正方形。
四个角是直角,和四条边相等,就是一个正方形的充分条件。
我们也可以说,因为四个角是直角,四条边相等,所以这肯定是一个正方形。
从这里可以看出,充分条件就是因果关系的因。

这个充分条件由两个必要条件组成:1,四个角是直角。2,四条边相等。必要条件是必不可少的条件,缺了哪一个必要条件都不行。如果不是四个直角,肯定不是一个正方形;如果四条边不等,肯定也不是一个正方形。
我们也可以说,因为没有四个直角,所以这肯定不是一个正方形。
我们还可以说,因为四条边不等,所以这肯定也不是一个正方形。
从这里可以看出,必要条件也是因果关系的因。

但是我们要注意,必要条件的因,和充分条件的因,有区别:
1,充分条件的因,导致的结果通常是肯定的 positive。
2,必要条件的因,导致的结果往往是否定的 negative 。
必要条件是缺了它,就不行;充分条件是有了它,一定行。

我们还要注意,虽然我们用“因为所以”来表达因果关系,但是“因为所以”表达的关系不一定都是因果关系。
例如,有人因为天天吸烟,所以得了肺癌。吸烟和得肺癌之间有密切关系,毋庸置疑,但是吸烟的人不一定都会得肺癌。因此,吸烟和得肺癌之间的关系不是因果关系,而是相关关系。因为这两种关系,我们中文都可以用“因为所以”来表达,所以我们常常把这两种关系混为一谈。
相关关系包含因果关系,也可以说,因果关系是相关关系的特例。我们一定要牢记,有相关关系的两件事不一定是因果关系。因果关系,是就是,不是就不是。相关关系可以用数字来表示关系密切和疏远的程度。由于充要条件不谈相关关系,使用充要条件解释问题比用“因为所以”更简单明确一些。


下面我用充要条件和因果关系来分析文字和创造科学理论之间的关系。文字分两种,汉字和拼音文字。汉字因为基本单位数量太少,说不清楚复杂的问题,达不到创造科学理论的要求,所以,一个人只使用汉字肯定创造不出科学理论。使用达到要求的拼音文字,是创造科学理论的必要条件。不使用,就不行。它们是因果关系。
如果你不同意我的观点,你可以写文章论证我的理论错误,也可以找一个反证来让我自相矛盾。有些人不同意我的观点,他们既不论证我的错误,也不找反证,而是另外找一个原因,例如没有言论自由,来反驳我的观点。这个反驳在逻辑上是不成立的,道理很简单。“四个边不等,肯定不是正方形”不能证明“没有四个直角,肯定不是正方形”是错误的。
言论自由是不是创造科学理论的必要条件,它们是不是因果关系?原来我对这个问题不感兴趣,因为不论是不是都和我的观点无关。但是由于很多人都认为是,并且以此来否定我的观点,我不得不谈这个问题。

前苏联的体制和中国类似,但是苏联科学家切伦科夫 Cherenkov 弗兰克 Frank 塔姆 Tamm 因发现和解释切伦科夫辐射 Cherenkov effect 获得1958年诺贝尔物理学奖。苏联科学家兰道 Landau 因创造物质凝聚理论 for his pioneering theories for condensed matter 获1962年诺贝尔物理学奖。我还可以找出几位这种创造科学理论的苏联科学家,我不找了,因为反证只要有一个就足够了。从这些例子我得出结论:即使一个社会没有言论自由,也不会不影响这个社会里的人创造科学理论。所以,没有言论自由不是中国人创造不出科学理论的原因。
还有,据说台湾有言论自由,只使用中文的台湾人至今没有创造出一个科学理论。好像美国言论最自由,美国唐人街里只使用中文的华人也没有创造出一个科学理论。从这些例子我得出结论:即使有言论自由,不使用拼音文字的人仍然创造不出科学理论。也就是说,即使有言论自由,中国人仍然创造不出科学理论。

总而言之,言论自由不是创造科学理论的必要条件;没有言论自由和创造不出科学理论也不是因果关系。如果你真的希望中国人能创造科学理论,一定要明白,使用拼音文字是必要条件,言论自由不是。如果你是要求言论自由,That is a horse of another color,我们谈到不是一码事。



Monday, November 6, 2017

四声轻声和入声

四声轻声和入声

1,四声《现代汉语词典》的定义是:普通话的声调有阴平、阳平、上声、去声四类,也叫四声(轻声除外)。
这个解释,似是而非。我们说普通话按照四声吗?查《新华字典》氨 ān 铵 ǎn 胺 àn,三个 an 字,三种声调。我们说,氨基酸、銨肥、三聚氰胺,三个 an 字一个调。我们说话有声调,但不是四声。说话如果按照字典里的四声,那种怪腔怪调,不是正常人。
汉字对应汉语里的单音。一个人说话发出的单音数量是有限的。由于汉字数量远远超过单音的数量,于是中文出现大量同音字。四声有利于辨别单个的汉字。四声是古人总结出来的,目的是为了区别文言文里的同音字。
有的语言学家说四声是为了区别汉语的语义,那是瞎掰。目前普通话的单音有四百多个,加上四声,也只有一千多个单音。靠四声根本解决不了汉语语义的问题。全世界不论什么口语都是单音不够用了,就两个单音组合起来表意;两个单音不够用了,就用三个;三个不够就四个,以此类推。

2,轻声《现代汉语词典》的定义是:一个字读的又轻又短,大量出现在一个词的后一个字。
这个解释,基本正确。轻声不是谈一个字,一个字无法比较轻重。轻声是指一个词里的一个字,读的比其他字轻。和轻声对应的是重音,也叫重读。一般来说,轻声读的短而轻,重音读的长而重。
即使是同一个字,在不同的词里面,读音也不一样。例如:干净,干活;创造,创伤;扇子,扇风;假如,放假;缝纫,裂缝;把握,车把;几个,几乎;指甲,手指。轻声类似英文多音节单词音标里的重音 stress,只不过英文字典标注重音,中文字典标注轻声。白话文里有大量的词,轻声有利于辨别口语里的词。轻声是使用白话文以后总结出来的。读白话文,区分轻重音即可,四声没有用。

3,入声《现代汉语词典》的定义是:古汉语四声的第四声。普通话里没有入声,古入声字分别读成阴平(如“屋、出”)、阳平(如“国、直”)、上声(如“铁、北”)、去声(如“客、绿”)。有些方言有入声,入声字发音一般比较短促,有时还带有辅音韵尾。
这个解释是想当然。谁听过古汉语?入声相当于英文以辅音结尾的单词的读音。现在普通话里没有入声,原因是切音,也叫反切。反切就是用两个汉字给另外一个汉字注音。用前一个汉字的声母,后一个汉字的韵母,相拼。例如:东,德红切。就是用德的声母 d 拼红的韵母 ong,变成 dong。由于反切,汉字都是韵母结尾,没有入声。现在普通话的话音对应白话文的汉字,所以现在普通话就没有入声。
为什么有些方言有入声?这是因为中国过去有大量的文盲,这些人说话不受反切的影响,所以有入声。反切,大约从汉朝开始使用。也就是说,中国文人说话,汉朝就开始失去入声。白话文运动后,识字率提高,入声加速消亡。
我认为,中国将来使用汉语拼音,入声还会回来。因为汉语拼音可以写辅音结尾的单词。例如现在以轻声结尾的词,使用汉语拼音以后,轻声的韵母会被省略,直至最后消失。例如,我的 wode 会被省略成 wod,豆腐 doufu 会被省略为 douf,这就是入声。入声有利于辨别口语里的声音,而且这种做法符合最省力原则。

4,总而言之,四声的目的是区别同音字,读以字为主的文言文有用处。轻重音是为了区别多个声音的词,读以词为主的白话文效果好。四声,轻声是音标,应该标注在音标里,不需要标注在文字里。汉语拼音标注四声是画蛇添足。入声不是音标,入声是辅音结尾的单词。普通话入声消失的根源是反切。


家庭手语的启示

家庭手语的启示

家庭手语,这个概念来自英文 home sign,是指一对听力正常的夫妇,生下来一个聋哑儿童,他们之间产生的一个全新的手语,这个手语就叫家庭手语。这是一个全新的语言 language,因为他们三人的手语都是从零开始。语言的起源是语言学家感兴趣的问题。手语是语言的一个大类。家庭手语让语言学家看到了一个新语言的起源。研究家庭口语会给语言学家带来很多启示。

家庭手语内容简单,因为一家人,只有三个人的生活,语言的内容不可能丰富。如果这个家庭第二个孩子也是聋哑人,两个聋哑儿童之间的手语会有一定的发展。使用家庭手语的聋哑儿童长大后如果不融入聋哑人社会,他们的手语极其简单。当他们死亡时,这个手语就消失了。从这里我们可以看出,同样的条件下,一个语言使用的人越多,这个语言的内容越丰富。当使用这个语言的人死亡时,这种语言也就消失了。

口语和手语都是利用人的身体活动发出信号,我把它们叫做身体语言。身体语言的信号是动态的,这种信号发出后就消失的无影无踪。在录音机和录像机发明之前,语言学家很难研究身体语言。书面语(文字)的信号不一样。文字的信号根据使用的材料不同可以保存一定的时间,也就是说,文字的信号会留下痕迹。我们可以根据这些痕迹给文字分类,分类标准通常是字典和文法。语言学家给身体语言分类,只能按照人群来划分的。

如果这家人住的村庄,或者社区还有其他聋哑人,家庭手语将和其他手语会融合成一种手语。从这里我们可以看出,两种不同的语言,只要交流就会融合成为一种语言。例如小说《鲁滨逊漂流记》中的主人公鲁滨逊在孤岛上和土著人星期五,因为交流,有了共同的口语,这是两个人的口语。现实生活中,两个原来分隔的人群,如果交流也会产生新的口语。这种口语叫 pidgin 皮钦,也有人翻译为洋泾浜。
说不同口语的两个人群,因为贸易,战争,移民等原因生活在一起,变成一群人,他们的口语,最后迟早都会混合而成一种新的口语。当然这取决于我们如何划分口语的种类。例如我们一家人来到美国,第二代人的母语或许还是汉语,但是第二代人的第一语言 first language 一定是英语。这时候没有人会把英语看成一种新的口语。因为我们一家人的对美国的口语影响太小了,像汪洋大海里的一滴水,这种影响可以忽略不计。
如果移民的不是一家人,而是一群人,影响就会根据人口数量的增加而增加。如果移民是强势群体,影响会更大,例如殖民地的口语。殖民者的数量可能少于原住民,但是殖民者的社会地位高于原住民。一个群体的口语有人数上的优势,一个群体的口语有地位上的优势。这时候,两种口语混合而成的口语,就是 pidgin 口语。

当说 pidgin 口语的人有了第二代,第二代人的母语就是这种 pidgin 口语。这时候这种新的口语不再叫 pidgin,而叫克里奥尔 creole。现代社会,随着发展,使用克里奥尔口语的人还会创造克里奥尔语的文字,一种新的文字。
严格地说,除了亚马逊热带雨林里和外界没有接触的原始部落的口语,现代社会里,所有的口语都是克里奥尔语,只是外来口语的成分多少而已。人类口语的划分,没有可执行的标准,只能按照人群大概的划分,没有什么语言学意义。

使用家庭手语的聋哑儿童如果进入聋哑学校,他们会进一步地融入社会,因为聋哑学校的学生使用文字。文字和手语是类型完全不同的语言。文字是比手语更先进的语言。如果没有文字,手语只能交流简单的信息。文字的信息量远远大于手语。一个原因是身体语言里的知识好像计算机内存 ram 里的数据,使用后就消失。文字里的知识好像硬盘里的数据,可以长期保存,提高了人类的记忆力。因此,使用文字的人,他们使用的概念,数量远远超过文盲,他们认识世界的能力因此也高于文盲。还有一个原因是,使用一种文字的人,数量远远超过使用一种身体语言的人。
原因是使用不同手语的人可以使用同一种文字,美国聋哑人和英国聋哑人的手语不一样,他们都使用英文。使用不同口语的人也可以使用一种文字,例如北京人,广东人,上海人说不同的口语,他们都使用中文。

研究手语和文字的关系,可以让我们进一步看清口语和文字的关系。说文字和手语是不同的语言,不会有异议。说文字和口语是不同的语言,有些人想不通。这些人,还包括一些语言学家,他们认为口语和文字是同一种语言,文字是口语的书面形式。
其实,口语和文字根本没有关系,只是由于我们表达同一个意思,既可以用口语,也可以用文字,我们就把它们混为一谈了。我们不会认为手语和文字是一回事,是因为我们不使用手语。聋哑人的看法和我们不一样,因为他们表达同一个意思,既可以用文字,也可以用手语。实际上,这两种看法都是片面的。应该说,人类表达同样的意思,可以使用口语,手语,和文字三种不同的语言。
说中文和汉语是两种不同的语言,很容易理解。说英语和英文是两种不同的语言,老外比较难理解,因为老外的英语和英文都是 English。如果口语和文字是一种语言,那么就会得出,曾经使用汉字的中国人,日本人,韩国人,朝鲜人,越南人过去都说同一种口语的荒诞结果。口语和文字的关系,是因为我们同时使用它们,让它们有了联系。说文字是口语的书面形式,也可以说口语是文字的声音形式。实际上,口语,手语,文字是人类表达思想三种不同的形式。

通过研究家庭手语,我们可以看到语言创造,发展,融合,消亡的过程。语言是为了交流而创造,语言也是交流的结果。我们交流使用的信号就是语言,不同的信号决定了语言的效率。身体语言发出信号不需使用其他材料,最方便,缺点是单位数量少,信息量小。文字的信号可以保存,信息量大。文字的单位数量越多,这种文字越高级。


Friday, October 27, 2017

发表在华夏文摘的文章

发表在华夏文摘的文章

21,四声轻声和入声
20,家庭手语的启示
19,文字与符号——兼评彭小明《汉语汉字与科学符号》
18,汉字的形音义
17,闲谈文化
16,中国人的创造力
15,词典词 
14,评海参崴先生《也谈汉字与科学》
13,概念和意义
12,评因黎先生《汉字与科学》
11,评彭小明先生《汉字、科学思维和绿色文化保护意识》
10,什么是语素?
9,表意文字和表音文字  
8,妄议AI
7,人类语言会统一吗?
6,字典和词典
5,语言和方言
4,回复单若水先生的探讨和商榷
3,为什么中文没有文法?
2,为什么美国没有高考?
1,中国科学落后的原因 — 内因和外因 

回到新概念语言学

Thursday, October 19, 2017

闲谈文化

闲谈文化


文化是一群人的生活方式。一群人的衣食住行,风俗习惯,音乐舞蹈,宗教信仰,政治经济,语言文字,科学逻辑,凡是和一群人生活有关的内容都是文化。可以说文化是个筐,什么都可以往里装。一群人可以小到一个部落,大到一个国家,乃至整个世界,都是一群人。

民以食为天,饮食文化是最大的文化。世界各地的人都因地制宜,有自己的饮食文化。中国北方种小麦吃饺子馒头,南方种大米吃米粉汤圆,老外吃汉堡包披萨饼。随着交流,中餐馆遍布世界各地,麦当劳肯德基也进入中国。
中国的食物五花八门,有人说中国人什么都吃。原因是中国过去是小农经济,碰到荒年,只能什么都吃。老外食物的品种比较单调,主要是鸡肉鸡蛋,牛肉牛奶,海鲜,蔬菜等。是不是因为老外的农牧业已经机械化,食物可以保证供应,我没有研究。食物的成分,无非是蛋白质,脂肪,碳水化合物,以及各种矿物质。听说很多山珍海味并不好吃,有的还要靠鸡汤来调味。人类的饮食文化,将来会如何发展?我不知道。不过,我认为营养卫生,简单方便是方向,满汉全席肯定会淘汰。

人吃饱了就要娱乐 entertainment,娱乐文化五花八门。音乐分古典和现代。舞蹈除了专业的,还有大妈广场舞。戏曲电影,广播电视,马戏魔术,说书讲故事,游行 parade 烟火,展览会,游乐场,购物中心,以及体育比赛。
中国有京戏,西方有芭蕾舞。过去有相声,现在有小品。中国人精通乒乓球,老外善于足球篮球。年轻人沉溺电脑游戏,老年人喜欢报纸电视。新的娱乐形式不断涌现,旧的娱乐形式慢慢消失。

吃喝玩乐的文化是萝卜青菜各有所爱,无所谓好坏。喜欢哪一种文化取决于每个人的条件,富人热衷高尔夫,穷人只能打扑克,腰缠万贯就吃大餐,囊中羞涩可以点快餐。但是有一些文化可以分好坏,例如妇女裹小脚,就是坏文化。
还有一些文化可以分先进与落后,最典型的是工具。人类不断地发明高效率的工具,取代落后的工具。例如交通运输工具,先进的汽车取代落后的马车。再例如文字,先进的字母文字取代落后的表意文字。

文化是如何形成的?一个人的生活方式叫习惯,一群人的生活方式才能叫文化。一个人的生活习惯,如果大家觉得好,大家都会学习。于是一个人的生活习惯就变成了大家的生活习惯,大家的生活习惯就是文化。过去交通不便,加上高山大海的阻隔,世界各地的人活动范围很小,由于各地的政治和经济发展速度不一样,各地人民形成了不同的文化。
像饮食文化,娱乐文化,这类无所谓先进与落后的文化,我们不需要强制文化统一,应该随其自然发展。而可以分先进与落后的文化,我们不应该鼓吹多元化,应该促其统一,这种文化统一说明落后的社会在进步。

文化不是固定的,而是发展的,文化一直在不断地试错 trial and error 过程中。一个人的生活习惯,大家觉得好,就变成了文化。后来大家又发现不好,这种文化就会被淘汰。例如前面谈到的女人裹小脚,早已被中国人民抛弃。群众的眼睛是雪亮的,坏的文化,无论历史多么悠久,最后一定会被抛弃。中国的贞节牌坊,随着妇女解放,正在被抛弃。百善孝为先,即将被抛弃,因为中国正在完善退休养老制度。还有忠君爱国,随着一百年前中国最后一个封建王朝倒台,忠君不复存在。爱国可能还要保留到马克思说的国家消亡那一天。保留好的文化,抛弃坏的文化,社会才能进步。例如,奴隶制度被自由制度取代,封建制度被民主制度取代。这些都是文化在进步。

一种文化能存在,一定有存在的原因。例如中国人喝热水,原因是中国的自来水达不到卫生标准。等到自来水达标后,喝热水的习惯慢慢会改变,因为烧开水总是麻烦事,违背最省力原则 The principle of least effort,最省力原则就是用最小的代价达到目的。
现在世界交流频繁,一种文化如果不是普世的文化,一定是落后的文化。例如医学,古时候世界各地的治病方法是不同的文化,现代医学是科学,是先进的文化。中医目前还在中国流行,那是因为中国西医的数量还不能满足全国人民的需要,等到能满足的那一天,中国人民一定会抛弃中医。可以说,需要弘扬的文化都是落后的文化,过时的文化,被人民淘汰的文化。弘扬中华文化是倒行逆施,不符合中国人民的利益。热衷吹嘘自己文化优秀的人,十有八九是为了掩盖自己另一方面不如人,就像喜欢炫耀自己祖上曾经也阔过的人,很可能现在家道中落了。

只要人类存在,个人就会有习惯。地球这么大,各地就会有不同的文化。但是,交通在发展,交流在扩大,互联网的出现,天涯若比邻。现在世界是一个整体,科学,逻辑,普世的价值,都是世界人民共同的生活方式,也是普世的文化。
普世的文化是先进的文化。不论谁创造的文化,不能成为普世的文化都是落后的文化。不要担心坏的文化进来,进来也不可能长久,最后一定会被淘汰。最可怕的是我们的文化不能成为普世的文化。


回到新概念语言学

汉字的形音义

汉字的形音义

众所周知,汉字有形音义。从小学一年级开始,语文老师就告诉我们汉字有形音义。但是,汉字有形的有,和有音有义的有,情况不一样。
文革时有一句口号,我们也有两只手,不在城里吃闲饭。这里的有,是永远的有,不能分开的有。我们的手和我们的身体是不能分开的。
我有十块钱,大家都知道,钱是身外之物。这里的有,是暂时的有,可以没有的有。我到商店转一圈,十块钱我就没有了。

汉字有形,是永远的有。汉字的形由偏旁部首,或者笔画组成。汉字永远有笔画。汉字有音有义,和汉字有形完全不同。先说汉字有音。汉字的音是每一个读汉字的人发的音,和这个汉字本身无关。
汉字的读音,过去靠口口相传,再加上各地方言,汉字的读音乱七八糟,没有一个标准。现在好了,我们可以拿新闻联播的读音作为标准。例如,九零年我到香港,是乘火车去的,在红磡火车站下车。我不认识磡字,香港朋友告诉我,红磡广东话读起来有点像红横。香港回归一周年的汇演是红磡体育馆举行的,我听中央电视台播音员的读音是红 kan。

汉字的读音不是固定的。再举一个例子。有一种植物叫荨麻,很多人不知道荨读 qian,好在这个字不常用。可是有一种常见的皮肤过敏病叫荨麻疹。俗话说,秀才识字读半边,很多人就读寻麻疹。由于读错的人太多了,现在《现代汉语词典》的注音已经改为 xunmazhen。看来,汉字的读音无所谓对错,如果大家都错,错的就是对的。
汉字自己不会发音,你怎么读,都和汉字无关。汉字的读音,每个人的读音都不一样。较真的话,一个人的每一次的读音都不一样。

汉字的音,至少还能听见,能感觉到。汉字的义,你连感觉都感觉不到,你只能想象。很多人认为字典里每个字的解释就是汉字的义,这个认为是有问题的。字典里有的汉字有很多义,而在文章的句子里,每个汉字只有一个义,有的汉字还要和其他汉字合起来才能代表一个义。汉字的义,是我们在读文章的时候根据上下文临时决定的。字典里的义是供我们做决定时参考的。
如果你编过程,汉字就好比变量名,汉字的义就是你赋予变量名的值。如果你学过代数解方程,汉字就好比未知数 X,汉字的义就是你找到的未知数的量。变量的值,未知数的量,都像汉字的义,都是变化的。实际上也是如此,例如:粉丝,原来是吃的食品,现在是着迷的人。表哥。原来是亲戚,现在是戴名表的贪官。同志,原来是有共同理想的人,现在是有共同性趣的人。小姐,原来是大家闺秀,现在是性工作者。
汉字的义是我们大脑的思维活动,是我们看见汉字的理解。汉字本身没有义。如果汉字有义,为什么文盲和老外看不见。

总之,汉字的形音义,或者说文字的形音义,本质是不一样的。文字的形,是文字的本身。文字的音,是读文字的人发出的声音,不是汉字发出的声音。文字的义,是看文字的人大脑理解的义,文字本身没有义。


回到新概念语言学

Thursday, September 28, 2017

一个字是一个词吗?

一个字是一个词吗?

要回答这个问题,首先要定义什么是一个字,什么是一个词。字也叫汉字,方块字。汉字就是你现在看的这篇文章里的一个个正方形的符号。知道什么是一个字,什么是一个词就简单了。一个词就是句子里,连起来代表意义的几个字。最常见的词是两个字,其次是三个字。四个字也是一个词,不过很多四个字的词,我们习惯上叫成语。五个字以上的词很少了。大家一定要牢记,字和词的关系是单数和复数,这是关键的关键。

俗话说,一是一,二是二。一不可能是二。所以,一个字不可能是一个词。可是,中国很多语言学教授却说,一个字是一个词。他们这样说,违反了思维三定律 Three Laws of Thought 的第一条,同一律 Law of Identity。同一律要求人们在同一个思维过程中,使用的概念必须保持一致,不能任意变换。凡是说一个字也是一个词的人,都违反了同一律,他们逻辑思维出了问题。
这些语言学教授犯这个错误的原因是概念不清。或者说,他们字和词的定义有问题。中国语言学教授一般不给“字”下定义,有的干脆不承认有汉字。他们认为汉字就是词,单字词。他们给“词”下的定义是:语言里最小的、可以自由运用的单位。如果你问他们,你说的语言是什么语言?是口语,手语,还是书面语?他们通常是顾左右而言他,或者干脆不回答。因为他们没有办法回答,一回答就自相矛盾。因为在书面语里,也就是中文里,词根本就不是一个单位。中文的单位是汉字,中文是汉字组成的。

据说把词当作中文的单位,把字当作语素(词素)的始作俑者是赵元任。由于赵元任是语言学大师级人物,再加上吕叔湘等大师也同意赵元任的语素理论,三人成虎。现在大多数的语言学教授只能人云亦云。这些人看到我的文章,基本上是假装没看见,就像古代那个卖矛又卖盾的人,弗能应也。
把一个汉字叫做一个词,是张冠李戴,混淆概念。一个汉字是字,两个以上的汉字才能叫一个词。匪夷所思的是,小学生都能听懂的事情,中国很多语言学教授竟然想不明白。


回到新概念语言学

参考:
1,【词】语言里最小的、可以自由运用的单位。
《现代汉语词典》第六版211页
2,词cí在句子里能自由运用的最小语言单位,如“人”、“马”、“水”、“商品”、“竞争”等。
《新华字典》第十版71页
3,字,1、文字,用来记录语言的符号:汉字,字眼儿,字体,常用字。
《新华字典》第十版647页


Sunday, September 17, 2017

什么是语素?

什么是语素?

语素是一个语言学术语。《现代汉语词典》的解释是:语素是语言中最小的有意义的单位。词典给你举的例子是:人、手、究、吗、疙瘩、逍遥、巧克力、奥林匹克(注1)。所谓的语素就是汉字,或者汉字组成的词,换了个名字而已。
语素这个概念来自英文 morpheme。英文语素是某些单词 word 的组成部分。虽然这些单词是不代表意义的字母组成的,但是这些单词可以分成两个,或者多个有意义的部分。这些部分就叫语素。例如,unbreakable。这个单词可以分成三个部分,un 有不的意思,break 有分开的意思,able 有能够的意思。因此这三个部分就叫语素。
英文语素在句子里不能独立存在。也就是说,英文句子里找不到语素,语素只能在单词里找。可是,汉字在句子里是独立存在的,中文的句子就是汉字组成的。所以,所谓的中文语素和英文语素风马牛不相及,根本就不是一回事。

为什么会出现这种荒唐的事情?原因是语言学界把英文的单词和中文的词混为一谈(注2)。英文句子是单词组成的,中文句子是汉字组成的,语言学里,中文和英文单词对等的是汉字。英文 word 的正确翻译是字。
由于很多英文单词翻译成中文是一个词,例如 apple 翻译为苹果,是一个词。某些语言学家就以为英文 word 相当于中文的词。于是他们就把英文 word 翻译从字改为单词,再简化为词。这样英文的 word 就变成中文的词了。
这是一个以偏概全的错误,因为还有一些英文词组 phrase 的中文翻译是一个字。例如 last name,姓。我们不能因此把英文词组 phrase 翻译为字。文字代表的意义和句子的结构不是一码事。

把英文单词和中文词混为一谈导致 morpheme 翻译为词素(注3),中文的汉字也就变成词素了。可是,中文句子是汉字组成的,也就是说,中文句子里到处是词素,英文句子里却找不到一个词素。这个翻译显然逻辑不通。没有办法,他们就把词素改为语素,绕一个圈,这样你就不容易发现问题,发现问题也不容易说清楚了。
为了自圆其说,中国语言学界现在不承认中文的词是汉字组成的,这个小学生都知道的常识。《新华字典》词的解释是:在句子里能自由运用的最小语言单位,如人、马、水、商品、竞争等。这里汉字已经改名叫词了。
汉字不是词,英文单词也不是词。可是《现代汉语词典》单词的解释却是词(注4)。乡下的农民都知道,地瓜不是瓜,土豆不是豆,有的语言学家竟然不知道,单词不是词。

那么,到哪里去找中文的语素?英文语素只存在英文单词里。中文的语素只能到汉字里找,因为单词是英文的单位,汉字是中文的单位。
英文单词是字母组成的。组成一个单词的字母,如果分成几个部分,每个部分代表意思,这些部分就是语素。汉字是笔画组成的。组成一个汉字的笔画,如果分成几个部分,每个部分代表意思,这些部分就是中文的语素。这些部分也叫偏旁部首。

英文语素分为独立 free 语素,和不独立 bound 语素。独立语素单独写是一个单词,不独立语素单独写不是一个单词。例如 redo,undo 这两个单词。do 单独写仍然是一个单词,do 就是独立语素。re 和 un 单独写不是一个单词,它们就是不独立语素。不是所有的单词都能这样分,有的单词分开来不代表意思,这种单词就没有语素。例如 cat,dog。可以分成语素的单词,都是组合起来的单词 compound word。
中文偏旁部首也可以分为独立 free 偏旁部首,和不独立 bound 偏旁部首。独立的偏旁部首,例如,木字旁,虫字旁,女字旁,舟字旁,等等。这些偏旁部首单独写就是一个字,它们就是独立语素。不独立的偏旁部首,例如,提手旁扌,立刀旁刂,草字头艹,宝盖头宀,等等。这些偏旁部首单独写不是一个字,它们就是不独立语素。有的汉字是独体字,不能分。这些独体字没有语素,例如,日月。有的汉字是合体字,例如,明。合体字就是 compound word。

中文的偏旁部首和英文的 morpheme 的性质一模一样。如果说中文有 morpheme,那就是汉字的偏旁部首。


回到新概念语言学


  • 注1、【语素】名词,语言中最小的有意义的单位。汉语的语素绝大部分是单音节的,也有一些是多音节的,如“人、手、究、吗、疙瘩、逍遥、巧克力、奥林匹克”。有的语素能够单用,是成词语素,如“我、跑、高、琵琶”,有的语素不能单用,是不成词语素,如“翔、历、们、履”。在分析词的内部结构时,有的语法书把语素叫作词素。《现代汉语词典》第六版1591页
  • 注2、词 cí 在句子里能自由运用的最小语言单位,“人”、“马”、“水”、“商品”、“竞争”等。《新华字典》第十版71页
  • 注3、【词素】词的构成成分,是最小的音义结合体,词根、前缀、后缀都是词素。有的词只有一个词素,如“人、蜈蚣”等。有的词包含两个或者更多的词素,如“老虎”包含“老”和“虎”两个词素,“蜈蚣草”包含“蜈蚣”和“草”两个词素。“图书馆”包含“图”、“书”和“馆”三个词素。参看591页『语素』。《现代汉语词典》第六版212页
  • 注4、【单词】1、词(区别于“词组”)。《现代汉语词典》第六版253页 



Monday, September 11, 2017

中文的概念

中文的概念

概念是人类为了认识和表述世界,给世界万物起的名称。概念在人的大脑里,用中文写出来就是字和词,用英文写出来就是 word 和 phrase。
不少人可能以为中文和英文的概念是一样的,实际情况是,大多数都不一样。我们先谈中英文一样的概念,再谈中英文不一样的概念。

一,中英文一样的概念
中英文一样的概念,数量不多。例如:太阳,The Sun;孔子,Confucius。除了专有名词proper noun,还有音译的概念,中英文也是一样的。例如:豆腐,tofu;coffee,咖啡。
这里要注意,一个概念可以有多种表达方法。例如:番茄,西红柿,洋柿子,是同一个概念,它们都是tomato。

二,中英文不一样的概念
我们先谈中文比英文细致的概念,再谈英文比中文细致的概念。

1,中文比英文细致的概念
中文比英文细致的概念,数量也不多。例如:brother,中文分哥哥和弟弟。再例如:cousin英文一个概念,中文分为堂哥,堂弟,堂姐,堂妹,表哥,表弟,表姐,表妹,8个概念。在家庭和亲戚成员的称呼上,中文的概念划分比英文细致,因此中文表达比英文更准确。
我曾经和我的ESL老师,一个不懂中文的老外,讨论过 uncle 这个概念。我说中文的 uncle 不仅要根据和父亲和母亲的关系划分,父亲一方的 uncle 还要和父亲的年龄比较分长幼。这个老外想了好一会,最后他问了我一句话,有必要这样划分吗?我也答不出来。

中文概念划分比英文细致,也不仅仅是家庭成员,还有一些。例如:你,你们,老外就是一个you。大米,白饭,稻子,英文就是一个rice。老外竟然不分大米饭和稻子,你说可笑不可笑。蚕丝和绸缎,老外都是silk。这些概念如果你仔细解释,老外也能分得清,当然要麻烦一点。
有的就不一定了,例如中国人结婚分为嫁娶,英文就是一个marry,就算你解释再清楚,老外也未必能明白什么是嫁,什么是娶。

2,英文比中文细致的概念
上个世纪八十年代中国流行一本英文教材,新概念英语,里面有两个单词 continuously 和 continually,中文翻译只有一个,连续地。当时我分不清,后来明白了,不过到现在还是记不住哪一个是哪一个。
英文是两个概念,中文是一个概念,这种情况很多。例如,鳄鱼,英文有两个,crocodile和alligator,一种嘴尖,一种嘴圆。听,hear,listen。看,see,watch。要解释它们的区别,还挺麻烦的。

中文一个概念,英文是两个概念,有时候问题不大,有时候问题很大。例如:钱学森写文章说粮食亩产万斤是可能的。可能,英文有两个:possible 和 probable。possible是将来有可能;probable是很容易做到的可能。
如果钱学森说,亩产万斤是 possible,这句话完全正确;如果钱学森说,亩产万斤是 probable,则是错误的。我估计钱学森想说的是possible,毛主席理解的是 probable,阴错阳差,结果中国悲剧了。是钱学森说的不对,还是毛主席理解错误?看来都不是,只能怪中文把两个不同的概念混为一谈。如果使用英文的概念,可能就不会发生这种事。

概念相同还是不同,查英文解释英文的字典,立即见分晓。请注意,一定要查英文解释英文的字典;不能查英汉字典,也不能查汉英字典,这两种字典没有用。
还有一些概念不同,字典里差查不到,要到文法grammar里找。例如,英文的虚拟语气,中文就没有。英文可数名词的单数和复数是不同的概念,中文的名词基本上不分单复数,也就是说,中文常常把英文里的两个不同的概念混为一谈。详情可以参考我的文章《单数和复数》。

中文概念和英文概念不一样,中文翻译是一个重要的原因。例如:马克思主义的proletariat,中文翻译无产阶级,我们可能会以为农村的雇农是无产阶级。其实就是文革前中国工厂里的工人,也不是proletariat,那时候中国的工厂没有资本家,工人是领导阶级,是工厂的主人。现在的农民工倒是有点像马克思主义里的proletariat,但是我们不再使用无产阶级这个词了。
我这里谈的是翻译,不是政治。我再找几个和政治无关的例子。例如:bus,过去我们翻译为公共汽车,因为那时候城市里的公共交通都是这种汽车;其实大的企业也有bus,那可不是公共汽车。train,火车,早就不烧煤,没有火了。ship,轮船,早就没有轮子,改螺旋桨了。很多人以为,英文里有一个概念,只要翻译成中文,中文就有这个概念了。这是错误的观点。

中文概念和英文概念,差距很大。有人可能会问,其他文字的概念和英文差距大吗?答案是:不大。为什么会是这样?原因是,每个汉字都代表意义,中文没有的概念,用汉字无法准确翻译(意译)。换句话说,用汉字翻译的概念,都是错误的翻译,充其量只是错误的大小程度不同而已。
要想准确“翻译”一个没有的概念,一定要使用字母。请注意,这里“翻译”是打引号的。字母文字之间,碰到没有的概念,不是翻译translate,而是直接引用,或者转写transliterate。也就是说,只有字母文字才能吸收原汁原味地新概念。详情可以参考我的文章《闲谈翻译》。

有人说中国人的思维和老外,例如美国人,不一样,主要原因是我们使用的概念不一样。中国人逻辑思维常常出问题,主要原因也不在判断和推理,而在概念。因为充要条件,三段论,因果关系和相关关系,这些都可以学习。概念不同,使用中文没法学习。
概念是思维的基础。中文的概念不仅数量少,而且和世界上其他国家不一样。中国人要想增加概念,和世界同步,最好的方法就是使用汉语拼音。虽然我们这一代已经离不开汉字,但是,我们不能让我们的后代重蹈覆辙。现在就开始使用汉语拼音,要不了几十年,中国就可以过渡到字母文字。



参考:
闲谈翻译  http://hx.cnd.org/?p=150166
单数和复数  http://hx.cnd.org/?p=152575


Thursday, September 7, 2017

妄议AI

妄议AI


为什么是妄议?因为我不是 IT 理工男,没有资格谈 AI。这是我第一篇谈论 AI 的文章,可能也是最后一篇,姑妄听之吧。AI 英文是 Artificial Intelligence 的缩写,意思是人造的智慧。有人翻译为人工智能。这里智慧和智能是同义词。
前些日子,阿尔法围棋 AlphaGo 战胜人类顶级围棋手,再一次引爆了人工智能这个话题。很多智者杞人忧天,担心人工智能会不会统治人类。我,无知者无畏。我认为人工智能只是人类的一个工具,工具永远是人类控制的。人工智能不可能控制人类,至少现在一点可能性的影子都没有。

人类还没有完全进化为人类的时候,就开始创造和使用工具了。据说最早的工具是石器。我在博物馆看到过石器,当时感觉不怎么起眼。如果我说石器就是人工智能,可能有点过。因为我们通常把劳动分为体力劳动和脑力劳动。虽然体力劳动和脑力劳动是不可分的,一个人体力劳动时,也会使用大脑。一个人脑力劳动,也需要体力。我们一般还是认为石器提高的是体力劳动的效率。
石器发展到金属工具。简单工具发展到复杂的机械,也就是机器。没有动力的机器,发展到有动力的机器。上个世纪四十年代,情况发生了巨变,人类发明了计算机。计算机提高的肯定是脑力劳动的效率,这一点应该不会有争议。其实在计算机发明之前。人类已经发明了提高脑力劳动效率的机器。例如,我们中国人发明的算盘,外国人发明的计算尺,手摇计算器。不过我们现在差不多已经忘记这些东西了。

计算机极大地提高了脑力劳动的效率。例如圆周率,是一个无理数,无限不循环小数,四千年前,古埃及人和古巴比伦人算到小数点后一位小数。一千五百多年中国数学家祖冲之算到7位小数。十九世纪有人耗费数十年,乃至毕生距离算到了几百位小数。计算机现在可以算到数十万亿位小数。这个数字,人类不要说计算,就是数,也数不清。
计算机计算能力这么强大,但是,它们只会计算,不会思维。人类能思维,因为人类有大脑。电脑不是脑,电脑没有脑。人类有生命,有大脑能思维,有意识能感觉到快乐和痛苦。这一切,这些计算机都没有,因为计算机没有生命。
人工智能,说到底就是计算机,高级的计算机。再高级的计算机,仍然是机器,是工具。
机器人是机器,不是人,它们没有生命。人工智能是人造的智慧,是人的智慧放到机器上。计算机没有自我意识,计算机是按照人类设定的指令工作。

我们接着谈下棋。最简单的井字棋 Tic-tac-toe。棋盘有9个格子,变化少,人的大脑就可以穷尽其变化。双方只要不犯错误,结局一定是和棋。
国际象棋,棋盘有64个格子,变化多,不仅人类大脑不可能穷尽其变化,计算机现在也做不到。普通人下象棋,一般只计算两三步棋,据说象棋高手可算到10步棋。1997年 IBM 开发的深蓝 Deep Blue 可以算到12步棋,所以深蓝战胜了国际象棋的世界冠军,引起世界的轰动。

围棋,棋盘有361个格子,变化更多。二十年前,计算机还不能战胜职业围棋手。虽然摩尔定律已经失效,电脑的发展速度远远超过人脑的进化。现在阿尔法围棋已经战胜人类顶级围棋手。如果将来电脑可以穷尽围棋的变化,我想围棋的结局一定也是和棋。
人脑的计算能力是有极限的,就像人的体力有极限一样。人和机器比赛力量,例如人和汽车赛跑,早就没有意义。人和计算机比赛计算能力,同样毫无意义。只不过阿尔法围棋现在还是新鲜事,大家激动一下很快就会平复。

机器提高了人类体力劳动的效率,肯定会消灭艰苦的体力劳动。我猜想,机器最终会消灭体力劳动的阶级,也就是马克思说的工人阶级。计算机提高了人类脑力劳动的效率,也会消灭繁琐的脑力劳动。说不定将来也会消灭治人的劳心者阶级。到那时,劳动不再是谋生的手段,一个幽灵,共产主义幽灵,又会在世界游荡。奴隶社会也会复辟,奴隶主仍然是人类,奴隶不再是人类,而是人工智能。剥削制度依然存在,不过不再是人剥削人,而是人剥削人工智能。


回到新概念语言学

Wednesday, August 30, 2017

表意文字和表音文字

表意文字和表音文字

很多人把文字分为两大类,表意文字和表音文字。汉字是表意文字。其他国家使用的文字是表音文字。例如英文。表音文字也叫拼音文字。
表意文字,表音文字,这种划分方法荒谬。因为所有的文字都表意,人类创造文字的目的就是表意,世界上根本就没有不表意的文字。所有的文字也都可以读,从这个角度说,世界上所有的文字都是表音文字。

表意文字,表音文字,这种划分容易让人误解,以为表意文字不表音,表音文字不表意。实际情况是,不表意的英文,比表意的中文,表意更清楚。不表音的中文,比表音的英文,表音更简单。例如,英文的元音字母有很多种读音,汉字的多音字通常也就两个读音。说英文是表音文字,中文白话文是表意文字,纯粹是搞笑。
我查了一下,表意文字和表音文字,英文里没有对应的翻译。原因是逻辑不通,无法翻译。为什么中文会有这种荒谬的概念?一个重要的原因是,文字的定义出了问题。

文字《现代汉语词典》有三个解释。第一个解释是:记录语言的符号系统,如汉字、拉丁字母等。第二个解释是:指世界上各种书面语言。第三个解释和这个问题无关,这里不写了。表意文字和表音文字的文字,意思应该是第二个解释,世界上各种书面语言。可是,很多人使用了第一个解释,汉字和拉丁字母。
问题就出在这里,第一个解释是错误的。汉字是文字,汉字表意,这没有问题。但是,拉丁字母是字母,不是文字。把字母叫做文字是指鹿为马。英文和汉字对应的不是字母,而是单词 word。单词也表意。我们把汉字叫做表意文字,却不把单词叫做表意文字,没有道理。

如果你要比较汉字和字母,也可以。这时候它们的名称不是文字,而是符号,书写的符号。你可以说汉字是表意的符号,字母也可以算是表音的符号。严格地说,字母不是表音符号。因为表音符号要求一个符号只代表一个读音,一个读音只有一个符号。国际音标才是表音符号。英文读音有50个左右,英文字母只有26个,达不到表音符号的要求。
另外把使用字母的文字叫做拼音文字也有问题。拼音是一种注音方法。拼音来自古代的反切。反切就是用两个汉字,用前一个汉字的声母,用后一个汉字的韵母,相拼,读出一个音。例如,冬,都宗切。都的声母 d 音,和宗的韵母 ong 音,相拼,就是冬 dong。并不是所有的汉字都是两个声音相拼。例如一,日,乌,就是一个声音,不需要拼。英文里很多音也不拼。有的根本就没法拼。例如 it,us,元音在前,辅音在后,无法拼。还有日文假名是音节字母,也不需要拼。总之,拼音文字这个名字名不副实。

所有的文字都表意,所有的文字也都可以读,表意文字和表音文字是两个荒谬的概念。文字确实应该分为两大类。一类是使用了字母的文字,是高效率的文字。还有一类是没有使用字母的文字,我们喜欢说是历史悠久的文字,不愿意承认是原始落后的文字。



回到新概念语言学


Sunday, August 27, 2017

文字是口语的书面形式吗?

文字是口语的书面形式吗?

很多人认为文字是口语的书面形式。这是一个错误的认识。文字和口语是性质不同的两种语言。口头语言和书面语言。口语可以脱离文字存在,这很好理解,因为文字没有发明之前,口语就存在了。但是,中文是口语的书面形式吗?古时候,中国人,日本人,韩国人,朝鲜人,越南人,都使用文言文,文言文是哪一种口语的书面形式?现在,北京人,上海人,广东人,福建人,都使用白话文,白话文又是哪一种口语的书面形式?
还有,聋哑人没有口语,他们照样使用文字。对于聋哑人来说,文字是脱离口语存在的。如果你非要说文字是口语的书面形式,那么聋哑人说文字是手语的书面形式,你同意吗?
实际上,文字既不是口语的书面形式,也不是手语的书面形式。正确的说法应该是,口语,手语,书面语,是表达人类大脑思维的三种不同形式。


注: 口语,口头语,口头语言,是同义词。文字,书面语,书面语言,是同义词。


回到新概念语言学

Saturday, August 26, 2017

字典和词典

字典和词典

众所周知,中文有字典和词典,英文只有一个典  dictionary。英文 dictionary 应该翻译为字典,还是词典?字典收录的是字,词典收录的是词,英文 dictionary 收录的是 word。我们应该先搞清楚英文 word 相当于中文的字,还是词?
这个问题要从中英文的结构着手。一篇文章,不论是中文还是英文,从篇章段落到句子,结构都是一样的。除了标点符号,中文句子是汉字组成的,英文句子是 word 组成的。因此,英文 word 相当于中文的字。所以 dictionary 应该翻译为字典。

word 的正确翻译是字,以前也是这样翻译的。后来中国的语言学界创造了语素理论,也叫词素理论。为了配合这个不能自圆其说的理论,就把 word 的翻译改为单词。他们认为这样中文的词和英文的单词就能张冠李戴了,因为我们常常把单词缩略为词,这时候单词就变成词了。现在语言学界很多专家学者,语言学教授都是把中文的词,和英文的单词混为一谈的。
把 word 的翻译改为单词,不仅毫无道理,而且后患无穷。以至于至今中国语言学界都不知道中文的单位是字,还是词。他们一直在争论“字本位”和“词本位”(字是中文的基本单位,还是词是中文的基本单位的简称)。

中文句子是汉字组成的,英文句子是 word 组成的。word 是英文的单位,汉字是中文的单位,毋庸置疑。因为单位是看得见的。即使一个不懂英文的人,也能看出 the United States of America 是五个 word,五个单位。即使一个不懂中文的老外,也能看清楚“中华人民共和国”是七个字,七个单位。但是,哪怕你学富五车,即使你拿着放大镜,你也看不出“中华人民共和国”是几个词。因为词不是一个单位,所以词是数不清楚的,没有人知道中文有多少个词,就连计算机也只能望洋兴叹。一篇文章,计算机只能告诉你有多少个字,绝不会告诉你有多少个词。
可是语言学界不少人非要说词是中文的单位。我曾经给美国大学的一些语言学教授和汉学家写过电子邮件,告诉他们,词不是一个单位,词是一个组合。我也收到一些回复,他们都不直接回答我的问题,而是客气地解释一下语言学的理论。他们不同意我的观点,但是他们绝不直面我的观点。因为我的观点,词不是一个单位是一个事实 fact,无法否定。现在我把我的观点放到谷歌的 blogger 和 sites 上,让时间来检验吧。

为什么很多人会把单词和词混为一谈?因为中文一个词代表的意义,常常是英文一个单词代表的意义。例如,苹果是一个词,apple 是一个单词,于是这些人就以为,中文的词相当于英文的单词。他们不知道他们犯了以偏概全的错误。因为我可以找到相反的例子。例如,中文的姓,英文是 last name。难道我们能说中文的字相当于英文的 phrase 吗?显然不能。
还有的人可能会认为,中文的词代表一个概念,所以词是一个单位。英文的一个 phrase 也代表一个概念,例如 have to。但是,我们不能因为 have to 代表一个概念,就说 have to 是一个 word。have to 是一个 phrase,是两个 word,是两个单位。
同样的道理,我们不能因为“马上”代表一个概念,就说“马上”是一个单位。“马上”是一个词,这个词是两个字,是两个单位。总之,是不是一个单位和它们代表的意义无关,只和它们的形式,也就是它们的外观有关。

字典之所以称为典,是因为字典尽可能地收录所有的字,才有资格叫典。词典名不副实,因为绝大多数词,词典是不收录的。词典收录的词(词典词)是词义和字义不一致的词。词典词,英文也有。最常见的就是 phrasal verb。例如,break in,come across,give up,look out。只不过英文的词典词数量不多,远远少于 word 的数量,大家感觉英文的词典词都附在英文字典的 word 项下。
其实中文的词典词也是附在字的项下。但是,由于中文词典词的数量远远超过汉字,喧宾夺主,以至于中国语言学界有些人“忘记”中文里还有汉字,他们就把收录词典词数量较多的字典叫做词典了。词典的本质仍然是字典。词典是大型的字典,字典是小型的字典 pocket dictionary。


Monday, August 21, 2017

概念和意义

概念和意义

概念和意义都是我们大脑里思维的内容。概念和意义在我们的大脑里,看不见,摸不着。要想知道大脑里的概念和意义,只能通过语言 language,也就是口语,书面语,或者聋哑人使用的手语。通过口语或者手语讨论概念和意义,需要面对面交流。我们现在是通过书面语,也就是你读我写的文章,讨论大脑里的概念和意义。

概念是人类为了认识和表述世界,给世界万物起的名称。概念,写成中文就是字和词,写成英文就是 word 和 phrase。
中文句子是由汉字组成的,英文句子是由单词 word 组成的。汉字和单词就是组成句子的单位。语言学里称基本单位,或者最小单位,也常常简称为单位。中文的词,英文的 phrase 就是两个单位,或者多个单位。

根据单位的数量,我们把概念分为两类,独立概念和组合概念。
独立概念就是一个单位代表的概念,也就是中文的一个字,英文的一个 word 代表的概念。
组合概念就是多个单位代表的概念,也就是中文的多个字,英文的多个 word 代表的概念。或者说,中文的一个词,英文一个 phrase 代表的概念。

概念的着眼点在大脑里的思维,意义的着眼点在我们写的字 word 和词 phrase。可以说,字和词代表的意义就是概念。概念和意义,这两个词有时可以互换,甚至还可以说它们是同义词 synonyms。


回到新概念语言学

Saturday, August 19, 2017

为什么中文不支持科学理论?

为什么中文不支持科学理论?

科学理论是人类对世界理性认识的根据。科学理论起源于古希腊。科学理论是一个体系。这个体系由很多科学理论组成的。每一个科学理论都是杰出人才思维的成果。科学理论产生在他们的大脑里,我们看不见摸不着。他们必须用文字把科学理论写下来,才算是科学理论。不是所有的文字都能写科学理论。写科学理论的文字,最起码的要求是能清楚准确地表达大脑里思维的意思。

要想表达意思,文章一定要写成句子。不完整的句子,没有明确的意思。中国古代的文言文没有标点符号,不分句子。要读懂文言文,首先要会句读,就是给文言文划分句子。麻烦不说,一段文字可能有几种句读。例如著名的子曰,民可使由之不可使知之,就有好几种句读。孔子说这句话只有一个意思,我们却可以读出好几种意思,有些意思还是相反的意思。也就是说,我们不知道孔子说的话到底是什么意思。文言文要求读文章的人去句读,去揣测别人的意思。文言文表达意思不清楚不明确,所以使用文言文的人不可能创造科学理论。

一百多年前的新文化运动,白话文取代了文言文。白话文引进了标点符号,读白话文不再句读了,不过问题没有完全解决。人的思维是由概念组成的。概念是人类为了认识和表述世界,给世界万物起的名称。白话文用句子表达意思,那么组成句子的单位,代表的就是大脑里的概念。根据文字的形式,概念分为两类,独立概念和组合概念。
英文组成句子的单位是单词 word。一个单词就是一个单位。一个单词代表的概念就是独立概念。例如,英文 blue 就代表一个独立概念。sky 代表另外一个独立概念。英文 blue sky 是两个独立概念组成一个组合概念。组合概念就是两个单词,或者多个单词代表的概念。
中文组成句子的单位是汉字。一个汉字就是一个中文单位。一个汉字代表的概念就是独立概念。例如,我,你,他,红,黄,蓝,天,地,山,水,吃,喝,走,跑,这些单个汉字代表的概念都是独立概念。中文的词就是组合概念。例如,蓝天,白云。

由于一个汉字就是一个符号,而符号的数量是不能无限增加的,所以汉字的数量是有限的。因此,中文的独立概念也是有限的。随着社会的发展,大脑里需要的独立概念越来越多,汉字不够用了。中文就使用两个汉字(或者多个汉字)来代表独立概念。例如“马上”原来应该是一个独立概念,可是中文没有单个的汉字能代表这个独立概念,就用“马”和“上”这两个汉字来代表。这就带来了一个问题。看到“马上”这两个字,我们先要判断这两个字是一个组合概念,还是两个独立概念。也就是先判断“马上”是两个字,还是一个词。白话文刚不句读了,又开始词读了。
如果是两个字,我们要想到“马”和“上”这两个字的意思。如果是一个词,我们不仅要想到“马上”这个词的意思,同时还要忘掉“马”和“上”这两个汉字原来的意思。记住文字的意思很难,要忘记文字的意思更难,所以我们常常望文生义。除了“马上”,白话文里还有很多这种代表独立概念的词。例如,东西,熊猫,巧克力,等等等等。《现代汉语词典》收录了八万多个词,大多数都是这种独立概念的词,也就是需要词读的词。

独立概念的数量,或者说文字的单位的数量,是判断一种文字先进与落后的重要标准。中文的单位是汉字,中文独立概念的数量就是汉字的数量。根据《新华字典》汉字数量一万多一点。即使加上《现代汉语词典》八万多个词,中文代表的独立概念的数量也不到十万个。英文的单位是 word,英文独立概念的数量就是 word 的数量。我现在使用的英文字典有三十多万个词条 entry,加上名词的单复数形式,名词变形容词,形容词变副词,动词的 ing 和 ed 形式,英文 word 的数量远远超过一百万个。也就是说,英文的单位有一百多万个。
文字的单位的数量好比数码相机的像素,像素越多,照片越清晰。文字的单位的数量越多,表达越准确。英文的单位的数量超过一百万,并且还在不断地增加。中文的单位的数量才一万多个。原因是中文的单位是一个单独的符号。符号的数量是不能持续增加的,所以中文的单位的数量不可持续发展。为了发展,现代文字都使用字母组成单位,根据排列组合计算,几十个字母可以组成天文数字的单位。这就是字母文字比汉字先进的关键。

作为交流的工具,中文过去要句读,现在要词读。句读和词读,本质是效率低下。还有中文的单位,数量太少,达不到清楚表达科学理论的要求。因此只使用汉字的人不仅不能创造科学理论,也不能很好地理解科学理论,尤其是复杂的科学理论。这就是中国古代没有科学理论,现代中国人科学素养差的原因。根子就在中文不支持科学理论。



回到新概念语言学

Friday, August 18, 2017

日文和中文

日文和中文

众所周知,日本汉字源自中国,不少国人以此为傲。古时候日本没有文字。一千多年前,日本人学习了中国的文言文。日本人读文言文汉字有两种方法。第一种是按照汉语发音读汉字,叫文读。文读对日本人来说就是读外文。学过外文的人都知道,读外文不容易,因为说话发音是一种习惯,而改变一个人的习惯很难。第二种是按照日语发音读汉字,叫音读。音读容易得多,于是音读在日本就流行起来。

音读流行后,日本就出现了万叶假名。万叶假名就是几百个汉字,这些汉字不是代表意义,而是代表日语说话的声音。日本人使用这几百个汉字写文章,这些文章的性质和我们现在的白话文一样。也就是说,日文一千多年前就发展到我们现在的白话文阶段。然后日本人又进一步文字改革,合并同音字,简化汉字,创造了假名,日文开始走世界文字共同的拼音方向。

中国三千多年前有了汉字。到了唐朝,僧侣在传教的过程中,发现文言文很难翻译印度传来的佛经。即使翻译出来,老百姓也听不懂。于是创造了变文。变文的性质和万叶假名一样。汉字不再代表意义,而是代表说话的声音。变文的本质就是白话文。也就是说,一千多年前,中国也创造了白话文。

由于朝廷更迭,中国的白话文没有持续发展。元朝,中国的官方文字是蒙古文。明朝,中国恢复使用汉字。清朝,中国的官方文字是满文。满文从蒙古文发展而来,是比汉字先进的拼音文字。民国成立后,中国放弃满文,再次使用汉字。这一次使用的是白话文。
中国历史上曾经两次使用拼音文字,由于朝廷更迭,功亏一篑。中文饶了一圈,又回到唐朝开始的变文。走世界文字共同的拼音方向,中文浪费了一千多年的时间,至今我们还在摸石头过河。

一千多年前,日文汉字源自中文,我们以此为傲。一千多年后,日文已经是拼音文字,中文还在原地踏步,有人居然还在以此为傲。



回到新概念语言学


Wednesday, August 16, 2017

举例说明和以偏概全

举例说明和以偏概全

举例说明是举一个,或者几个例子来说服别人相信你。例子通常是已经发生过的,或者已经存在的事物。不论是创造一个理论,或者发表一个观点,还是提出一个命题,如果希望别人相信你,你就要证明。
证明一个理论,一个观点正确,或者证明一个命题为真,仅仅举例是不够的,除非这个命题非常简单。例如,我说我们班上的同学这次考试都及格了。我们班有28个人,张三80分,李四90分,我公布了每一个人的成绩,总共举了28个例子。这种举例方法可以证明我说的是真的。这是穷举法。不过同学一多,穷举法就行不通了。

有时候要想证明一个问题很麻烦。例如,我说天下乌鸦都是黑的。我拿出一只黑乌鸦证明,你可以说我是孤证。我拿出很多只黑乌鸦证明,你可以说我以偏概全。因为我不可能把天下所有的乌鸦都拿来。
反过来,要想证明我的说法是错误的,你只要拿出一只不是黑色的乌鸦,例如你拿出一只白乌鸦,就足以证明我的说法是错误的。我不能说你是孤证,也不能说你以偏概全。
如果你找不到一只不是黑色的乌鸦,你就不能说我以偏概全,因为你没有根据。这时候“天下乌鸦都是黑的”这种说法只能算是一种假说。

我们在证明数学和几何题的时候,也是一样的。举例不是证明,一定要有严谨的证明。但是一个相反的例子就可以证明这道题是错误的。下面总结一下:
1、要想证明一个命题为真,一定要有严谨的证明。举例远远不够,除非你能穷尽所有的例子。
2、要想证明一个命题为假,只要能找到一个相反的例子就够了。

以偏概全是人们经常犯的一种逻辑推理错误。指出别人以偏概全,最好的办法就是找出一个相反的例子。一个就足够了,别人不能说你以偏概全。



回到新概念语言学

人类语言会统一吗?

人类语言会统一吗?

语言 language 是人类交流和思维的工具。人类语言有三大类:聋哑人的手语,普通人的口语,和书面语。语言是交流的工具,也是交流的结果。两个聋哑人交流,一定要打一样的手语。两个普通人交流,一定要说一样的口语,写一样的书面语。否则就无法交流。
语言有一个特点叫任意性,是指一个意义和代表这个意义的语言形式之间没有自然或必然的联系。所以不交流的人群说不同的口语,写不同的文字,打不同的手语。现在世界上口语被划分为几千种,文字至少也有几百种,手语的数量比较难统计。这么多种的语言是因为高山大海的分隔,不同地方的人无法交流形成的。

只要交流,就一定要使用同一种语言。也就是说,如果全世界的人能交流,那么语言就一定会统一。原因是统一的语言可以提高交流的效率,符合最省力原则 The principle of least effort。最省力原则就是用最小的代价达到目的。
书面语统一比较容易,中国两千多年前秦始皇就书同文了。后来三国演义南北朝,即使是元朝,清朝,中国都是使用同一种文字。元朝中国的官方文字是蒙古文,清朝中国的官方文字是满文。现在互联网出现,全世界的人有了交流的条件,所以书面语一定会最早统一。

随着交通的发展,广播电视的出现,现在世界上口语的数量越来越少。例如中国的普通话逐渐普及,方言正在消亡。方言多的原因是文盲多。随着教育的普及,口语会逐步统一,因为书面语是口语的标准。
只要书面语统一,口语最终一定会统一,因为识字的人说话是以书面语为标准。手语也一样,聋哑人使用和普通人一样的文字,只是手语的形式和口语不一样。

总之,语言不仅是交流的工具,也是交流的结果。只要全世界的人有交流,随着交流越来越广泛,人类语言最终一定会统一。



回到新概念语言学

中国能超越美国吗?

中国能超越美国吗?

2010年中国 GDP 总量超越日本,成为世界第二大经济体。很多专家学者都在预测中国 GDP 总量什么时候超越美国。按照中国现在的发展速度,可以说这一天指日可待。不过 GDP 总量超越美国,对中国没有什么意义。因为有人换算过,清朝 GDP 总量曾经世界第一,可是清朝是世界上落后的国家。
我估计等中国 GDP 总量超过美国时,就没有人再念叨 GDP 这个字母词了。就像大跃进时期,全国人民都希望中国的钢铁产量能超英赶美。改革开放后,中国进口了几套炼钢设备,中国的钢铁产量不是超英赶美,而是超越了全世界钢铁产量的总和,可是没有人再提大炼钢铁超英赶美这个茬了。

中国 GDP 总量超越美国,不等于中国成为世界老大。中国要想全面超越美国,成为世界强国,目前根本不可能,因为目前在科学领域我们还无法超越西方。科学先进是强国的必要条件。科学不先进,一个国家不可能强大。
为什么中国科学不可能超越西方?因为我们培养不出杰出(科学)人才。这不是我说的,是钱学森说的。为什么我们培养不出杰出人才?因为我们的教育落后。

为什么我们的教育落后?原因可能很多,其中一个是我们没有使用先进的文字。先进的文字是使用了字母的文字,也叫拼音文字。不使用拼音文字,不仅不能创造科学理论,连理解复杂一点的,别人已经创造出来的科学理论都困难。
如果你不相信我的话,你只要找一本科技书籍,例如一本计算机编程的英文书,再找一本中文版,这种书在中国的书店很容易买到,比较一下,你就知道中文和英文的差距了。

科学水平是判断一个国家先进与落后的重要的标准。中国的文字不现代化,我们就培养不出杰出科学人才,中国的科学就只能跟在发达国家的后面发展。我们现在的成就是改革开放的结果,改革就是改为市场经济,开放就是学习西方科技。科学上中国现在还不能自力更生。
不论中国经济上如何发展,政治上怎么改革,制造再多产品都没有用,因为我们的杰出人才要靠别人培养。不使用先进的文字,不搞好教育,中国就不可能全面超越美国。



回到新概念语言学

Monday, August 14, 2017

语言和方言

语言和方言

语言和方言都是指人类的口语。口语是人类面对面交流的结果。除了聋哑人,人人都会说话,因此每个地方,再偏僻的地方,只要有人,都有口语。方言是指非主流群体,尤其是小地方的人说的口语。
中国除了普通话有很多方言,例如广东话,福建话,等等等等。为什么中国会有这么多方言?原因是中国地方大,过去交通不便,各地方的人不来往,各地的人就说不同的口语,这些口语就叫方言。

欧洲的面积和中国差不多,各地的人也说不同的口语,可是他们不同的口语不叫方言,而是叫不同的语言。原因是欧洲各地的口语都有各自的书面语言(文字)。有文字作为标准的口语,通常被认为和文字是同一种语言。例如英语和英文都叫 English。所以欧洲不同的口语叫做不同的语言。
中国有统一的文字,中国说各种方言的人使用同一种书面语言(文字)。因此中国不同的口语不能叫做不同的语言,只能叫做不同的方言。
从这里可以看出,欧洲不同的口语叫不同的语言,是因为他们使用不同的书面语言。中国不同的口语叫不同的方言,是因为我们使用统一的书面语言(文字)。我们也可以认为,方言是因为没有自己独立的书面语言。或者说,方言使用了主流群体使用的书面语言。

美国的面积和中国也差不多,美国也使用统一的文字,可是美国几乎没有方言。美国的东岸和西岸,南方和北方,口语差别也没有中国那么大。这是为什么?
口语有两种,一种有文字作为标准,一种没有文字作为标准。口语是约定成俗的,因为说话的声音说完就消失,所以口语没有固定的标准。由于任意性(语言的特点),没有文字作为标准的口语很容易变化。只要不交流,时间长了,一种口语也会分成不同的口语。因此世界上文盲多的地区,口语差别特别大。
由于文字是固定的,可以保存,有文字作为标准的口语不容易变化。美国因为使用一种文字,加上美国一百年前就普及初等教育了,美国的文盲很少,所以美国的口语基本一致。

美国使用一种文字,几乎没有方言。中国两千年前就书同文了,为什么中国还有这么多的方言?第一,中国过去有大量的文盲,中国有文字和没文字差不多。第二,中国过去使用的是文言文。文言文,言文不一致,文言文不是口语的标准。所以中国过去有很多方言。
白话文勉强可以算是口语的标准。白话文运动后,中国教育开始普及。现在中国的方言正在逐步减少。如果中国偏远地区也能不折不扣地落实义务教育,中国再使用高效率的文字,汉语拼音,中国很快就会像美国一样统一全国的语言。

最后顺便说一下,方言不是什么文化。方言只是一种交流工具,非主流的交流工具,人类即将淘汰的交流工具。在历史的长河中,人类淘汰了无数的方言。如果有人想保护现在的方言,最好的方法就是把它们放到历史博物馆里,而不是号召大家学习使用方言。鼓励学习使用方言是开历史倒车。


回到新概念语言学


Sunday, August 13, 2017

自古以来 -- 中国逻辑(八)

自古以来 -- 中国逻辑(八)

某某地方自古以来就是我国的领土,这句话是捍卫我国领土一种常见的表达方法。
自古以来的意思是从古至今,从古代某一个时间一直到今天。例如,我们说钓鱼岛自古以来就是中国的领土。不过这个表达并不准确。因为甲午战争失败后,满清政府签订《马关条约》把台湾和澎湖列岛以及钓鱼岛割让给日本。二战日本失败后,根据《开罗宣言》和《波茨坦公告》这些岛屿才回归中国。钓鱼岛是中国的领土,毋庸置疑。不过不是自古以来,而是有一段时间的间断。

再例如,我们不能说海参崴自古以来就是中国的领土,因为海参崴现在已经不是我们的领土。我们可以说,海参崴曾经是我们的领土。
使用自古以来这个词要注意。目前不是我国控制的领土不宜使用,因为只是自古,不是以来。我国现有的领土不需要使用,这时候使用自古以来是啰嗦,多此一举。


回到新概念语言学

语言和文字 -- 中国逻辑(七)

语言和文字 -- 中国逻辑(七)

语言,原来的意思是指人类说的话,现在还有英文 language 的意思。文字,最早的意思是指汉字,现在也包括各国使用的文字。
语言和文字是语言学研究的对象,可是中国的语言学教授说不清楚什么是语言。不信你去问问他们,文字是不是语言?保证他们说不清楚。即使他们口若悬河,你肯定还是听不懂他们说什么。

语言和文字,在中文里是并列的,它们是不同的东西。可是中国的语言学教授又说,文字也是一种语言,叫书面语言。
最不可思议的是,你想表达“语言和文字”这两个概念时,只需要说“语言”这一个词就够了,因为“语言”包括了“文字”。如果你说“语言和文字”,“文字”二字画蛇添足,啰嗦。
当你想表达“语言”,也就是口语这一个概念时,不能只说“语言”这一个词,因为“语言”还包括“文字”。你必须说是“语言和文字”的“语言”,只有当“语言和文字”在一起的时候,“语言”才是口语的意思。

造成这种混乱的原因是中文没有 language 这个概念,有人把 language 翻译为语言。语言的意思是指人类说的话。language 的意思不仅仅是说话,还包括书面语,也就是文字,以及聋哑人的手语。
把 language 和“语言”这两个不同的概念混为一谈,是中国语言学教授说不清楚什么是语言的根本原因。



回到新概念语言学

Saturday, August 5, 2017

充要条件 -- 中国逻辑(六)

充要条件 -- 中国逻辑(六)

充要条件是一个常用的逻辑思维方法。这个方法来自英文 sufficient and necessary condition。充要条件分开来就是充分条件和必要条件。必要条件很好理解,必要的条件,必不可少的条件,绝大多数人都能理解。但是,充分条件,什么是充分的条件?字面上无法理解。这是很多人不会使用充分条件这个概念来思维的重要原因。下面举一个例子来说明。

世界上的国家可以分为两大类:发达国家和落后国家,说好听一点叫发展中国家。每个落后国家的落后原因可能有很多,有的原因也可能不一样。人类使用的文字也可以分为两大类:先进的和落后的。先进的文字是使用字母的文字,也叫拼音文字。落后的文字是不使用字母的文字,例如汉字。
我说,使用拼音文字是发达国家的必要条件。事实也是如此,世界上没有一个发达国家不使用拼音文字。中国没有使用拼音文字,所以中国不是发达国家。
我说的是事实。可是很多人不顾事实,而且还能“理直气壮”地反驳我。你说使用拼音文字是发达国家的必要条件,为什么很多使用拼音文字的国家都是落后国家,例如非洲国家,印度,菲律宾等等。
如果你认为这些人说的有道理,说明你也不懂充分条件,如果懂,你就不会同意他们的观点。

充分条件的充分,英文是 sufficient,原意是足够的。充分条件的意思是,足以保证达到某一个目标的条件。使用拼音文字是成为发达国家必不可少的条件。但是使用拼音文字不能保证一个国家一定成为发达国家,因为要成为发达国家还有其他条件。所以拼音文字不是充分条件。
这么简单的道理,很多人就是想不明白。其中一个原因是充分条件没有充分的意思,这个翻译害死人,导致中国很多人不懂充分条件。和不懂充分条件的人是无法辩论问题的,因为他们不知道他们使用的是中国逻辑,也就是不讲理。

白马非马 -- 中国逻辑(五)

白马非马 -- 中国逻辑(五)

白马非马,有的人认为是中国古代伟大的逻辑学家公孙龙提出的一个著名的逻辑问题。
大家都知道,任何一匹马都是有颜色的。一匹马,不论是什么颜色,都是马,所以白颜色的马仍然是马。白马非马,逻辑不通。

白马非马,不能翻译成英文,没有人会说 A white horse is not a horse,只有中文才能产生这种逻辑不通的思维。
白马非马不是一个逻辑问题,而是一个中文不支持逻辑思维的例子。公孙龙也不是什么逻辑学家,而是一个没有逻辑思维的人。



回到新概念语言学

Thursday, August 3, 2017

高考的价值

高考的价值

20年前考上大学是考上一个铁饭碗,对农村人来说还有城市户口,对城市人来说还有干部身份,所以很多人把高考和科举相提并论。现在的大学毕业生,国家不包分配,随着城乡二元户籍制度逐步退出历史舞台,高考已经贬值了。
目前高考的价值就是上了一个好大学,赚了一点学费的差价。有钱的人根本不在乎这点钱,他们的子弟可以直接到外国留学,上更好的大学。高考就是一块鸡肋。



回到新概念语言学

高考公平吗?

高考公平吗?

有人说中国高考最公平,是寒门子弟出人头地的唯一出路。所谓的人人平等是指政治上平等,和寒门子弟无关出人头地无关。过去,尤其是文革期间,因家庭出身受歧视的,不仅仅是黑五类,也就是地富反坏右的子女,还有资本家,小商小贩,职员,知识分子,以及走资本主义道路当权派的子女。恢复高考的时候,对社会影响最大的不是什么寒门子弟,而是这些出身不好的人。77年恢复高考,79年中央给地主富农摘帽,宣布不得歧视他们的子女,高考从此不再考虑家庭出身。摘帽决定带来的政治平等,高考得到了最公平的好名声。

所谓的寒门子弟通常是指来自农村的大学生。和来自城市的大学生相比,他们算是寒门子弟。在农村,他们中的大多数又不能算是寒门子弟。真正的寒门子弟,“贫下中农”子弟的大学生比例,远远低于农村干部,教师,医生,供销社的职工等家庭经济条件比较好的子弟。

政治上应该人人平等,经济上无法做到,至少目前还做不到。穷人和富人,不论是城市还是农村,都是实实在在存在的。他们子女的教育也不可能平等。如果大学也能义务教育,那才是平等。现在保证中国每一个孩子,尤其是每一个寒门子弟,都得到完整的义务教育,就算是平等。如果连农民工子弟的义务教育都不能保证,让再多的寒门子弟进北大清华,也不是平等。

高考公平吗?张铁生就认为不公平。供需不平衡,大概除了抓阄,没有公平。



回到新概念语言学

为什么美国没有高考

为什么美国没有高考?

高考的全称是普通高等学校招生全国统一考试。美国肯定没有高考。有人说 SAT 就是美国的高考。错!SAT 和高考有本质的不同。
SAT 是评估高中生的水平。高考和考生水平无关。高考的目的,过去是决定你能不能上大学,现在是决定你上好大学,还是上差大学。高考是一考定终身,今年高考的分数明年不能用。SAT 可以多次考,直到你考出满意的分数,当然每次考试都要交钱。美国 SAT 是一家非盈利私人公司,和招生无关。中国高考是政府主持的招生工作。

高考是计划经济的产物。要上大学的人多,大学招生的人数少,供需不平衡,就用统一考试,或者群众推荐,领导批准等方法来解决。
美国是市场经济,供需矛盾通常是用经济杠杆来解决。大学招生数量不能满足需求,办大学就有利可图,投资就会转向办大学,供需矛盾随之而解。改革开放以后,中国也搞市场经济,现在中国已经基本解决大学招生数量供给不足的矛盾。目前的矛盾是上好大学,还是上普通大学。

美国也有上好大学和上普通大学的矛盾,他们仍然是用经济杠杆来解决。美国大学分公立和私立。美国联邦政府(相当于中国的中央政府)是不管教育的。大多数州(相当于中国的省)只办一所公立大学 university,根据人口办若干分校。每一个县(相当于中国的市)只办一所社区学院 college。
由于州立大学各分校,条件大体一样,学生就没有必要用高考来争好学校了。想上名牌大学,你就多花钱,当然前提是名牌大学也要你。美国名牌大学大多数是私立大学,学费比公立大学高不少。公立大学由于有地方政府的资助,本地区居民学费比较便宜,社区学院的学费更便宜。
美国公立的中小学是地方政府管理的,虽然各地中小学的条件可能有一定的差距,但是一个地区的公立中小学,条件都差不多,所以美国也没有中考和小升初的考试。你想让你的孩子上条件好的私立学校,交学费就行。美国中小学教育是免费的。
高考不是教育,高考是排队,排队争取上大学,上好大学的机会。高考导致了应试教育,应试教育不仅浪费学生复习迎考的时间,还导致中国学生死记硬背,影响了学习的兴趣和探索精神,为中国很多有识之士诟病。
文革后拨乱反正,高考曾经发挥过一定的积极作用。高考就像三年困难时期发的粮票,经济好转了,就应该取消。现在高考是有百害而无一益。为了改变中国的应试教育,提高教育质量,教育部要解放思想,争取尽早取消高考。

条件不一的公立学校是应试教育的温床。办少量条件好的公立学校,对大多数学生不公平。办好所有的公立学校,是取消高考的前提。不要搞面子工程。中国现在还不具备办世界一流大学的条件。不具备条件,政府出多少钱都没有用。条件具备了,政府不出钱照样办,美国的一流大学都是私立的。如果有人说他能办世界一流大学,这个人十有八九是在忽悠政府的钱。最好的办法就是请他像私立大学一样自己去筹钱。

取消高考说起来容易,做起来难。办一样的公立大学很容易,只要一改校名,中国的大学就都是985和211。但是办私立的名牌大学,还有中国的 SAT,任重而道远。
改革在中国很难。当年邓小平恢复高考,第一次也没有成功。虽然让中国的中小学生脱离应试教育是当务之急,但是取消高考,可能还要等到下一个邓小平出现。



回到新概念语言学

Tuesday, August 1, 2017

可能不可能 -- 中国逻辑(四)

可能不可能 -- 中国逻辑(四)

大跃进时期,钱学森说粮食亩产万斤是可能的。很多人至今还在批评钱学森这个观点。钱学森这句话错了吗?有人敢说粮食亩产万斤是不可能的吗?肯定没有,除非这个人逻辑思维有问题。钱学森这句话对吗?感觉好像还是有点问题,但是我们又说不出哪儿不对。

粮食亩产万斤没有可能吗?将来肯定有可能,只是现在还不可能。问题就出在这里。钱学森这句话如果用使用英文,就没有这个问题了。
如果说,粮食亩产万斤是 possible,完全正确,因为将来确实有可能。
如果说,粮食亩产万斤是 probable,就是胡说八道了,因为目前还不可能。

中文“可能”是一个概念,英文是两个:一个是将来有可能,另外一个是现在就有可能。钱学森说的是第一个可能,很多人理解的是第二个可能。中文把两个不同的概念混为一谈,其后果已经不仅仅是一个逻辑错误,而是一场灾难了。中文这种粗糙的概念,不是加上一个数量词就能解决的,而是必须文字改革了。



回到新概念语言学

Monday, July 31, 2017

是不是 -- (中国逻辑三)

是不是 -- (中国逻辑三)

你的因为不所以,是错误的逻辑,不过这种错误不是所有的中国人都会犯。今天就来谈一个所有中国人都会犯的逻辑错误,下面是一个例子。

数学里,如果 A = B,那么 B = A。用文字写出来就是:如果 A 是 B,那么 B 也就是 A。这是毋庸置疑的,全世界都适用,但是中文里不完全适用。例如,张三是老师,老师却不是张三。有的人把这种现象当作逆否命题,这是错误的。这种错误是由于中文概念划分不够细致引起的逻辑错误。
英文就不会出现这种错误。因为老师这个概念,英文划分比较细,是三个概念:teacher,a teacher,teachers。a teacher,teachers是指具体的一个老师,或者多个老师。teacher是指老师这个职业,或者工作。英文里如果你说“张三是 teacher”,是错误的。必须说“张三是 a teacher”,因为张三是具体的人。a teacher 和 teacher 是不同的概念。中文把这两种概念混为一谈,是这种逻辑错误的原因。

概念是逻辑推理的基础。中文概念划分不细致引起的逻辑错误不太容易发现,因为日常生活我们对概念的精确度要求不高。例如苹果,你吃了一个苹果,你说你吃了一个水果,问题不大。但是如果植物学家说,水果是一种乔木的果实。那就差之毫厘谬之千里了。
一般来说,概念划分的越细致表达越准确。中文概念的划分只能满足日常生活一般的要求,不能满足对概念精确度要求高的工作,例如创造科学理论。所以中国古代没有科学,即使现在中国的科技人员也必须学习外文,否则就不是“杰出人才”。

我说中文概念划分粗糙导致逻辑错误,肯定有人不同意,不就是漏了一个数量词吗,值得这么大惊小怪吗,加上一个不就得了吗。这个例子确实可以看成是省略了数量词引起的错误,加上一个数量词就能解决问题。不过还有加不上的,我将在《中国逻辑(四)》介绍。



回到新概念语言学

Sunday, July 30, 2017

引经据典 -- 中国逻辑(二)

引经据典 -- 中国逻辑(二)

引经据典就是引用四书五经里的话,根据经典著作里的内容,做出结论。引经据典通常是形容一个人知识渊博,说话有根据。引经据典是我们的传统。老夫子写文章开头总是子曰。文革时,我们说话开头必须伟大领袖毛主席教导我们说。现在不少人在网上发帖,开头喜欢某名人怎么说,某洋人如何说,显得他们旁征博引。至于那些人说对不对,他们可能从来就没有认真想一想。

做几何题的时候,除了公理,使用任何一个公式都要先证明这个公式是正确的,否则答案就可能错误。引经据典的时候也一定要先判断这些经典正确无误,否则根据这些经典得出的结论是否正确只能听天由命了。
一个正确的观点,不是因为某名人说过才正确。正确的观点本身就是正确的,不需要有个名人来背书。如果你的观点要靠某名人的话来证明,只能证明你对自己的观点没有信心。引经据典表面上是褒义词,它的同义词是人云亦云。

我并不反对引经据典,写文章引经据典可以增加说服力,但是经典不是论证的依据。如果你一定要拿你引的经,据的典作为依据,那你必须先证明这些经典是正确的。
引经据典得来的观点不一定全是错的,但是这种逻辑思维方法是错误的。说到底,引经据典这种逻辑思维方法仍然是你的因为不所以。



回到新概念语言学

Tuesday, July 25, 2017

你的因为不所以 -- 中国逻辑(一)

你的因为不所以 -- 中国逻辑(一)

鲁迅说汉字是中国落后的原因,具体的理由这里就省略了。有个热爱中华文化的人认为鲁迅这个观点是错误的。他说满清的闭关锁国以及几千年的封建思想束缚了中国人的思想导致中国落后,所以汉字不是中国落后的原因。

在中国,很多人都认为这个人说得有道理。不过你看了下面我编造的故事,或许会改变看法。
一个人到医院去看病。医生说他右腿有一个疮,这个人不同意。他说因为他左腿有一个疮,所以他右腿的疮不是疮。

用这种方法批评鲁迅的人逻辑思维都有问题。他们不知道,即使闭关锁国和封建思想是中国落后的原因,也不能证明汉字不是中国落后的原因。和这种人是无法讲理的。中国有很多这样的人。他们在网上“理直气壮”,他们不知道他们不讲理。



回到新概念语言学

Saturday, July 15, 2017

中国科学落后的原因 -- 内因和外因

中国科学落后的原因 -- 内因和外因

内因是事物变化发展的内在根据。内因是事物存在的基础,是一事物区别于他事物的内在本质。外因是事物变化发展的外在原因,即一事物和他事物的互相联系和互相影响。外因只是事物变化发展的条件,外因只有通过内因才能起作用,外因不能改变事物的根本性质和发展的基本方向。所以,内因是第一位的原因,外因是第二位的原因。要重视内因对事物变化发展的决定作用,同时不能忽视外因队事物发展的影响。

中国科学落后,毋庸置疑。希望中国科学先进是每一个中国人的梦想;找到中国科学落后的原因是每一个爱国的人的愿望。但是,什么是中国科学落后的原因,现在仍然众说纷纭。
从封建主义的思想到现在的社会制度;从古代的科举,到现在的高考;从满清的闭关锁国,到帝国主义的封锁,不胜枚举。居然还有人说是因为中国的地理环境不好。最冤枉的是孔老二,都死了两千多年,现在绝大多数中国人也看不懂论语,却非要往他身上赖,就是因为他不能辟谣。中国在美国办了那么多孔子学院,也没有听说美国的科学落后。真是睡不着觉怪床歪。

退一步说,即使这些不着调的原因也算是原因,也只能是外因,不是内因。曾经的伟大领袖毛主席教导我们说,“唯物辩证法认为外因是变化的条件,内因是变化的根据,外因通过内因而起作用。鸡蛋因得适当的温度而变化为鸡子,但温度不能使石头变为鸡子,因为二者的根据是不同的。”所以即使找到这些外因也不能解决问题。找不到内因,找到多少外因都没有用。找不到内因,中国科学落后的状况永远不会改变。

什么是中国科学落后的内因?首先要知道什么是科学。科学是一个体系,一个个科学理论组成了这个体系。创造一个个科学理论是科学体系的基础。由于我们创造不出科学理论,只能学习别人创造的科学理论,所以中国科学落后。

为什么我们创造不出科学理论?道理很简单,因为我们的大脑想不出来。不是我们的大脑和外国人有什么不同,而是我们使用的思维工具,也就是文字和外国人不一样,导致我们和外国人思维不同。准确地说是只使用汉字思维的人创造不出科学理论。

为什么只使用汉字思维的人创造不出科学理论?或者说,为什么使用拼音文字的人有可能创造科学理论?这个问题比较复杂,不是这篇短文能说清楚的。我另有专文介绍。我这里只打个比方来说明。
现在大家都使用电脑,电脑里有操作系统和应用软件。最常见的操作系统是微软的视窗,应用软件就是各种 app。文字就好比操作系统;科学理论就好比一个个 app。现在中文这个操作系统不支持科学理论这个 app。所以我们使用中文创造不出科学理论。因此中国古代没有科学理论。
一百多年前,新文化运动引进了德先生和赛先生。赛先生就是科学理论。由于中文不支持科学理论,现在中国人的科学素养普遍不高,在中国搞科学的人必须学外文,这是我们中国人的悲哀。

中文落后,或者说,汉字落后导致中国科学落后,这不是我的发现。这是中国打开国门后所有出国留洋的先贤们的共识。鲁迅先生急得说,汉字不灭中国必亡。很多人现在仍然无动于衷。最可恨的是有些遗老遗少打着弘扬中华文化的幌子,反对文字改革,污蔑中国现代化是西化。还有一些公知到处找外因,忽悠中国老百姓。

大脑以外的原因都是外因。无论你找多少外因都不能解决问题。外因只是事物变化发展的条件,外因只有通过内因才能起作用,外因不能改变事物的根本性质和发展的基本方向。
创造科学理论要靠大脑思维,你大脑想不出来,脑袋瓜上涂多少清凉油都没有用。不文字改革,或者说不使用汉语拼音,中国的科学永远落后。



回到新概念语言学


Wednesday, July 12, 2017

张维迎的错误观点(二)

张维迎的错误观点(二)

在北大国家发展研究院2017年毕业典礼上,张维迎教授谈到中国人创造力的时候说“创造力依赖于自由!思想的自由和行动的自由。”张维迎这句话是错误的,或者说逻辑不通。

首先,一个人的思想自由,别人是无法限制的。也就是说,我们不能向任何人要求思想自由,因为没有人限制你的思想,也没有人能限制你的思想。你没有创造力,不是因为别人限制你,而是因为你根本就没有。

有的人把不准公开发表政治观点,没有言论自由,当作不准思想。这是概念混乱。言论自由和思想自由,风马牛不相及。如果张维迎是要求言论自由,这件事并没有错,但是他不能打着创造力的幌子,这会严重误导这批大学毕业生,以为中国人缺少创造力是因为没有自由,导致他们不去寻找真正的原因。(中国人缺少创造力另有原因,我有专文讨论,这里不赘述。)现在张维迎是要求思想自由,则是“无理取闹”了。

限制一个人行动的自由,最大的限制是坐牢。即使坐牢也不能限制一个人的思想。美国曾经就有一个终身监禁的犯人最后成为知名的鸟类学家。我想告诉张维迎教授:虽然自由有利于创造,但是创造力不依赖于自由。

Tuesday, July 11, 2017

发明和创造

发明和创造

发明和创造是两个词。意思都是搞出一个原来没有的,不存在的东西。所以这两个词是同义词,也叫近义词。同义词和近义词,英文里是一个概念,也可以说是一个单词 synonym。同义词在句子里可以互换,意思不变。例如我说,他发明了一种新技术。也可以说,他创造了一种新技术。意思是一样的。发明和创造在和其他字词搭配时,有时候不能互换。例如我们说发明炸药,不说创造炸药。我们说创造理论,不说发明理论。这没有什么道理可讲,就是习惯。发明和创造是两个词,但是我们常常连起来用。意思虽然重复,但是并没有啰嗦的感觉。发明创造,还可以颠倒过来,创造发明,意思也不变。

人类具有发明创造的能力。发明创造的能力,简称为创造力,我们不说发明力。创造力还有一个同义词,创新力,一个意思。每个人的创新力是不一样的,因此有些人创新力强,有些人创新力弱。这不会有什么争议,因为这是一个事实。因此有的国家的人创新力强,有的国家的人创新力弱,也是不言而喻的。但是你要说中国人创新力弱,就有争议了。当然你也不能说中国人创新力强,你哪壶不开提哪壶,居心何在。

我见过不止一位老外写文章,谈到中国人创新力弱。这些老外精通中文,他们的文章都有中文版。我相信很多人都看过,因为这些文章在国内网站上还引起过激烈的争论。
如果你在网上同意这些老外的观点,肯定有人骂你是汉奸卖国贼。爱国的网民不能骂老外汉奸卖国贼,但是可以骂你,因为你是中国人。当然这些汉奸卖国贼也会反唇相讥,你是爱国贼。最近还增加了一个词,五毛。
总之,骂人的人热衷于谩骂,他们不会去调查,老外说我们创造力弱是不是事实,也不会去思考,为什么我们的创新力弱。我估计不骂人的人会,因为我就思考了这个问题,而且我从来不骂人,所以我才这样估计。

下面我就谈谈中国人的创新力。首先要牢记,创新力弱和没有创新力是两码事。有一次我不小心把创新力弱说成了中国人没有创新力。这时候很多热爱中华文化的人自豪地告诉我,中国有四大发明。其实只要一大发明就足够了,另外三大是画蛇添足。我理所当然地成了汉奸卖国贼。我是罪有应得,谁叫我不小心。还好现在不是文化大革命,否则还要在踏上一万只脚,让我永世不得翻身。

吃一堑长一智。第二次我就说,中国人创新力弱。想不到情况发生了变化。很多原来骂我卖国贼的人,他们不仅同意我的观点,承认中国人创新力弱,而且他们还知道,中国人创新力弱的原因是中国社会制度不好。这些爱国贼摇身一变,和我一样成了卖国贼。
我告诉他们,创新力和社会制度无关。从满清的封建社会,到民国的资本主义,到新中国的社会主义,中国人的创新力没有什么变化。这些卖国贼们无言以对,就骂我是五毛。

我还是我,也没有变脸的绝技,可是我转眼之间从汉奸卖国贼变成了五毛。因此我认为汉奸卖国贼,爱国贼,五毛,都是同义词。至少他们有一个共同点,都是中国人。
不论这些人骂我什么,这些人的优点是爱憎分明。虽然有点儿容易激动和兴奋,他们也不是不讲理,只是他们讲的理,有时候不是理。他们的创新力极强,什么奇葩的理论都能创造出来。说中国人创新力弱,我是不同意的。至少奇葩理论的创新力,世界第一。

中国人常说真理越辩越明。实际上网上中国人的辩论,通常是越辩越糊涂。有时候辩论人最后发现,他们辩论的不是开始的问题。日常生活和工作中也一样,如果没有家长,或者领导最后拍板,中国人的辩论大多没有结果。
群众的眼睛是雪亮的,所以中国才会有一个成语:公说公有理,婆说婆有理。很多人不知道原因是什么,我告诉你,中国公婆讲的理,不是一个理。

反观网上老外的辩论,首先骂人的现象很少。其次有些问题很快就能见分晓。老外辩论的效率通常比中国人高。造成这种差别,有人说是因为很多中国人分不清事实和观点。我同意这个说法。这确实是一个原因。事实是不需要辩论的,如果我们只辩论观点,至少可以节省一半时间。
我还发现了另外一个原因,那就是我们中国人心胸开阔,不像老外那样斤斤计较,把概念划分的很细。如果我们也把概念划分稍微细一点,有的真理可能一点就明白了,不需要再浪费时间去越辩越不明了。
下面我就把创新力这个概念划分细一点,看看能不能节省你的时间。创新力可以分为两种。第一种,生产技术创新力。第二种,科学理论创新力。

第一种,生产技术创新力。(以下简称技术创新力)
技术创新力是为了提高生产效率。可以说技术创新力是天生的,自从有了人类,就有技术创新力。例如人类的祖先,猿人就发明创造了石器工具。技术创新力,高级一点的动物也有,这里就不谈了。只要有生产活动就可能有技术创新力,虽然这种创新力有很大的偶然性。
我的结论是:技术创新力,全世界所有的人都有,当然也包括我们中国人。

第二种,科学理论创新力。(以下简称科学创新力)
科学理论可以解释世界上的事物和现象。科学理论是一个体系,例如物理学和化学,这两个是最经典的科学体系。每一个具体的科学理论都必须写下来,写下来必须使用文字,所以没有文字就谈不上理论。
但是写科学理论,汉字不行。也不仅仅是汉字不行,古埃及的象形文字,两河流域的楔形文字,等等凡是历史悠久的文字都不行。现在只有拼音文字行。准确地说,是 developed 发展已经成熟的拼音文字行。developing 发展中的拼音文字也不行。
我的结论是:创造科学理论需要定义明确的科学术语,和既简单又清楚的表述方法,汉字达不到这个要求。如果说中国人没有科学理论的创新力,是不严谨的。应该说,只使用汉字的人没有科学理论的创新力。

文字代表人类大脑里的概念。拼音文字表达大脑里的概念的精度可以满足创造科学理论的需要。随着科学理论的发展,对精度的要求越来越高。好在拼音文字是可持续发展的文字,至少目前还没有问题。
汉字是不可持续发展的文字。从汉字停止大规模造字那一天起,汉字就停滞了。停滞的汉字表达概念的精度不够(这限制了中国人的思维),所以只使用汉字的人创造不出科学理论。汉字落后和人种无关。使用拼音文字的华人思维和老外是一样的。只使用汉字的老外思维和中国人一样。

机械工人都知道,机器精度不够,技术再好也造不出好零件。汉字是我们思维的工具。汉字落后,我们再聪明,也创造不出科学理论。古代中国人能发明火药,不能创造化学;能发明指南针,不能创造物理学。原因就是汉字限制了我们的思维,导致我们知其然不知其所以然。
我说汉字的精度不够,热爱中华文化的人肯定不承认我的说法。最简单的办法就是请他们找一本英文科技书籍和中文翻译版,对照读一读,他们就能感觉到两种文字在精度上的差距。

科学创新力,技术创新力。为什么我们会把这两种创新力混为一谈?科学和技术,中文里本来是两个词,也是两个概念。有时候我们为了省事,把科学和技术简化为科技,把两个词变成了一个词。变成一个词不要紧,关键是不要忘记,科技这个词是两个概念,不是一个概念。把科技当作一个概念,在中国大有人在。把科学和技术两个概念混为一谈,就是我们说不清中国人创新力的原因。



回到新概念语言学

Saturday, July 8, 2017

张维迎的错误观点

张维迎的错误观点

最近,张维迎教授在北大国家发展研究院2017年毕业典礼上的讲演在网上引起了争议。张维迎认为“古代中国有过辉煌的发明创造。但在过去500年,中国在发明创造方面乏善可陈。”问题出在哪里?张维迎告诉我们“问题显然出在我们的体制和制度。创造力依赖于自由!思想的自由和行动的自由。中国体制的基本特点是限制人的自由,扼杀人的创造性,扼杀企业家精神。中国人最具创造力的时代是春秋战国时期和宋代,这不是偶然的。这两个时代也是中国人在历史上相对最自由的时代。”
中国古代确实有过发明创造,但是如果和古希腊比较,根本谈不上辉煌。张维迎认为问题出在体制和制度上。体制和制度通常是指社会制度。西方在封建制度和资本主义制度下都有大量的发明。即使在原始社会,古人也能发明石制工具。这一切都说明发明创造和制度无关。所以张维迎认为问题出在体制和制度上,显然是错误的。

张维迎又说“创造力依赖于自由!思想的自由和行动的自由。中国体制的基本特点是限制人的自由,扼杀人的创造性,扼杀企业家精神。”张维迎还说“我必须强调,自由是一个不可分割的整体,当心灵不自由的时候,行动不可能自由;当言论不自由的时候,思想不可能自由。只有自由,才有创造。”
可以说自由有利于创造,但是创造力不一定依赖于自由。我曾经读过一个英文故事,是真实的事情,美国一个从年轻时就坐牢的无期徒刑犯人,在牢里成了当时美国最著名的鸟类学家。我相信,世界上还有不少这样的例子。
欧洲中世纪是黑暗的时代,但是欧洲文艺复兴就发生在这黑暗的时代,很多科学发明也发生这段时间。中国陈景润的成果就创造在文化大革命年代。所以张维迎认为“创造力依赖于自由”是没有根据的。
至于张维迎说“言论不自由的时候,思想不可能自由”,更是逻辑不通。你可以不准一个人说话,但是任何人都不可能让一个人不思想(思维)。这是显而易见的。

中国人缺少创造力另有原因。不要睡不着觉怪床歪。我不是说床歪好,我是说床歪不是睡不着觉的原因。中国人缺少创造力的原因,早在一百多年前的新文化运动时就有结论。那时候走出国门的知识分子,几乎一致认为原因就是汉字落后,或者说中文落后。海外的华人,准确地说,使用外文的中国人,创造力和老外不相上下。现在中国的科技人员,也包括在台湾,不使用拼音文字根本就没有资格搞科学。
钱学森问为什么我们培养不出杰出(科技)人才。明摆着使用的文字不同是一个原因。很多人就是假装看不见,死不承认。文字是思维的工具,落后的思维工具限制了我们的思维。至今还没有一个使用汉字创造的科学理论。因为汉字表达的准确度只能满足日常生活的需要,满足不了创造科学理论要求。你只要找一本英文科技书籍和中文翻译版,对照读一读,就能发现中文翻译和原版的差距。

张维迎最后问“再过50年、100年重写世界发明创新史,中国能否改变过去500年史上的空白?”张维迎说“答案很大程度上依赖于我们能否持续提升中国人享有的自由。”我的答案是:不论怎么自由,也不论是什么制度,不使用拼音文字,准确地说是不使用汉语拼音文字,我们的创新能力都不可能超越使用字母文字的人。
张维迎在讲演一开始说,中华文明是世界最古老的文明之一,并且是唯一延续至今的古老文明。我不知道这句话的原创是谁,反正在中国有很多人喜欢说这句话。我也不知道说这句话的人是自豪,还是悲哀?因为这句话的潜台词是:最古老的文明很可能是最落后的文明。唯一延续到至今,说明中国现在很可能是唯一还没有进入现代文明的国家。


Tuesday, July 4, 2017

中医和西医

中医和西医

中的意思是中国。医的意思是治疗疾病,简称治病。治病的人叫医生,治病的方法叫医术。中医就是中国的医术。西医就是现在世界上流行的医术。

人类是群居的动物。古时候交通不便,高山大海把人类分隔成不相往来的人群。人类会互相模仿学习。虽然每个人的生活习惯不同,同一群人说相同的语言,有相同的文化。医术也一样,同一群人使用相同的治病方法。
世界上各个民族都有自己的医术。例如中医,藏医,蒙医。古代的欧洲人,美洲的印第安人都有自己的医术。各民族也都会因地制宜,使用当地的动植物治病,这些东西就是药。中国人使用的就叫中药。

随着交通的发展,世界上各地的人互相学习,淘汰自己落后的医术。现在世界上除了闭塞的地区,都使用相同的医术,这就是现代医术。现代医术是科学,也叫医学。科学不分国家。所以现在世界上没有美国医学,欧洲医学,也没有中国医学。
把现代医学叫做西医,很容易误导人,以为那是西方特有的医学。实际上西医,准确地说是现代医学,属于全世界所有的国家,也包括我们中国。
现在我们所说的中医是中国古代的医术。把医术写下来就是医书。中国古代的医书,有些内容例如经络子虚乌有,阴阳五行莫名其妙。本草纲目中很多内容甚至是荒诞的。

新中国成立时,中国一穷二白,尤其是广大农村地区缺医少药,缺少现代的医药。在当时困难的情况下,政府提出中西医结合,就是使用中医弥补西医数量上的不足。这是权宜之计,中医再落后,总比没有医药好。所以落后的中医中药在新中国仍有一席之地。
中西医结合是中医弥补西医数量上不足,不是中西医技术上结合。先进的技术淘汰落后的技术,这是技术发展的规律。中西医技术上结合是不可能的。中西医技术上结合的想法是善意的,结果肯定是不伦不类的。改革开放三十年来,中国经济迅速发展,现在中国已经具备淘汰中医中药的条件了。

有些思想保守的人对现代医学不了解,一听说淘汰中医就本能地反对。这些人把中医和西医看成是不同的文化,希望它们共存。文化分两种,一种文化不分先进与落后。例如京戏和芭蕾舞,饺子和披萨饼,这种文化可以共存。
还有一种文化可以分先进与落后。例如技术。医术就是一种技术。先进的技术一定是世界流行的技术。如果中医先进,全世界都会使用。中医至今还不能走向世界,就说明中医是落后的技术。可以分先进与落后的文化不能共存。这两种文化,水火不相容,先进的一定会淘汰落后的。

鼓吹中医的人往往打着弘扬中华文化的旗号。大家一定要明白,凡是加上国家或者地区的文化都是小范围流行的文化,都是封闭社会的产物。中华文化也是封闭社会的产物。可以分先进与落后的中华文化一定是落后的文化,落后的文化是无法弘扬的。
不分先进与落后的中华文化,是萝卜青菜各人喜爱,没有必要弘扬,也无法弘扬。所以弘扬中华文化,不是倒行逆施,就是瞎子点灯白费蜡。
先进的文化一定是世界的文化。先进的文化会不胫而走,不需要弘扬。高喊弘扬中华文化口号,鼓吹中医的人,如果不是别有用心,例如生产中药,或者卖中药的既得利益者,就是思想上还跟不上改革开放的步伐。

Tuesday, June 20, 2017

语言学

语言学

中国的大学里有语言学教授,没有语言学 linguistics。因为 linguistics 研究的是 language,而中文里现在连 language 这个概念还没有。

有人把 language 翻译为语言,这是张冠李戴,错误的翻译。英文的 language 是指交流和思维的工具。中文的语言是指人类说话。这是两个完全不同的概念。
说话确实是一种人类交流和思维的工具,但只是其中的一种,不是全部。人类思维工具还包括文字和聋哑人的手语。

language 是语言的上位概念。language 和语言是两个根本不同的概念。概念准确是科学理论的前提。把两个不同的概念混为一谈是概念混乱。概念混乱的人不可能有科学成果。使用现有的中文概念研究语言学,结果一定是漏洞百出,或者不知所云。
没有 language 这个概念,根本就不可能研究语言学 linguistics。现在中国大学里所谓的语言学是《现代汉语》,不是语言学,所以中国的大学里有语言学教授,没有语言学 linguistics。




Sunday, June 11, 2017

单数和复数

单数和复数

单数singular的意思是一个,不是单双数的单数odd number。复数plural的意思是多个,不是数学里的那个a+bi复数。学过英文的人都知道,英文可数名词countable noun分为单数和复数。例如:一位同学a student,前面要加一个a;同学们students,后面要加一个s。
刚开始学英文的时候,我认为英文分单数和复数是自找麻烦。中文不论一个苹果,还是两个苹果,都是苹果,多省事。中文需要表示复数的时候,可以在后面加一个们字。例如:我们,你们,他们,同志们,朋友们,多简单。有的分得比老外还清楚。例如:你,你们,老外稀里糊涂就是一个you。

后来我发现不完全是这么一回事,分单数和复数,有时候很重要。原因是可数名词的单数和复数是不同的概念,而且区分单数和复数,顺便还划分了具体概念和抽象概念。
例如:中文“老师”只有一种形式,是一个概念。英文有teacher,a teacher,teachers三种形式,它们是三个不同的概念:一位老师,老师们,和老师这个职业。

张三是老师,英文必须写成:张三是a teacher。不能写成:张三是teacher。因为teacher和a teacher是不同的概念。一个是具体的人,一个是老师这个职业,是抽象的概念。
中文不分单数和复数,结果是:张三是老师,老师并不是张三。中文的是,反过来不是,A=B,B≠A,逻辑不通。
而英文:张三是a teacher,a teacher是张三。英文的是,反过来仍然是,A=B,B=A,符合同一律。

英文可数名词分单数和复数,不仅仅区分了单数概念和复数概念,还区分了具体概念和抽象概念。中文不分单数和复数,本质是混淆概念,不仅仅表达概念的精度不如英文,还会导致句子逻辑不通。
逻辑思维是从概念出发,进行判断和推理。中国人逻辑思维出问题,可数名词不分单数和复数是其中一个原因。过去我认为英文分单数和复数是多此一举,现在我觉得很有必要。



注:我们是复数名词,但是,不是我的复数,因为我只有一个,不可能有复数。我们的意思是指我和其他一些人。

Sunday, June 4, 2017

日文里的汉字是日本文化

日文里的汉字是日本文化

有人看到日文里使用汉字,就以为日本文字来自汉字,日本的文化也来自中国文化。其实不是这么一回事。
虽然有的日本人懂中文,日本人使用汉字,只是使用汉字这个符号,不是使用中国的文言文,更不是使用中国的白话文。这就好比英国人使用拉丁字母,只是使用拉丁字母这个符号,不是使用拉丁文。
还有我们的汉语拼音使用拉丁字母,也和拉丁文以及英文没有一丁点关系。汉语拼音是中国文字,中国文化。


回到新概念语言学

阿拉伯数字

阿拉伯数字

阿拉伯数字是当今世界上最流行的代表数字的符号。虽然世界各国人民读阿拉伯数字的声音不一样,我们可以说,阿拉伯数字,在世界上已经书同文了。

教育

教育

一个国家先进,不是这个国家的土地先进,也不是这个国家的政府先进,而是生活在这个国家的人先进。人先进,不是这个国家出一两个圣人,而是这个国家的大多数人都先进。
如何做到一个国家的大多数人都先进?首先这个国家的大多数人必须受到良好的教育。一个大多数人是文盲的国家不可能先进。就像新中国成立时,中国百分之八十的人是文盲,那时候的中国不可能先进。
可以说一个国家教育的先进与落后决定了这个国家的先进与落后。和新中国成立时相比,中国现在的教育取得了巨大的进步。但是和发达的国家相比,中国教育仍然有不小的差距。

现代人类

现代人类

现在世界上有七十多亿人口。人类是由个人组成。每个人是有差别的。有的人个子高,有的矮。体重有的轻,有的重。每个人的智力也不一样。人类学家根据人的肤色,把人类可以分为白人,黑人,黄种人等不同人种。不同的人种没有高低之分。
社会学家根据地理位置或者国家,把人类分为欧洲人,亚洲人,非洲人等,或者中国人,日本人,美国人等。过去由于交通不便,每一个社会群体发展不一样,有的发展快,有的发展慢,有的甚至还在原始社会。随着交通的发展,人类社会发展的差距逐步缩小。尤其是互联网的出现,差距的缩小将会加快。

Saturday, May 13, 2017

振假名

振假名

振假名是给汉字注音的日文假名,类似中文的汉语拼音。

Furigana is a Japanese kana, printed next to a kanji to indicate its pronunciation.

英文:Furigana
日文:振り仮名


Friday, May 12, 2017

东亚文字的发展

东亚文字的发展

大家都知道汉字是古代中国人发明的。很多人津津乐道,汉字是历史悠久的文字。很少人说,汉字是先进的文字。因为字母文字才是先进的文字,汉字不是。
日本,韩国,朝鲜,越南都曾经使用汉字,现在他们都使用字母。韩国和朝鲜彻底抛弃汉字,日本还保留了一部分汉字。原因是日本没有被殖民过。
韩国和朝鲜曾经是日本殖民地,越南是法国殖民地,文字被强制改变。日文没有被强制改变,而是自然改变。不过现在日文已超越中文,变成了先进的文字,也就是字母文字。

中文至今还没有发展成字母文字,原因很多。其中一个原因是中国是一个多民族国家,有的民族使用不同的文字。由于政权更迭,中国曾经使用过拼音文字,例如蒙古文和满文。辛亥革命推翻了帝制,中国政治上进了一大步。但是中国文字上退了一大步,从字母文字退回到汉字白话文。
汉字白话文相当于日文万叶假名阶段。万叶假名就是日文的汉字白话文。日文后来创造了日文字母,也就是假名,日文进入了字母文字阶段。新中国成立后,制定了汉语拼音,这相当于日文的假名。现在中文像日文一样可以夹拉丁字母,但是夹汉语拼音还没有普及。等到中文夹汉语拼音,就和日文一样了。

全世界的文字最后都会发展到字母文字,无一例外。日文将来也会像朝鲜文和越南文一样抛弃汉字。日文发展的过程值得我们借鉴。日文发展的过程就是中文发展的榜样。

Thursday, May 11, 2017

What is a dialect? 什么是方言?

What is a dialect? A dialect is a different spoken language with an accent. When we clarify languages, we do written languages first. If people use the same written languages, their language is one language, No matter their accents. The spoken language of non-mainstream people is a dialect. As for the spoken languages without written language, as long as you think they are different, they are different languages. There are no workable criterion to clarify spoken languages. So the clarification of spoken languages is sociolinguistics.
Latvian linguistics, Max Weinreich said "A language is a dialect with an army and navy". I prefer "A language is a dialect without a written language, and a dialect is a spoken language with a written language."


Reference: New Concept Linguistics

什么是方言?

方言是一种有不同口音的口语。我们划分语言,首先是按照书面语划分,也就是按照文字划分。使用同一种文字的口语,不论说话带有什么口音,他们说的口语都是同一种语言。非主流口音的口语就是方言。
没有文字的口语,只要你认为不一样,就是不同的语言。没有文字的口语的划分,通常是按照人群划分。所以口语的划分是社会语言学。

拉脱维亚语言学家 Max Weinreich 说“语言就是方言有了军队”。 我认为“语言就是方言没有书面语,方言就是口语有了书面语”。



Wednesday, May 10, 2017

What is a morpheme? 什么是语素?

What is a morpheme?

According to Wikipedia, the definition of "morpheme" is: In linguistics, a morpheme is the smallest grammatical unit in a language. In other words, it is the smallest meaningful unit of a language. But, linguists regard a word as the smallest meaningful unit of a language.
If a word can be split into at least two meaningful parts which are morphemes. For example, the word “boys” can be split into two parts. Boy means a male child, and s means plural. However, you cannot find any morpheme in English sentences, because the smallest unit of sentences is a word. In sentences, boy is not a morpheme, but a word, and s does not exist.
A morpheme is a meaningful part of a word. If you regard a word as the smallest unit of a language, a morpheme is not the smallest meaningful unit of a language.



什么是语素?

根据维基百科,“语素”的定义是:在语言学中,语素是书面语里最小的语法单位。 换句话说,语素是书面语中最小的有意义的单位。 但是,语言学家一致认为 word 是书面语中最小的有意义的单位。 如果一个 word 可以分为至少两个有意义的部分,这两个部分就是语素。 例如,boys 可以分为两部分。 boy 意思是男孩,s 意思是复数。 但是,在英文句子里,你找不倒任何语素,因为英文句子里最小的单位是 word。在句子里,boy 不是一个语素,而是一个单词。至于单独的 s,句子里不存在。
语素是 word 内部有意义的一个部分。 如果你认为 word 是书面语里最小的单位,那么语素就不是书面语里最小的有意义的单位。

Tuesday, May 9, 2017

万叶假名

万叶假名 假名是日文的书写符号,也叫日文字母。假名是日本人发明的,但是万叶假名不是日本人发明的。万叶假名就是汉字,几百个从中国学来的汉字。不过日本人使用这些汉字不是代表意义,而是对应日语说话的声音,也就是写日文白话文。从万叶假名开始,日本文字进入了白话文阶段。汉字难写,日本人就简化了汉字,再合并同音字,就创造了日文现在使用的假名。从此日本进入了字母文字阶段。 万叶假名是因为一千多年前的一本诗歌集《万叶集》得名。《万叶集》相当于中国的《诗经》,是古代日本人写的日文诗歌。也就是说,一千多年前日本人就把汉字变成了表音符号,写白话文了。 白话文可以提高识字率;使用白话文是减少文盲的重要条件。什么是白话文?白话文就是读起来像说话一样的文章。白话文一定要使用和说话声音对应的符号,俗称表音符号。中文白话文里的汉字也是表音符号。如果汉字不和说话声音对应,那么这篇文章就不是白话文,而是文言文。这是很简单的道理。 不过中国语言学界很多人至今还不知道白话文里的汉字也是表音符号。有的人还在说汉字是表意文字。还有很多人只知道日本学习了中国的汉字,不知道日本人一千多年前就开始使用汉字写白话文。日本的识字率早在甲午战争之前就远远超越了中国。 其实一千多年前的唐朝,中国也开始使用汉字白话文,也叫变文。可是中国一直没有能普及白话文。没有普及的原因很多,其中一个是朝代更迭频繁。中国曾经两度使用字母文字,一次是蒙古文,一次是满文。大清王朝,中国的主流文字是满文,不是汉字。字母文字的效率远远超越汉字。 辛亥革命推翻了满清政府。由于民族主义,再加上满文在中国不普及,中国抛弃了满文。汉字文言文根本无法满足社会需求,我们只能退而求其次,开始使用汉字白话文。汉字白话文相当于日文万叶假名的阶段。 新中国批准了汉语拼音方案,汉语拼音是字母文字,相当于日文假名,英文的拉丁字母。目前中文还不是字母文字,是正在向字母文字过渡的阶段。 一百多年前,帝国主义大炮打开中国大门,许多青年人出国留学。这些人都感到了汉字的落后,提出了文字改革。汉字落后是当时知识分子的主流观点。新生事物总有人反对,当时的一些遗老遗少就说白话文不登大雅之堂。现在中国仍然有不少人反对使用汉语拼音。因为东西方冷战,五十年代帝国主义封锁中国,现在中国的知识分子,尤其是语言学界对西方文字了解不如老一代。 文化大革命,中国一片混乱。文革后拨乱反正,文字改革并没有恢复,甚至还出现了倒退,一些对语言学无知的人还在鼓吹汉字优秀。随着改革开放,越来越多的知识分子出国,等到现在这一代知识分子退出,新一代将会继续中国的文字改革。 文字是表达思想的工具。文字改革和政治无关。文字改革和弘扬中华文化,爱国不爱国,也无关。文字改革是高效率的工具取代低效率的工具。就像彩电取代黑白电视机是必然,汽车取代马车无可阻挡。只有不了解字母文字,也就是愚昧无知的人才会反对使用字母文字。


注:表音符号的说法不严谨,因为习惯,本文仍然沿用了这个概念。

回到新概念语言学

参考:维基百科万叶假名是假名的一种,借用汉字的音读与训读来表记古代日本语音节的文字。简单地说,万叶假名就是直接用汉字作为假名,但是用法与后来的假名相同。在汉字刚传入日本时,假名尚未出现,日本人选用数十个汉字表音,就是万叶假名;而后他们对这些表音汉字作了简化,以区别于表意汉字,就形成了今天的平假名和片假名。《万叶集》是使用万叶假名最有名的例子。



Sunday, May 7, 2017

文字

文字

文字通常有两个意思。文字的第一个意思汉字。古时候文和字是有区别的,现在文字已经不分了,文就是字,字也是文了。文字的第二个意思是文章。例如我们说一个人有文字功底,主要是指这个人文章写得好,虽然在特定的场合下也可能指这个人的字写得好。
中国人使用的文字叫中文,老外使用的文字是英文。什么是英文文章?我估计这个问题没有什么争议。但是,什么是英文的字?就不是人人都能回答的问题了。要回答这个问题,前提是要搞清楚中文的字是什么。
如果你把汉字看成中文的书写符号,那么英文的书写符号是二十六个拉丁字母 letter。如果你把汉字看成中文句子的组成单位(语言学术语是基本单位),那么英文句子的组成单位就是单词 word。

很多人比较中英文的优劣,但是不知道如何比,所以得不到正确的结果。
如果你比较文字书写的符号,中文有一万个汉字,英文只有二十六个字母。
如果你比较句子组成的单位,中文还是一万个,新华字典收录了一万个汉字。普通的一部中型英文字典收录四十多万单词,如果加上单词的变化,还有动词名词的单复数变化,英文单词肯定超过一百万个。随着社会的发展,英文单词还会增加。
英文二十六个字母可以组成上百万的基本单位。一万个汉字就是一万个基本单位。所以,字母的效率远远高于汉字。

很多人以为英文的单词就是中文的词,这是因为很多英文单词代表是意思,和中文一个词代表的意思相同,于是就误以为英文的单词等于中文的词了。
其实,中文一个字代表的意思,也常常和英文几个单词代表的意思相同。例如:姓 last name,兄 elder brother。我们不能因此就说,汉字等于英文的 phrase,所以英文的单词和中文的词不是一回事。
中文的词不是一个组成句子的单位。例如,你好。这个句子里只有两个字,没有词。有的人说一个汉字就是一个词,这是典型的概念不清,或者说混淆概念。

总而言之,英文的单词就是英文的字。几十年前,英文 word 就翻译为字。后来有人翻译为单词。但是一定要牢记,英文的单词不是中文的词。


回到新概念语言学

书法

书法

在中国,书法通常是指写毛笔字。老年人练练书法,据说可以健身,还可以消磨时间,是件好事。书法就是把字写的漂亮一些。漂亮是没有标准的。俗话说,情人眼里出西施。书法比赛是没有什么标准和公正可言的。
练书法要临帖。常见的字帖都是毛笔字帖。我还见过钢笔字帖,现在钢笔已经淘汰了,钢笔字帖没有用了。其实毛笔也早已淘汰,书法现在只是作为一种艺术出现。艺术是供人欣赏的,不是号召人们学习的。

艺术是一种技能skill。手工劳动有很多技能。机器一来,这些技能就被淘汰了。电脑时代,书法已经是一种没有用处的技能。中世纪西方也有人练习书法calligraphy,这些人就是经书抄写员。印刷术的出现,尤其是打字机的普及,西方书法被淘汰。美国的语文老师,不会要求学生练好书法,因为书法是没有用处的技能。
中国没有经历打字机过程,所以中国现在还有人强调书法。现在中国开始进入计算机时代,书法正在被淘汰。一些跟不上时代发展的人还时不时地鼓吹书法,不足为奇。

为什么中国会流行书法,一个原因是汉字难写,用毛笔写更难。什么东西一难,就有技术了。西方的字母简单,简单到谈不上什么技术,当然也就谈不上什么艺术了。等到将来中国使用汉语拼音的时候,毛笔书法也会进博物馆。
一个人写字的目的是为了写文章,不是为了写一个好看的字。除非你的职业是抄写员。现在还要一般人练习书法是本末倒置。看一个人的文章写的好不好,不是看他的字写得好不好。强调一个人字写的好不好,是买珠还椟。

练习书法就是模仿,照猫画虎。电脑时代号召学生练书法,毫无意义:呼吁书法走进课堂,是坑害学生。



回到新概念语言学

Saturday, May 6, 2017

六书新解

六书新解

六书是古人划分汉字的六种类型:指事,会意,形声,转注,假借。

一、象形字就是简单的图画,用尽可能少的笔画把物体的外形画出来。例如:(古体的)日月山水。原始的汉字是象形字,象形字一目了然。现代汉字早已不象形了。即使是甲骨文,里面很多汉字很多已经不象形了。甲骨文里还有不少字没有破解,就说明这些汉字不象形。全部是象形文字的文章是否是文字还是个问题,全部是象形文字的文章应该叫连环画。

象形文字基本上都是独体字。独体字是一个不可分的书写符号。指事字和会意字是不象形的表意文字。它们的区别是指事字是独体,会意字是合体。合体字是可以分开的几个书写符号合成的符号。
二、指事字是在一个独体字上加一个笔画。例如:本末刃。
三、会意字是两个或者多个独体字合起来。例如:尖众。会意字分开来写就是一个词。

四、形声字是合体字。形声字通常有两个部分,一个表示意义,一个代表声音。例如:材妈。形声字是表音符号的雏形。
五、转注字就是文章里的同义字。
六、假借字就是文章里的同音字。同音字也叫别字。

六书是古人总结的,有的现在已经过时了,例如汉字早已不象形了。现代白话文里的字大多数是形声字,指事字和会意字的数量很少。这表明现代白话文正在向字母文字,也叫拼音文字过渡。
现代白话文里的汉字实际上已经是一个表音的符号。只是由于有大量的同音字,汉字是一种效率低下的表音符号。


回到新概念语言学

Thursday, May 4, 2017

What is a phoneme? 什么是音素?

What is a phoneme?

According to Google research, the definition of "phoneme" is: any of the perceptually distinct units of sound in a specified language that distinguish one word from another, for example p, b, d, and t in the English words pad, pat, bad, and bat.
In fact, a phoneme is not any of the perceptually distinct units of sound in a specified language that distinguish one word from another. We distinguish words by letters instead of phonemes. If that is the case, then we cannot explain why there are homonyms, for example, to, too, and two.
Phonemes are represented by International Phonetic Alphabets, rather than English letters.


Reference: New Concept Linguistics

什么是音素?

谷歌给“音素”的定义是:语言中用于区分单词的,感知上的不同声音单元,例如英文单词pad,pat,bad,bat中的p,b,d,t。
实际上,音素不是语言中用于区分单词的不同声音单元。我们区分单词使用的是字母,不是音素。如果是使用音素,那么我们就无法解释,为什么会有同音单词,例如 to,too,two。
音素是国际音标代表的读音,不是英文字母代表的读音




What is a letter? 什么是字母?

What is a letter?

According to Google research, the definition of “letter” is: a character representing one or more of the sounds used in speech; any of the symbols of an alphabet.

A letter is any of the symbols of an alphabet. That is true. However, a letter is not a character representing one or more of the sounds used in speech. If so, what are silent letters, for example a, b, c, and d in the English words logically, debt, muscle, and sandwich.



什么是字母?

谷歌给“字母”的定义是:代表口语中声音的符号; 字母表里的所有的符号。
字母确实是字母表里的符号。但是,字母不是代表口语中声音的符号。如果字母是代表口语中声音的符号,那么英语单词 logically, debt, muscle, sandwich 中的不发音的字母 a,b,c,d 代表什么?


参考:新概念语言学


Tuesday, April 11, 2017

造字

造字


中文现在已经不造字了。中文最后一次大规模造字是一百年前,赛先生来到中国时,造的一些化学元素字。在这之前,中文早已停止造字了。什么时候停止的?历史没有记载。
《说文解字》说,汉字分为两类:独体的是文,合体的是字。独体的 “文” 是一个不可拆分的符号,例如人。合体的 “字” 是几个可以拆分的符号的组合。例如你和他。我们平时 “文” 和 “字” 是不分的,也就是说,文就是字,字也是文。

造字就是把多个笔画写在一个方的形状里。为什么汉字必须写成一个方的形状?因为中国古时候写文章使用竹简。竹简是一根根细细的长条,用绳子串起来。为了减轻绳子的拉力,竹简是竖放的,所以中文从上往下写。竹简很窄,宽度是固定的,每个汉字的宽度也就固定了。无论汉字有多少笔画,由于竹简的限制,都是一个方块形。由于习惯,方块汉字一直使用到今天。

由于造字必须挤在一个方格内,新造的字变成了一个新的符号。结果中文的符号越来越多。造符号是不可持续发展的,符号的数量多了不利于记忆,迟早都会停止,这就是中文停止造字的原因。社会在发展,人类不断有新的意义要表达。中文现在的方法是组词,就是用已有的汉字组成一个词。组词无法根本解决停止造字的问题。
汉字是中文的单位。中文的单位现在已经停止发展了。拼音文字的单位是word,也叫单词。
中文要想发展只能使用汉语拼音,增加中文的单词。这是唯一的方法。也就是毛主席说的,走全世界共同的拼音方向。



请参考新概念语言学组词

《说文解字》段注:析言之,独体曰文,合体曰字,统言之,则文字可互称。

Translation 翻译

Translation

Translation is to rewrite or restate in another language. For example, we translate English into Chinese, or vice versa. English includes both spoken English and written English, same as in Chinese. In general, two people who speak different languages, need someone to translate, but the situations are not necessarily the same. For example, two Quebecois, one speaks French, and the other speaks English, usually do not need an interpreter when they talk. If two people speak the same language, they do not require an interpreter. However, two Chinese people, one from Canton, and the other from Fujian province, probably require one when they talk. Yet, when they write to each other, they do not need a translator.

Translators must speak two spoken languages, or write two written languages, so we call them bilingual. When I was young, I wrote Chinese only. Once I read an article in classical Chinese and wrote it in modern Chinese. My teacher said my translation was good. Many people thought English is one kind of language, but it is not. If it is, do illiterate people know English or not? Without any doubt, spoken English and written English are two languages. However, writing or reading a letter for an illiterate, you are not regarded as a translator. The reason is that we always conflate spoken English and written English. In fact, both reading aloud and dictating are translating, but we did not realize it.

Translation is an explanation for people who do not understand. From this point of view, when kids go to elementary school to learn written language, teachers all are interpreters. They translate what students do not understand. When babies are born, their parents are their interpreters. When young makes go to universities to study sciences, professors are interpreters too. If you explain something to somebody, you are translating.


Welcome to New Concept Linguistics!

翻译

翻译是用另外一种语言或者文字来表达。例如,我们把英语和英文翻译成汉语和中文,或者把汉语和中文翻译成英语和英文。一般来说,两个人说不同的语言,需要翻译。但有时候也不一定。例如,两个魁北克人谈话,一个人说法语,另外一个说英语,通常不需要翻译。如果两个人说同一种语言,就不需要翻译了。可是如果两个中国人,一个来自广州,一个来自福建省,他们谈话的时候,很可能需要一个翻译。不过,他们通信却不要翻译。

翻译必须会说两种语言,或者写两种文字,所以我们称他们为双语。可是,我小时候只懂中文,有一次我看了一篇文言文,再用白话文写出来,老师却说我翻译的很好。很多人以为English是一种language。肯定不是。如果是,请问文盲懂English吗?毫无疑问,English 是两种 language,英语和英文。但是,你帮一位文盲写一封信,或者读一封来信,没有人承认这是翻译。因为我们把英语和英文,这两种 language 混为一谈。其实朗读和听写都是翻译,只不过我们没有意识到而已。


翻译是给听不懂,或者看不懂的人做解释。 从这个角度来看,小孩上小学去读书,老师是他们的翻译。 他们翻译学生不懂的事情。 婴儿出生后,他们的父母是他们的翻译。 当年轻人上大学研究科学时,教授也是他们的翻译。 不论你给别人解释什么东西,你就是在翻译。


请参考新概念语言学