Tuesday, April 11, 2017

造字

造字


中文现在已经不造字了。中文最后一次大规模造字是一百年前,赛先生来到中国时,造的一些化学元素字。在这之前,中文早已停止造字了。什么时候停止的?历史没有记载。
《说文解字》说,汉字分为两类:独体的是文,合体的是字。独体的 “文” 是一个不可拆分的符号,例如人。合体的 “字” 是几个可以拆分的符号的组合。例如你和他。我们平时 “文” 和 “字” 是不分的,也就是说,文就是字,字也是文。

造字就是把多个笔画写在一个方的形状里。为什么汉字必须写成一个方的形状?因为中国古时候写文章使用竹简。竹简是一根根细细的长条,用绳子串起来。为了减轻绳子的拉力,竹简是竖放的,所以中文从上往下写。竹简很窄,宽度是固定的,每个汉字的宽度也就固定了。无论汉字有多少笔画,由于竹简的限制,都是一个方块形。由于习惯,方块汉字一直使用到今天。

由于造字必须挤在一个方格内,新造的字变成了一个新的符号。结果中文的符号越来越多。造符号是不可持续发展的,符号的数量多了不利于记忆,迟早都会停止,这就是中文停止造字的原因。社会在发展,人类不断有新的意义要表达。中文现在的方法是组词,就是用已有的汉字组成一个词。组词无法根本解决停止造字的问题。
汉字是中文的单位。中文的单位现在已经停止发展了。拼音文字的单位是word,也叫单词。
中文要想发展只能使用汉语拼音,增加中文的单词。这是唯一的方法。也就是毛主席说的,走全世界共同的拼音方向。



请参考新概念语言学组词

《说文解字》段注:析言之,独体曰文,合体曰字,统言之,则文字可互称。

Translation 翻译

Translation

Translation is to rewrite or restate in another language. For example, we translate English into Chinese, or vice versa. English includes both spoken English and written English, same as in Chinese. In general, two people who speak different languages, need someone to translate, but the situations are not necessarily the same. For example, two Quebecois, one speaks French, and the other speaks English, usually do not need an interpreter when they talk. If two people speak the same language, they do not require an interpreter. However, two Chinese people, one from Canton, and the other from Fujian province, probably require one when they talk. Yet, when they write to each other, they do not need a translator.

Translators must speak two spoken languages, or write two written languages, so we call them bilingual. When I was young, I wrote Chinese only. Once I read an article in classical Chinese and wrote it in modern Chinese. My teacher said my translation was good. Many people thought English is one kind of language, but it is not. If it is, do illiterate people know English or not? Without any doubt, spoken English and written English are two languages. However, writing or reading a letter for an illiterate, you are not regarded as a translator. The reason is that we always conflate spoken English and written English. In fact, both reading aloud and dictating are translating, but we did not realize it.

Translation is an explanation for people who do not understand. From this point of view, when kids go to elementary school to learn written language, teachers all are interpreters. They translate what students do not understand. When babies are born, their parents are their interpreters. When young makes go to universities to study sciences, professors are interpreters too. If you explain something to somebody, you are translating.


Welcome to New Concept Linguistics!

翻译

翻译是用另外一种语言或者文字来表达。例如,我们把英语和英文翻译成汉语和中文,或者把汉语和中文翻译成英语和英文。一般来说,两个人说不同的语言,需要翻译。但有时候也不一定。例如,两个魁北克人谈话,一个人说法语,另外一个说英语,通常不需要翻译。如果两个人说同一种语言,就不需要翻译了。可是如果两个中国人,一个来自广州,一个来自福建省,他们谈话的时候,很可能需要一个翻译。不过,他们通信却不要翻译。

翻译必须会说两种语言,或者写两种文字,所以我们称他们为双语。可是,我小时候只懂中文,有一次我看了一篇文言文,再用白话文写出来,老师却说我翻译的很好。很多人以为English是一种language。肯定不是。如果是,请问文盲懂English吗?毫无疑问,English 是两种 language,英语和英文。但是,你帮一位文盲写一封信,或者读一封来信,没有人承认这是翻译。因为我们把英语和英文,这两种 language 混为一谈。其实朗读和听写都是翻译,只不过我们没有意识到而已。


翻译是给听不懂,或者看不懂的人做解释。 从这个角度来看,小孩上小学去读书,老师是他们的翻译。 他们翻译学生不懂的事情。 婴儿出生后,他们的父母是他们的翻译。 当年轻人上大学研究科学时,教授也是他们的翻译。 不论你给别人解释什么东西,你就是在翻译。


请参考新概念语言学

组词

组词


组词就是用两个,或者更多的汉字组成一个词。不少热爱汉字的人把汉字组词看成中文的一大优点。讥笑英文不断地造新单词。这纯属对英文和语言学无知。


中文句子是汉字组成的,英文句子是 word 单词组成的。有人以为英文句子是字母组成的,这是错误的看法。英文里“没有”字母,只有单词。字母在英文句子里不能独立存在,独立存在的字母是单词,例如 I,a。这和汉字的笔画类似,我们不能说中文是笔画组成的,因为笔画在中文句子里不能单独存在。单独存在的笔画叫汉字,例如 “一” 字。
明白这个道理,就能够明白英文也可以组词。英文组的词一点也不比中文少。英文的词叫 phrase。英文不仅组词,还能造组词的字 。中文只能组词,已经失去造字的功能。

这种错误观点的主要原因是,这些人把中文的词,和英文的单词混为一谈。英文的单词是组成英文句子的单位。中文的词不是,汉字才是组成中文句子的单位。


请参考新概念语言学造字

两种符号

两种符号

文字使用的符号分两种。第一种,直接代表意义的符号(表意符号)。例如汉字,古埃及象形文字,阿拉伯数字,标点符号,等等。第二种,不直接表意的符号(字母)。例如拉丁字母,日文假名,等等。这些符号通常是组合起来代表意义。不直接表意的符号很容易和说话的声音建立关系,所以有人把它们叫做表音符号,不过这个说法不是很准确。真正的表音符号是音标,例如国际音标。

人类最早发明的符号是表意符号。表意符号的优点是简单方便,现代文字里仍然使用。缺点是,因为符号的数量不能无限地增加,表意符号不能无限地增加。表意符号不能满足书面语言,也就是文字发展的要求。因为文字的数量随着人类社会发展会大量增加。
为了满足文字数量发展的要求,人类又发明了不直接表意的符号(字母)。几十个字母可以组成天文数字的单位,可以满足人类社会发展的需要。现在全世界,除了中文,所有的文字都使用了字母。


一个符号表意还是表音,和符号本身没有关系。一个符号,你规定它表意,它就表意。你规定他表音,它就表音。例如,日文假名(エオニヌハヒホルロぬえ)和汉字(工才二又八匕八木儿口奴元)外形一样,汉字表意,假名不表意。但是,应该避免在一个范围内让一个符号一会儿表音,一会儿表意。这样容易引起混乱,至少是增加记忆的麻烦,降低文字的效率。
中文白话文就是让一个符号,一会儿表音,一会儿表意。例如(东西,马上)这些汉字,单独的时候表意,组合起来的时候表音,不表意了。所以和字母文字相比,中文的概念常常不清楚,而且效率低下。



回到新概念语言学

Sunday, April 9, 2017

Concept and Meaning 概念和意义

Concept and Meaning

A concept is a thought about a thing or group of things, which is used to identify a single thing or a category of things. In this respect, a concept is a name of a thing or a group of things. Concept is an activity of our minds, and modern scientists have not discovered what it is physically. We cannot express concept directly. If we want to express it to others, we have to write it out or use other languages. If we write a concept out, it must be a word or a group of words (a phrase) in sentences. In other words, a concept is the meaning a word or a phrase represented in sentences. Concept and meaning are inseparable; they are two sides of the same coin.

If you look up a word in a dictionary, you will find that many words have multiple meanings listed, and many words can be used as different parts of speech. For example, date. As a noun, it may mean a sweet, dark brown, oval fruit. As a verb, it may mean to go out with a boy friend or a girl friend. Do we misunderstand if a word represents multiple meanings? Yes, we do. However, we do not write only a word in an article, but at least a sentence. A word represents only one meaning in sentences. From context, we will choose the most suitable from multiple meanings in a dictionary.

Why does a word in a dictionary have multiple meanings? The reason is that there are countless concepts in our minds, while we cannot produce as many representative words. Even if we can do it, that does not meet the principle of least effort. Least effort is to do less and to accomplish more. It postulates that people will naturally choose the path of least resistance or "effort". The principle of least effort is the theory that covers diverse fields including linguistics. In order to use the fewest words to represent the most meanings, we not only use one a word to represent multiple meanings, but also combine multiple words to represent multiple meanings. We have to do this because the meanings to be represented are countless.

There is no doubt that a word for a meaning is for the most accurate understanding, but it is the least efficient. More words make it easier for accurate understanding, but it is the least efficient; fewer words make it more efficient. Accuracy and efficiency are in conflict. However, human language will adjust them automatically. When accuracy meets the minimum requirement, it is an optimal equilibrium. Although the production of words can be unlimited, humans produce as few words as possible. We do not produce new words until we have to. Therefore, if we compare two writing systems, the one with a larger number of words is more advanced.

Does a word have an inherent meaning? No, definitely not. The meaning of a word or words represents the communicators’ mutual feeling and understanding of something and they agree to use a certain word or words to represent that meaning. The meanings of common words are already in our mind, which we have studied before. When we see the common words we recall the meanings in our minds and select a suitable one. When we read a new word in an article, we check a dictionary and select the most suitable one. Dictionaries list the most commonly used meanings of a word for our selection. We do not know the meaning of individual words without context or some other background. In other words, the meanings of a word listed in dictionary do not make sense. A word conveys meanings only in sentences.

How does a word represent a meaning? The meaning a word represents is like the value of unknowns, which is also called variables in basic algebra and solves certain types of arithmetic problems quickly and easily. If you know computer-programming language, the value of variables in programming is similar to the meaning a word represents. We assign value to an unknown in algebra or a variable in programming and we assign meaning to a word in articles. They work in the same way to be efficient.

In conclusion, a concept is a thought in our minds, and a meaning is what a word or words represent. The meaning we assigned to a word or words is a concept in our minds. They are the same thing in our minds.



概念和意义

概念是大脑想到的一个或者一类事物。我们用概念来识别一个事物或者一类事物。 从这个角度来看,一个概念就是一个事物或者一类事物的名称。概念是大脑里的活动,科学家现在还说不清楚概念究竟是什么。我们不能直接表达概念。如果我们要把大脑里的概念告诉其他人,我们必须把概念写出来或通过其他语言方式表达出来。如果我们把一个概念写出来,它一定是句子中的一个word单词,或者几个word(一个phrase)。换句话说,概念就是句子中的一个word或者一个phrase代表的意义。意义和概念就像一个硬币的正面和反面,不可分割。

如果你查字典dictionary,你会发现很多word有多个意义。有的word还有不同的词性parts of speech。例如,date。作为noun名词,意思是枣子,作为verb动词,意思是男女朋友约会。
一个word代表多个意义,会不会产生误解呢?当然会误解。但是,句子里的word只代表一个意义。我们写文章,起码是写一句话,不会只写一个字。根据上下文,我们会从这个word在字典里的很多意义里,选择一个合适的意义。

为什么字典里的一个word有多个意义?原因是我们要表达的概念太多,我们不可能造出那么多的word去代表。即使我们能造,也不符合最省力原则。最省力原则应用于包括语言学在内的各种领域的理论。最省力原则的意思就是少花力气,多出成果。它假定人们会自然选择阻力最小或者最省事的方法。
为了用尽可能少的字,代表尽可能多的意义,我们不仅使用一个字代表多个意义,我们还把几个字组成一个词代表多个意义。我们不得不这样做,因为要表达的意义太多了。

毫无疑问,一个word代表一个意义是最准确的,但效率最低。word越多意味着越准确;word越少意味着越有效率。
准确和效率是互相抵触的。人类语言会自动调整。满足不误解的最低要求,是一个最佳的平衡点。
虽然我们可以无限地造word,但人类自动尽可能少地造。我们不会造新的word,除非不得不造。因此,如果我们比较两种书面语,word的数量多的一定更先进。

word本身有意义吗?没有,绝对没有。一个word或者几个word代表的意义是交流的人对某事物的共同感觉和理解,他们都同意使用某一个word或者某几个word来表示这个事物。
常见的word的意思已经在我们的大脑里,因为我们以前学习过。当我们看到常见的word,我们会回忆起大脑里这个word的各种意义,然后选择一个合适的意义。当我们在文章中阅读一个新word时,我们会查字典并选择最合适的意义。字典把每个word最常用的意义都列出来供我们选择。
没有上下文或者其他背景知识,我们不知道一个word代表的意思。换句话说,字典列出来一个word可能代表的各种意义,没有用。只有在句子中,一个word才有明确的意义。

word如何代表意义?
代数里使用未知数(变量)可以轻松解决复杂的算术问题,word代表的意义就像代数题里的未知数的值。
如果你懂计算机编程语言,程序里变量的值就相当于word代表的意义。
代数题里未知数的值,计算机程序里变量的值,和文章中的一个word代表的意义,它们工作的方式是相同的,都有效率。

总之,概念是我们大脑里的思维,word(s)代表的是意义。我们规定word(s)代表的意义就是大脑里的概念;在我们的大脑里,它们是同一个东西。

注:单词word是英文句子的基本单位。字是中文句子的基本单位。所以语言学里中文的字相当于英文的单词,中文的词相当于英文的phrase。中文的词不是一个基本单位,而是多个基本单位。
Notes: Words are fundamental units in an English sentence. Chinese characters are fundamental units in a Chinese sentence. Therefore, linguistically, Chinese characters are words. A group of Chinese characters, or a “Ci” in Chinese, is a phrase. A phrase is not a fundamental unit, but a group of fundamental units. 

方块字的原因

方块字的原因


古时候中国人写文章使用竹简。竹简是一根根细细的长条,用绳子串起来。为了减轻绳子的拉力,竹简是竖放的,所以古时候中文都是从上往下写。竹简很窄,宽度是固定的,每个汉字的宽度也是固定的。不论汉字的笔画有多少,由于竹简的限制,汉字都是一个方块形。等到中国发明了纸,中文方块字和竖写的习惯已经形成了。习惯是很难改变的,方块字一直使用到今天。

世界上大多数文字都是从左到右横排的。表面上看,横排竖排只是方向不同,实际上是有区别的。
字母文字是无法竖排的。字母竖排,一个字母(符号)会被认为是一个单位。字母横排,多个字母顺序排列,前后加上空格,形成一个单位。每个字母(符号)不会被认为是一个单位。

竖排,一个符号就是一个单位。符号是数量是不可持续发展的,所以汉字早就停止造字了。横排,一个符号不一定是一个单位。这样可以把符号的数量降低到最少,而单词(单位)的数量可以几乎无限地增加,提高文字的效率。

中文为了适应潮流,几十年前也改为横排。现在中文减少符号,提高效率的条件已经具备。例如,汉语拼音使用几十个字母,就可以代替几千个汉字,大大提高了中文的效率。但是由于很多人反对,中国还没有全面正式使用。
老一辈的人由于习惯,他们过了学习的最佳时期,不愿意学习和使用新的工具,这是可以理解的。但是他们不会反对年轻人使用汉语拼音。而中国一些对语言学无知的公知,打着弘扬中华文化和爱国的旗号,反对使用汉语拼音,则是可恶,可悲了。

方块字的原因是中国古时候使用竹简。现在中文已经改为横排了,中文使用汉语拼音,技术上已经没有障碍,剩下的只是某些人思想上的障碍了。


英文和汉语拼音

英文和汉语拼音


汉字落后,拼音文字先进,这已经没有什么可以讨论的了。英语是事实上的世界普通话;英文是国际上最通用的文字。如果你希望直接了解国际上最新的科学信息,学习英文最好,这样信息最快,最准确。如果你经常到世界上走一走,会说英语最方便,因为英语使用最普遍。
学习英语和英文肯定好。问题是学习外语和外文,不仅要付出精力和金钱,还要有条件,例如年轻,有好的外语学校。如果你的工作和外文没有什么关系,只是偶尔出国旅游,那么你的付出值不值,还是一个需要考虑的问题。


汉语拼音是中国将来的文字。汉字中文只能满足一般的需要,不适合表达复杂的内容,例如科学理论。钱学森早就发现我们培养不出杰出(科学)人才,汉字中文就是一个重要的原因。只使用汉字的人可以成为国学大师,不可能成为科学家。
为了提高我们的科学素质,中国使用汉语拼音是迟早的问题。就像白话文取代文言文,不论迂腐的文人如何反对,历史潮流不可阻挡。认识文字改革的重要性有一个过程。不论这段时间长或短,最后的结果肯定是改革。因为两种文字的效率差距巨大。文字改革和政治无关,除了无知的人,没有人会反对使用先进的工具。


在世界文字统一之前,中国肯定会进入汉语拼音阶段。虽然汉语拼音和英文都是拼音文字,对于我们中国人,英文是外文,汉语拼音不是。学习外文,需要学习外语。学习汉语拼音,不需要再学习汉语,我们的母语就是汉语。对于我们中国人来说,学习汉语拼音的效率远远高于学习英文。
改变一个人的口语,也就是一个人学习外语是需要条件的。例如年轻,有一个外语环境。改变一个国家的人的口语,尤其是改变一个大国的口语是很难的事情。例如印度,英国统治这么多年,即使英文是印度的官方文字,印度很多人的母语仍然不是英语。
不改变口语,只改变文字,相对容易得多。历史上秦始皇的书同文,我们周边的日本,韩国,朝鲜,越南,都经历过。学习英文要比学习汉语拼音难。因为学习汉语拼音,你不必学习汉语。学习英文,你必须学习英语。


英文和汉语拼音都是拼音文字,我们应该选择哪一个?要想研究科学,我们现在没有选择的余地,只有学习英文一条路,因为中国目前还没有全面使用汉语拼音。就像白话文取代文言文,汉语拼音将来也会取代白话文。到那时,我们研究科学,英文就不是唯一的选择,我们还可以使用汉语拼音。而对于我们说汉语的人,学习汉语拼音,比学习英文,效率要高得多。
由于无知,有些人反对使用汉语拼音。但是迟早会认识到,中国不可能接受只有少数精英使用先进的英文,绝大多数人使用落后的汉字,这种文字政策。全世界文字统一需要很长时间。在统一之前,中国需要有自己的拼音文字,汉语拼音来满足中国发展的需要。


参考:新概念语言学

Do Arithmetic as Quickly as Chinese Students

Do Arithmetic as Quickly as Chinese Students

Last year an article in the Wall Street Journal, “The Best Language for Math” by Sue Shellenbarger, caused a dispute. Ms. Shellenbarger said, “Chinese use simpler number words and express math concepts more clearly than English, making it easier for small children to learn counting and arithmetic”.  Some disagreed.
The dispute boils down to a controversial theory, the Sapir-Whorf hypothesis. This hypothesis contends that the language I speak determines the way I think. I accept the Sapir-Whorf theory. In addition, I believe language is thought. They are two sides of the same coin because they can’t be separated. I support Ms. Shellenbarger when she says “confusing English number words are linked to weaker skills” which is also the subtitle of her article. 

In general, English is more advanced than Chinese when we regard language as a tool of thinking. However, English is less efficient than Chinese in expressing Arabic numbers. English uses twenty-seven words to express the counting numbers from one through ninety-nine (1-99) whereas Chinese uses only ten words. They are: one, two, three, four, five, six, seven, eight, nine, and ten.
In addition, seventeen English number words are unnecessary. They are: eleven, twelve, thirteen, fourteen, fifteen sixteen, seventeen, eighteen, nineteen, twenty, thirty, forty, fifty, sixty, seventy, eighty, and ninety. 
Ten words are enough to represent numbers within one hundred. The principal is that one digit uses one word. Eleven in Chinese is “one-ten-one” or in a shorten form “ten-one”.
English words “eleven through nineteen” are suited to the old British currency system, mixed duodecimal-vigesimal. That is 12 pence equal 1 shilling, 20 shillings equal a pound sterling. In a decimal system this is inappropriate. The numbers eleven through nineteen do not fit a decimal system. More words don’t aid understanding. 

If you want to do arithmetic as quickly as a Chinese student does, follow these guidelines. Break down the seventeen words. For example, eleven is “ten-one”, twelve is “ten-two”, continue with “ten-three” through “ten-nine”. Twenty is “two-ten” or “two-ty”. Similarly, “thirty” is “three-ty” and “four-ty” through “nine-ty”. Either “teen” or “ty” means tenths. Accordingly “twenty-one” is “two-ty-one”. “Twenty-two” is “two-ty-two” and so on, until “nine-ty-nine”. 
Switch to the Chinese Multiplication table which Chinese students call “Small Nine Nine”. Actually, it is smaller than the American multiplication table. The Chinese times table is nine by nine while the American table is twelve by twelve. In a decimal system, ten by ten is the same as one by one. Eleven and twelve are not useful.

Now you use only ten numeral words in the table. They are one, two, three, four, five, six, seven, eight, nine, and ten or ty. Some tricks will help you read and recite the table. When you read “two times three is six” skip the word “times”, like this, “two three is six”. When you read “six times seven is forty two”, you skip “times” and replace “is” with a short pause, like this, "six sevens (shortly pause) four-ty-two".
Drop off all phonemes behind the first vowel in these ten words. Read them like abbreviations, as long as you can distinguish them. For example: fo(ur) and fi(ve), si(x) and se(ven). All the equations in the table are in four or five words. Now when you read an equation you feel as if you are reading a short line in a poem. At first, recite the equations in order, then mix them up. Practice makes perfect. Soon you will blurt out any product!

Keep in mind that it doesn't matter which of the two factors is first or second, the product is always the same. This will cut the job of recitation in half. Recitation is not hard work. Almost all Chinese students can do it.
After you learn the Chinese multiplication table by heart, it is like an application installed in your mind. You will do arithmetic as quickly as Chinese students.


written in 2015
The Best Language for Math
https://www.wsj.com/articles/the-best-language-for-math-1410304008

词典词

词典词

词是句子里连续的几个字,这几个字合起来代表意义。最常见的词是两个字,其次是三个字。四个字的词,很多叫成语,五个字以上的词很少了。
词典词,顾名思义,就是词典收录的词。词典不收的词,叫非词典词,也叫普通词,或者正常词。为什么词典不收正常词?因为正常词的词义就是两(多)个字的字义合起来。要想知道正常词的词义,查字典就可以了。例如,蓝天,查字典里的蓝和天,就明白是什么意思了。
词典词查字典没有用。因为词典词的词义和字义没关系。例如:东西,查字典里的东和西,没有用。马虎,查字典里的马和虎,也没有用。这种词典词的词义和两个字的字义都无关。还有一种词典词的词义和其中一个字的字义无关。例如:国家,是国不是家。忘记,是忘不是记。词典词的字义,画蛇添足。

除了聋哑人,一个人表达意义可以说话,也可以写文章。一篇文章,如果读出来像说话一样,这种文章就是白话文。白话文里汉字的读音,和我们说话的声音(单音)大致对应。人类开始说话时,首先使用单音表达意义。人类说话发出的单音种类是有限的。随着社会发展,单音表达的意义不够用了,于是出现了两个声音代表的意义。两个声音不够用了,就出现三个,四个,甚至更多声音代表的意义。
口语里的两个声音,有可能代表两个意义,也有可能代表一个意义。口语里的两个声音,用汉字写下来就是两个字。由于每个汉字都代表意义,两个汉字就有两个意义。所以汉字只适合代表口语里单音的意义,不适合代表口语里多个声音的意义。现在我们口语里有大量多个声音代表的意义,所以单音表意的汉字不适合写白话文。我们读汉字写的白话文,需要判断连续的几个字是不是一个词典词,这是一件麻烦事,降低了中文的效率。

大家都知道,我们读古人的文言文要句读。句读就是由读者来猜古文里哪些字是一句话。从这个角度说,文言文是个半成品。白话文由作者写好了标点符号,提高了中文阅读的效率。
现在我们读白话文的时候要词读。词读是我模仿句读创造的一个词,词读的意思就是由读者来猜白话文里哪几个字是一个词典词。从这个角度说,汉字白话文也是个半成品。如果由作者写好词典词,将再一次提高中文阅读的效率。不过,作者写词典词不能再使用汉字,原因前面已经说过,汉字不适合写口语里多个声音代表的意义。由读者词读的原因就是因为词典词使用了汉字。由作者写词典词需要用汉语拼音字母写,把词典词写成一个多音节 word。

现在很多人还没有意识到单音表意的汉字不适合写词典词。词典词是一个意义,用汉字没法写,因为每个汉字都有意义正常词使用汉字的意义,词典词不使用汉字的意义,只使用汉字的读音。词典词的汉字相当于字母。
词典词是中文多音节 word 的前奏;词典是汉语拼音字典的雏形。等到中文使用汉语拼音的时候,只要把词典里每个词条 entry 的汉语拼音放到汉字的前面,字体放大,略加调整,词典就能变成汉语拼音字典 dictionary。


注:本文里的两个和多个,有时候同义。

回到新概念语言学

Saturday, April 8, 2017

The principle of least effort 最省力原则

The principle of least effort 最省力原则

The principle of least effort (PLE)
The principle of least effort is the expenditure of the least amount of effort to accomplish a task.

最省力原则
最省力原则就是用最小的代价达到目的。

最省力原则不仅仅限于语言学,最省力原则几乎无所不在。

Arbitrariness 任意性

Arbitrariness 任意性


Arbitrariness
In linguistics, arbitrariness is the absence of any natural or necessary connection between a meaning and its form.


任意性
语言学里,任意性是指意义和代表这个意义的形式之间没有任何自然或必要的联系。

例如,说话的声音和说话声音代表的意义之间的关系是任意的,否则就没有办法解释世界上会有这么多种的语言了。
再例如,汉字和汉字代表的意义之间的关系也是任意的,否则就没有办法解释为什么简体字可以代替繁体字了。

参考:新概念语言学

Friday, April 7, 2017

中文和英文的结构

中文和英文的结构

不考虑篇章段落,英文文章由句子组成。不算标点符号,英文句子由word组成。word由字母组成。中文文章由句子组成。中文的句子由汉字组成。汉字由笔画组成。
英文的书写符号是字母。中文的书写符号是汉字。字母和汉字都是符号。中文句子由符号(汉字)组成。英文句子却不是符号(字母)组成,而是由word组成。word 不是一个符号。

英文句子里只有word,没有字母。因为英文字母在句子里不能单独存在,单独存在的字母叫word,例如 I,a 等等。就像汉字的笔画一样,英文字母在句子里不能单独存在。单独存在的笔画叫汉字,例如一字。
从句子的结构来说,英文句子由word组成。中文句子由汉字组成。英文word相当于中文的汉字。所以说,word是英文的基本单位,汉字是中文的基本单位。

语言学里,英文word的正确翻译是 “字”。由于有人把 word 翻译为 “单词”,又有人把 “单词” 简化为 “词”,于是中国语言学界就把英文 “单词” 和中文的 “词” 混为一谈了。
就像地瓜不是瓜,土豆不是豆,英文的 “单词” 不是中文的 “词”。英文的word相当于中文的“字”。中文的“词”相当于英文的phrase。

中文和英文基本单位的区别是:中文的一个基本单位就是一个符号。英文的一个基本单位,除了少数几个,绝大多数是由多个符号组成。
中文和英文,句子的结构是一样的,只是基本单位的组成不一样。



注:凡是没有英文翻译的文章都是为新概念语言学中文版写。
回到新概念语言学

语文

语文

不论中国和外国,学校都有语文课。例如美国,他们的语文是英文,中国的语文是中文。从古至今,中国的语文课就是识字,认识汉字。现在中国使用白话文了,只要你说汉语,学会了写汉字,你就可以写白话文。美国的小孩也是只要会说英语,写英文也很容易。


过去,中国私塾使用三字经,百家姓,千字文,弟子规等作为教材。解放后,全国的学校使用人民教育出版社的统一教材,现在有几家出版社可以选择。但是人们仍然诟病中国的语文教材。反观美国的语文教育,根本就没有全国统一的教材,所以他们没有语文教材问题。美国学校是如何教语文的昵?

美国的语文教学,除了认识和理解单词,重点是理解句子和造句。认识单词,老师常常一带而过,因为可以查字典。理解单词的意思要靠理解句子的意思,而理解句子和造句都和语法有关。语法是理解句子和造句子的规则,因此讲解语法是老师的重点。老师一再讲解,学生反复练习,直到掌握为止。因为有语法,美国的语文老师上课常常不用教材,而是根据语法随便举例子。

中文识字也可以查字典,这点和英文差不多。但是中文理解句子意思和造句就不一样了。因为中文没有语法,中文理解句子意思靠的是约定俗成,也就是凭感觉。老师可以告诉学生这句话是什么意思,也讲解字词之间的关系,但是他们无法教学生如何判断字词之间的关系。因为字词之间的关系是由字的类别 parts of speech,和语法决定的,而中文字典不注明字的类别,还有中文的语法还没有编写出来(注)。所以中国的语文老师只给学生布置家庭作业造句,不教学生如何造句。老师会造句,但是他们说不出来如何造句。不是老师偷懒,而是因为中文没有语法,无法教。

判断中文句子的对错,没有语法作为标准,完全要凭感觉。即使是语文老师也是知其然不知其所以然。从古至今,中国的学生学习作文的法宝就是模仿前人,要靠悟性,正所谓读书要破万卷,下笔才能如有神。而美国学生学习作文靠的是语法,不需要破万卷,效率要高得多。

由于没有语法,中文不仅学习作文要凭感觉,阅读时也要靠感觉,复杂一点的内容,中文很难表达清楚表达,而且容易引起误解。中文的语法问题,要等到正式使用汉语拼音以后才能解决。现在还只能按照老规矩办,阅读凭感觉,作文靠悟性,死记硬背前人的文章。


注:parts of speech 是指英文单词的类别,也就是英文基本单位的类别。中文的基本单位是字,《新华字典》还没有给汉字划分类别。
由于有人把 parts of speech 翻译为词性,因此很多人以为”词性”是中文的 “词” 的类别。实际上 parts of speech “词性”是指英文单词的类别,和中文的词无关。

我有专文讨论,为什么文字典不注明类别,中文为什么没有语法


参考:新概念语言学

中文为什么落后?

中文为什么落后?


一百多年前,当帝国主义的大炮打开中国的大门时,中国的知识分子发现汉字落后,也就是中文落后。尤其是出过国的知识分子都有强烈的感觉,于是中国爆发了白话文运动。
中文为什么落后?当时的说法是汉字难,难学,难写。难,毋庸置疑。但是难是一种感觉,说服力不强。下面就谈谈中文为什么落后。

中文落后是和字母文字相比较的。比较的标准是什么?首先,中文和英文是什么组成的?具体地说,中文和英文的句子是什么组成的?除了标点符号,中文的句子是汉字组成的。英文的句子是单词组成的。语言学里,汉字和单词都是文字的基本单位。随着文字的发展,基本单位会增加。也就是说,基本单位数量越多,这种文字越先进。
现在中文的基本单位,也就是汉字,数量是一万个出头,根据是《新华字典》的数量。英文的基本单位,也就是单词,估计超过一百万个。因为一般的中型英文字典收录三十多万个单词,考虑到英文单词的名词,动词,形容词,副词,有不同的形式,它们实际上是不同的单词。如果用电脑统计,数量估计超过一百万个。

其次,英文有文法 grammar,中文没有文法。中文为什么没有文法?我有专文讨论,这里不详谈。
基本单位的数量,影响大脑里思维的概念准确不准确。有没有文法,影响句子表达的是否准确有效率。
基本单位的数量相差一百倍,没有文法,这两点足以证明中文比英文落后。



有关基本单位的争论,请点击本位之争
回到新概念语言学

Wednesday, April 5, 2017

两个逻辑错误

两个逻辑错误


我说不使用先进的拼音文字是中国科学落后的一个重要原因。很多热爱中华文化的人反对我的观点。下面是他们常见的两个理论:


第一个,这些人努力地找到很多中国科学落后的原因。例如,几千年的封建统治,科举制度,闭关自守,儒家学说,等等等等,不一而足。因此,他们认为汉字不是中国科学落后的原因。
找出很多原因来否认我的观点,貌似有理,实质逻辑不通。他们说的这些原因,还有待专家学者去考证。即使他们说的这些原因都是中国落后的原因,也不能证明 “不使用先进的拼音文字” 不是中国落后的原因。因为导致中国落后的原因不是一个。要证明我说的原因不对,一定要拿出证据,说出理由。所以这是一个逻辑错误,就好比你发现一个人的肺部有病,不能证明这个人的肝部没病。


第二个,这些人说,很多非洲国家都使用拼音文字,这些国家的科学并不比中国先进。
使用拼音文字是一个国家科学先进的必要条件,不是充分条件。复杂的因果关系,原因(条件)往往不止一个。要有结果,一定要满足所有的条件,有一个条件不满足,都不行。
满足了所有的条件,才能有结果;满足所有的条件才是充分条件。有一个条件不满足,都不行;这一个条件就是必要条件。


很多非洲国家都使用拼音文字,仍然落后,是因为还有其他原因导致他们落后。使用拼音文字不是满足所有的条件,他们没有满足充分条件。
中国使用汉语拼音,也不能保证中国科学一定先进。但是中国不使用拼音文字,中国科学一定落后,因为使用拼音文字是科学先进的必要条件。


回到新概念语言学


为什么中文没有文法?

为什么中文没有文法?

文法这个概念来自英文 grammar,也有人翻译为语法。不过这个语法翻译有点误导人,因为文法是用单词 word 写书面语句子 sentence 的规定。文法和口语无关。例如文法里的标点符号,不发音的字母,字母的大小写,等规定都和口语无关。
文法不是天生的,文法是人为编写的规定。1586年 William Bullokar 编写出版了英文的第一本文法书。中国也有不少人尝试过编写中文文法,都不成功。笔者曾经也有过这个打算,后来发现中文目前还不具备编写文法的条件,原因是中文的单位无法像英文那样分类 part of speech。

英文句子是 word 组成的,要编写英文语法,首先要给英文的单位,也就是word 分类。英文字典给每一个 word 都分了类。
中文的句子是汉字组成的,新华字典还没有给汉字分类。10年前,第五版《现代汉语词典》开始给汉字和词典里的词(词典词)分类,但是不解决问题。因为给词典词分类,会受到汉字类别的干扰。例如:红旗。红是形容词,旗是名词。红旗,是形容词+名词,还是一个名词?没有人知道,所以给词分类行不通。还有只给词典词分类,词典不收的词怎么办,也没有人知道。

由于白话文里有大量的词典词,光给汉字分类没有用。词又无法分类。而分类是编写语法的前提,因此中文至今没有文法。中文要想有文法,唯一的办法就是使用汉语拼音,把词典词变成可以分类的单位 word。
文法是写句子的规则,也是理解句子的依据。文法可以提高文字的效率。文法是现代文字的标志。我们要想使用现代化的中文,必须使用汉语拼音,要走世界文字共同的拼音方向。


回到新概念语言学

表意文字和表音文字

表意文字和表音文字

文字分为两大类:汉字和字母文字。我们把汉字叫做表意文字,把拼音文字叫做表音文字。言下之意是,中文表意不表音,英文表音不表意。其实英文不仅表意,而且表意比中文还准确。文字都是为了表意,世界上就没有不表意的文字。说汉字是表意文字,是废话,多此一举。

所有的文字都有读音,因此也可以说,所有的文字都表音。只不过汉字的表音功能低下。我们看见一个不认识的汉字,很难想想其读音。如果可以读半边,也常常出错。而老外碰到一个没见过的英文单词,基本上能大差不差地读出来。

拼音文字是既表意又表音的文字,汉字是表音和表意效果都不好的文字。表意文字和表音文字的说法有混淆是非的嫌疑。



回到新概念语言学

Classical Chinese and Colloquial Chinese 文言文和白话文

Classical Chinese and Colloquial Chinese文言文和白话文

Both classical Chinese and colloquial Chinese are written languages. Classical Chinese, also known as Literary Chinese, originated in ancient China, and was popular in East Asia. Literary Chinese is known as kanbun in Japanese, hanmun or gugyeol in Korean, and cổ văn or văn ngôn in Vietnamese. Nowadays, classical Chinese is a dead language, as nobody uses it anymore except historians and archaeologists.

Some linguists thought that classical Chinese represented ancient Chinese people’s spoken languages, and that it gradually separated from the spoken language. That is a theory without evidence. Classical Chinese is separated from any kind of spoken language, because it is a clipped way of writing, which is similar to writing a telegraph message. Sending a telegram was generally charged by the number of letters. To save money, people typically wrote their telegrams in a very compressed style.
Ancient Chinese people wrote characters on bamboo slips with a brush-pen. That was a time-consuming work. To save time, they had to pack as much information into the smallest possible number of characters. This is classical Chinese.

At present, Chinese people write colloquial Chinese, or modern Chinese. The colloquial must use symbols correlated to one’s spoken sounds. Otherwise it is not a colloquial language.
Although the Chinese characters in the colloquial are the same as those in the classical, they correlated to the spoken sounds. The Chinese characters in the Classical represent concepts in one’s mind directly.
Some linguists believe that Chinese characters are logograms. This statement is incorrect.
Chinese characters in modern Chinese are phonetic symbols.
For example: 东西means something instead of east and west. 马上means immediately instead of  on horseback.

Modern written language, or modern writing systems, including Chinese are all colloquial. The problem with colloquial Chinese is that many Chinese characters correlate to a spoken sound. If one Chinese character correlates to a spoken sound, the Chinese characters are equivalent to Kana, syllabic scripts in Japanese language.


文言文和白话文

文言文和白话文都是文字。文言文也叫古文。文言文起源于中国,曾经流行于东亚地区。文言文,日文叫kanbun,朝鲜文叫hanmun或者gugyeol,越南文叫cổvăn古文或vănngôn文言。现在文言文是死文字,除了研究历史和考古的人,已经没有人使用文言文了。

有的语言学家认为文言文代表古代汉语,后来才慢慢分离。这是没有根据的理论。文言文脱离所有的口语,因为它是压缩式写作,类似于发电报。发电报一般按照字的数量收费。为了省钱,人们通常把他们的电报的文字数量压缩到最少。
古代中国人用毛笔在竹简上写字,这是一个非常耗时的工作。为了节省时间,他们只能把一篇文章使用汉字的数量压缩到最少,这是中国的文言文。

中国人现在使用白话文。白话文一定要使用和你说话的声音有大致对应关系的符号,否则就不是白话文。虽然白话文里的汉字和文言文里的汉字是一样的,它们代表说话的声音。文言文里的汉字直接代表大脑里的概念。
有的语言学家认为汉字是表意符号,这种说法不正确。白话文里的汉字是表音符号。例如:东西,意思不是东和西,是东西。马上,意思不是在马背上,而是立刻。

现代的文字,包括中文在内,都是白话文。现代中文的问题是一个声音对应很多汉字。如果一个声音只对应一个汉字,白话文里的汉字就相当于日文的假名。

Saturday, April 1, 2017

本位之争

本位之争


本位是基本单位的简称。基本单位也叫最小单位,有时候也简称为单位。本位之争是指中国语言学界关于什么是 “语言的基本单位” 的争论。中国语言学界一部分人认为 “语言的基本单位” 是 “词”,简称 “词本位” 理论。还有一部分人认为是 “字”,简称“字本位” 理论。本位之争,争了几十年,至今没有定论。

本位之争是中文特有的争论,拼音文字没有这个争论。例如英文的本位是 word单词,没有任何争议。因为英文是单词组成的,严格地说应该是:除了标点符号,英文的句子是单词组成的。
同样的道理,除了标点符号,中文的句子是汉字组成的。中文的本位应该是汉字。但是现在中国语言学界的主流是 “词本位”理论,原因是某些中文语言学术语,概念混乱。

人类语言分为四种。手语,口语和书面语,这三种语言的单位是不一样的。英文 “语言的单位” 是指 “书面语言的单位”,也就是英文的单位。世界上不存在抽象的 “语言的单位”。但是中国语言学界只研究抽象的,不存在的 “语言的单位”。如果你问他们 “语言的单位” 是什么语言的单位,他们一般是顾左右而言他。因为一回答,词本位理论就不能自圆其说了。
还有中国语言学界把 “字” 和 “词” 混为一谈。他们不承认 “词” 是 “字” 组成的。有的人甚至不承认中文里有字,他们认为字就是词,这不仅违背了中文里 “两个字才是一个词” 的常识,而且是典型的概念混乱。

为什么会出现这种情况?一个原因是,由于中文停止了造字,中文出现了词典。词典不收的词,特点是 “词” 代表的意思就是两个 “字” 代表的意思。而词典收录的词(词典词特点是 “词” 代表的意思,和两个 “字” 代表的意思,风马牛不相及。例如:东西,马上。由于常用的 “词典词” 的数量远远超过了常用的 “字” 的数量,某些人就误以为 “词” 是中文的单位了。
用几个基本单位合起来代表(一个)意思的现象,英文里也大量存在。例如check 意思是检查。check in 是办理入住旅馆的手续,check out 是离开旅馆办理退房的手续。have to 意思是必须,和 have 和 to 的意思一点也不搭但是这不能改变单词是英文的单位。可能中国语言学界的人不太研究英文的结构,如果他们了解这个情况,他们就能理解不论中文有多少 “词典词”,都不影响 “字” 是中文的基本单位。

从语言学角度看,英文 word 应该翻译为 “字”。最早 word 的翻译就是 “字”。后来有人翻译为 “单词”,然后又有人简化为 “词”,于是 “字” 就和 “词” 混为一谈了。word 翻译为 “单词”,问题还不大,因为中文里没有 “单词”。“单词” 简化为 “词” 则是指鹿为马了。另外,中文的 “词” 也不能翻译为 word,而应该翻译为 phrase。

“词本位” 理论把大脑里的一个概念当作文字的一个单位。实际上大脑里的一个概念不等于文字里的一个单位,因为我们不仅用文字里的一个单位代表大脑里的一个概念,我们还用文字里的两个,或者多个单位代表大脑里的一个概念。
概念在我们的大脑里,我们无法讨论概念的单位,只能讨论文字的单位,因此文字的单位不能以大脑里的概念为单位,只能以文字的外形,也就是文字的形式为单位。

文字的单位是有形式的,一眼就能看出来。即使你不懂英文,英文的单词也很容易分辨,两个空格之间就是一个单词。中文的字,即使看不懂中文的老外,也能数清楚一句话里有多少个字。
中文的词,哪怕你学富五车,你也数不清楚。例如 “化学肥料” 是一个词,还是两个词,没有人知道。在现代汉语词典里,你可以查到 “化学”,“肥料” 和“ 化学肥料”这三个词。因为中文的 “词” 根本就不是一个单位。

中国语言学界只有放弃词本位观点,才能有正确的语言学理论。


回到新概念语言学