Saturday, May 13, 2017

振假名

振假名

振假名是给汉字注音的日文假名,类似中文的汉语拼音。

Furigana is a Japanese kana, printed next to a kanji to indicate its pronunciation.

英文:Furigana
日文:振り仮名


Friday, May 12, 2017

东亚文字的发展

东亚文字的发展

大家都知道汉字是古代中国人发明的。很多人津津乐道,汉字是历史悠久的文字。很少人说,汉字是先进的文字。因为字母文字才是先进的文字,汉字不是。
日本,韩国,朝鲜,越南都曾经使用汉字,现在他们都使用字母。韩国和朝鲜彻底抛弃汉字,日本还保留了一部分汉字。原因是日本没有被殖民过。
韩国和朝鲜曾经是日本殖民地,越南是法国殖民地,文字被强制改变。日文没有被强制改变,而是自然改变。不过现在日文已超越中文,变成了先进的文字,也就是字母文字。

中文至今还没有发展成字母文字,原因很多。其中一个原因是中国是一个多民族国家,有的民族使用不同的文字。由于政权更迭,中国曾经使用过拼音文字,例如蒙古文和满文。辛亥革命推翻了帝制,中国政治上进了一大步。但是中国文字上退了一大步,从字母文字退回到汉字白话文。
汉字白话文相当于日文万叶假名阶段。万叶假名就是日文的汉字白话文。日文后来创造了日文字母,也就是假名,日文进入了字母文字阶段。新中国成立后,制定了汉语拼音,这相当于日文的假名。现在中文像日文一样可以夹拉丁字母,但是夹汉语拼音还没有普及。等到中文夹汉语拼音,就和日文一样了。

全世界的文字最后都会发展到字母文字,无一例外。日文将来也会像朝鲜文和越南文一样抛弃汉字。日文发展的过程值得我们借鉴。日文发展的过程就是中文发展的榜样。

Thursday, May 11, 2017

What is a dialect? 什么是方言?

What is a dialect? A dialect is a different spoken language with an accent. When we clarify languages, we do written languages first. If people use the same written languages, their language is one language, No matter their accents. The spoken language of non-mainstream people is a dialect. As for the spoken languages without written language, as long as you think they are different, they are different languages. There are no workable criterion to clarify spoken languages. So the clarification of spoken languages is sociolinguistics.
Latvian linguistics, Max Weinreich said "A language is a dialect with an army and navy". I prefer "A language is a dialect without a written language, and a dialect is a spoken language with a written language."


Reference: New Concept Linguistics

什么是方言?

方言是一种有不同口音的口语。我们划分语言,首先是按照书面语划分,也就是按照文字划分。使用同一种文字的口语,不论说话带有什么口音,他们说的口语都是同一种语言。非主流口音的口语就是方言。
没有文字的口语,只要你认为不一样,就是不同的语言。没有文字的口语的划分,通常是按照人群划分。所以口语的划分是社会语言学。

拉脱维亚语言学家 Max Weinreich 说“语言就是方言有了军队”。 我认为“语言就是方言没有书面语,方言就是口语有了书面语”。



Wednesday, May 10, 2017

What is a morpheme? 什么是语素?

What is a morpheme?

According to Wikipedia, the definition of "morpheme" is: In linguistics, a morpheme is the smallest grammatical unit in a language. In other words, it is the smallest meaningful unit of a language. But, linguists regard a word as the smallest meaningful unit of a language.
If a word can be split into at least two meaningful parts which are morphemes. For example, the word “boys” can be split into two parts. Boy means a male child, and s means plural. However, you cannot find any morpheme in English sentences, because the smallest unit of sentences is a word. In sentences, boy is not a morpheme, but a word, and s does not exist.
A morpheme is a meaningful part of a word. If you regard a word as the smallest unit of a language, a morpheme is not the smallest meaningful unit of a language.



什么是语素?

根据维基百科,“语素”的定义是:在语言学中,语素是书面语里最小的语法单位。 换句话说,语素是书面语中最小的有意义的单位。 但是,语言学家一致认为 word 是书面语中最小的有意义的单位。 如果一个 word 可以分为至少两个有意义的部分,这两个部分就是语素。 例如,boys 可以分为两部分。 boy 意思是男孩,s 意思是复数。 但是,在英文句子里,你找不倒任何语素,因为英文句子里最小的单位是 word。在句子里,boy 不是一个语素,而是一个单词。至于单独的 s,句子里不存在。
语素是 word 内部有意义的一个部分。 如果你认为 word 是书面语里最小的单位,那么语素就不是书面语里最小的有意义的单位。

Tuesday, May 9, 2017

万叶假名

万叶假名 假名是日文的书写符号,也叫日文字母。假名是日本人发明的,但是万叶假名不是日本人发明的。万叶假名就是汉字,几百个从中国学来的汉字。不过日本人使用这些汉字不是代表意义,而是对应日语说话的声音,也就是写日文白话文。从万叶假名开始,日本文字进入了白话文阶段。汉字难写,日本人就简化了汉字,再合并同音字,就创造了日文现在使用的假名。从此日本进入了字母文字阶段。 万叶假名是因为一千多年前的一本诗歌集《万叶集》得名。《万叶集》相当于中国的《诗经》,是古代日本人写的日文诗歌。也就是说,一千多年前日本人就把汉字变成了表音符号,写白话文了。 白话文可以提高识字率;使用白话文是减少文盲的重要条件。什么是白话文?白话文就是读起来像说话一样的文章。白话文一定要使用和说话声音对应的符号,俗称表音符号。中文白话文里的汉字也是表音符号。如果汉字不和说话声音对应,那么这篇文章就不是白话文,而是文言文。这是很简单的道理。 不过中国语言学界很多人至今还不知道白话文里的汉字也是表音符号。有的人还在说汉字是表意文字。还有很多人只知道日本学习了中国的汉字,不知道日本人一千多年前就开始使用汉字写白话文。日本的识字率早在甲午战争之前就远远超越了中国。 其实一千多年前的唐朝,中国也开始使用汉字白话文,也叫变文。可是中国一直没有能普及白话文。没有普及的原因很多,其中一个是朝代更迭频繁。中国曾经两度使用字母文字,一次是蒙古文,一次是满文。大清王朝,中国的主流文字是满文,不是汉字。字母文字的效率远远超越汉字。 辛亥革命推翻了满清政府。由于民族主义,再加上满文在中国不普及,中国抛弃了满文。汉字文言文根本无法满足社会需求,我们只能退而求其次,开始使用汉字白话文。汉字白话文相当于日文万叶假名的阶段。 新中国批准了汉语拼音方案,汉语拼音是字母文字,相当于日文假名,英文的拉丁字母。目前中文还不是字母文字,是正在向字母文字过渡的阶段。 一百多年前,帝国主义大炮打开中国大门,许多青年人出国留学。这些人都感到了汉字的落后,提出了文字改革。汉字落后是当时知识分子的主流观点。新生事物总有人反对,当时的一些遗老遗少就说白话文不登大雅之堂。现在中国仍然有不少人反对使用汉语拼音。因为东西方冷战,五十年代帝国主义封锁中国,现在中国的知识分子,尤其是语言学界对西方文字了解不如老一代。 文化大革命,中国一片混乱。文革后拨乱反正,文字改革并没有恢复,甚至还出现了倒退,一些对语言学无知的人还在鼓吹汉字优秀。随着改革开放,越来越多的知识分子出国,等到现在这一代知识分子退出,新一代将会继续中国的文字改革。 文字是表达思想的工具。文字改革和政治无关。文字改革和弘扬中华文化,爱国不爱国,也无关。文字改革是高效率的工具取代低效率的工具。就像彩电取代黑白电视机是必然,汽车取代马车无可阻挡。只有不了解字母文字,也就是愚昧无知的人才会反对使用字母文字。


注:表音符号的说法不严谨,因为习惯,本文仍然沿用了这个概念。

回到新概念语言学

参考:维基百科万叶假名是假名的一种,借用汉字的音读与训读来表记古代日本语音节的文字。简单地说,万叶假名就是直接用汉字作为假名,但是用法与后来的假名相同。在汉字刚传入日本时,假名尚未出现,日本人选用数十个汉字表音,就是万叶假名;而后他们对这些表音汉字作了简化,以区别于表意汉字,就形成了今天的平假名和片假名。《万叶集》是使用万叶假名最有名的例子。



Sunday, May 7, 2017

文字

文字

文字通常有两个意思。文字的第一个意思汉字。古时候文和字是有区别的,现在文字已经不分了,文就是字,字也是文了。文字的第二个意思是文章。例如我们说一个人有文字功底,主要是指这个人文章写得好,虽然在特定的场合下也可能指这个人的字写得好。
中国人使用的文字叫中文,老外使用的文字是英文。什么是英文文章?我估计这个问题没有什么争议。但是,什么是英文的字?就不是人人都能回答的问题了。要回答这个问题,前提是要搞清楚中文的字是什么。
如果你把汉字看成中文的书写符号,那么英文的书写符号是二十六个拉丁字母 letter。如果你把汉字看成中文句子的组成单位(语言学术语是基本单位),那么英文句子的组成单位就是单词 word。

很多人比较中英文的优劣,但是不知道如何比,所以得不到正确的结果。
如果你比较文字书写的符号,中文有一万个汉字,英文只有二十六个字母。
如果你比较句子组成的单位,中文还是一万个,新华字典收录了一万个汉字。普通的一部中型英文字典收录四十多万单词,如果加上单词的变化,还有动词名词的单复数变化,英文单词肯定超过一百万个。随着社会的发展,英文单词还会增加。
英文二十六个字母可以组成上百万的基本单位。一万个汉字就是一万个基本单位。所以,字母的效率远远高于汉字。

很多人以为英文的单词就是中文的词,这是因为很多英文单词代表是意思,和中文一个词代表的意思相同,于是就误以为英文的单词等于中文的词了。
其实,中文一个字代表的意思,也常常和英文几个单词代表的意思相同。例如:姓 last name,兄 elder brother。我们不能因此就说,汉字等于英文的 phrase,所以英文的单词和中文的词不是一回事。
中文的词不是一个组成句子的单位。例如,你好。这个句子里只有两个字,没有词。有的人说一个汉字就是一个词,这是典型的概念不清,或者说混淆概念。

总而言之,英文的单词就是英文的字。几十年前,英文 word 就翻译为字。后来有人翻译为单词。但是一定要牢记,英文的单词不是中文的词。


回到新概念语言学

书法

书法

在中国,书法通常是指写毛笔字。老年人练练书法,据说可以健身,还可以消磨时间,是件好事。书法就是把字写的漂亮一些。漂亮是没有标准的。俗话说,情人眼里出西施。书法比赛是没有什么标准和公正可言的。
练书法要临帖。常见的字帖都是毛笔字帖。我还见过钢笔字帖,现在钢笔已经淘汰了,钢笔字帖没有用了。其实毛笔也早已淘汰,书法现在只是作为一种艺术出现。艺术是供人欣赏的,不是号召人们学习的。

艺术是一种技能skill。手工劳动有很多技能。机器一来,这些技能就被淘汰了。电脑时代,书法已经是一种没有用处的技能。中世纪西方也有人练习书法calligraphy,这些人就是经书抄写员。印刷术的出现,尤其是打字机的普及,西方书法被淘汰。美国的语文老师,不会要求学生练好书法,因为书法是没有用处的技能。
中国没有经历打字机过程,所以中国现在还有人强调书法。现在中国开始进入计算机时代,书法正在被淘汰。一些跟不上时代发展的人还时不时地鼓吹书法,不足为奇。

为什么中国会流行书法,一个原因是汉字难写,用毛笔写更难。什么东西一难,就有技术了。西方的字母简单,简单到谈不上什么技术,当然也就谈不上什么艺术了。等到将来中国使用汉语拼音的时候,毛笔书法也会进博物馆。
一个人写字的目的是为了写文章,不是为了写一个好看的字。除非你的职业是抄写员。现在还要一般人练习书法是本末倒置。看一个人的文章写的好不好,不是看他的字写得好不好。强调一个人字写的好不好,是买珠还椟。

练习书法就是模仿,照猫画虎。电脑时代号召学生练书法,毫无意义:呼吁书法走进课堂,是坑害学生。



回到新概念语言学

Saturday, May 6, 2017

六书新解

六书新解

六书是古人划分汉字的六种类型:指事,会意,形声,转注,假借。

一、象形字就是简单的图画,用尽可能少的笔画把物体的外形画出来。例如:(古体的)日月山水。原始的汉字是象形字,象形字一目了然。现代汉字早已不象形了。即使是甲骨文,里面很多汉字很多已经不象形了。甲骨文里还有不少字没有破解,就说明这些汉字不象形。全部是象形文字的文章是否是文字还是个问题,全部是象形文字的文章应该叫连环画。

象形文字基本上都是独体字。独体字是一个不可分的书写符号。指事字和会意字是不象形的表意文字。它们的区别是指事字是独体,会意字是合体。合体字是可以分开的几个书写符号合成的符号。
二、指事字是在一个独体字上加一个笔画。例如:本末刃。
三、会意字是两个或者多个独体字合起来。例如:尖众。会意字分开来写就是一个词。

四、形声字是合体字。形声字通常有两个部分,一个表示意义,一个代表声音。例如:材妈。形声字是表音符号的雏形。
五、转注字就是文章里的同义字。
六、假借字就是文章里的同音字。同音字也叫别字。

六书是古人总结的,有的现在已经过时了,例如汉字早已不象形了。现代白话文里的字大多数是形声字,指事字和会意字的数量很少。这表明现代白话文正在向字母文字,也叫拼音文字过渡。
现代白话文里的汉字实际上已经是一个表音的符号。只是由于有大量的同音字,汉字是一种效率低下的表音符号。


回到新概念语言学

Thursday, May 4, 2017

What is a phoneme? 什么是音素?

What is a phoneme?

According to Google research, the definition of "phoneme" is: any of the perceptually distinct units of sound in a specified language that distinguish one word from another, for example p, b, d, and t in the English words pad, pat, bad, and bat.
In fact, a phoneme is not any of the perceptually distinct units of sound in a specified language that distinguish one word from another. We distinguish words by letters instead of phonemes. If that is the case, then we cannot explain why there are homonyms, for example, to, too, and two.
Phonemes are represented by International Phonetic Alphabets, rather than English letters.


Reference: New Concept Linguistics

什么是音素?

谷歌给“音素”的定义是:语言中用于区分单词的,感知上的不同声音单元,例如英文单词pad,pat,bad,bat中的p,b,d,t。
实际上,音素不是语言中用于区分单词的不同声音单元。我们区分单词使用的是字母,不是音素。如果是使用音素,那么我们就无法解释,为什么会有同音单词,例如 to,too,two。
音素是国际音标代表的读音,不是英文字母代表的读音




What is a letter? 什么是字母?

What is a letter?

According to Google research, the definition of “letter” is: a character representing one or more of the sounds used in speech; any of the symbols of an alphabet.

A letter is any of the symbols of an alphabet. That is true. However, a letter is not a character representing one or more of the sounds used in speech. If so, what are silent letters, for example a, b, c, and d in the English words logically, debt, muscle, and sandwich.



什么是字母?

谷歌给“字母”的定义是:代表口语中声音的符号; 字母表里的所有的符号。
字母确实是字母表里的符号。但是,字母不是代表口语中声音的符号。如果字母是代表口语中声音的符号,那么英语单词 logically, debt, muscle, sandwich 中的不发音的字母 a,b,c,d 代表什么?


参考:新概念语言学