汉字

出自协作百科(Knowtive),人人可以编辑的世界百科全书!

跳转到: 导航, 搜索

汉字,是汉字文化圈内使用甚广的一种文字,属于表意文字书写系统的词素音节文字。汉字为上古时代的中国人所创製,信史可追溯至约公元前2000年商朝的甲骨文。汉字在古代已发展至高度完备的水准,不止中国使用(中文),更在很长时期内充当东亚地区唯一的国际文字,二十世纪前还是日本朝鲜越南等东亚和东南亚国家官方的书面规范文字。

现代汉字,在中文体系大致分成简体中文正体中文两个体系。前者主要用于中国大陆马来西亚新加坡以及东南亚华人社区,而后者主要用于台湾(又称繁体中文)、香港澳门以及欧洲北美的华人圈,一般来讲,两个体系的使用者都能看到另一体系的文字。日本韩国则是另行各自製定了官方的汉字使用规范,但汉字在越南和朝鲜已不再具有官方规范地位。

目录

[编辑] 汉字的称谓

汉字一词早出自《北史》卷九本纪第九,「章宗一」:「十八年,封金源郡王。始习本朝语言小字,及汉字经书,以进士完颜匡、司经徐孝美等侍读」。

金史》也出现多次,如:「女真初无文字,及破辽,获契丹、汉人,始通契丹、汉字,于是诸子皆学之」。 「长子布辉,识女真、契丹、汉字,善骑射」。

清朝前期,政府官方文字是满文,当时已用汉字一词称呼中国传统的文字。更之前的古代中国,因为没有与他国区分的必要,多称呼为「字」或「文字」。

直到目前为止,台湾负责文字政策的教育部,仍不使用汉字这个词,而称之为「国字」,例如《国字标准字形表》等。

另外,日本人也称呼为「汉字」,以别于根据汉字改制的「假名」和西洋舶来的「罗马字」(拉丁字母)。在韩国,汉字则与训民正音谚文)相区别。

[编辑] 汉字的特点

汉字的特点有以下几项:

  1. 字根组字:以本身即有意义的869个声母及265个形母的象形、指事字为最基本字根部件,例如「日」、「月」,组成各种複合部件(如「明」,可再堆迭组合成汉字盟、萌、曌等字)、以及一般认知的字(「明」本身就是一个字)。《参考汉字的字形与编码第三页
  2. 表意:承上,字根本身表义,多个字根合成新义,且空间的配置对字义有影响。(朱邦复先生的字易即是探讨此)
  3. 相容并蓄:各语言、各领域应用可以六书基本规则,可贴近自身领域、地域所需组出所需要之字。
  4. 书同文:汉字本身不完全表音,不同方言、甚至语言,仍可书同文,以文意、字义来互相瞭解。
  5. 独有的文化如对联书法艺术等。

[编辑] 汉字的历史

汉字是世界上最古老的三大文字系统之一。其中,古埃及圣书字两河流域苏美尔人楔形文字已经失传,仅有中国的汉字沿用至今。

传说中,汉字起源于仓颉造字黄帝的史官仓颉根据日月形状、鸟兽足印创造了汉字。从历史角度来看,複杂的汉字系统不可能由一个人发明,仓颉应该是在汉字的搜集、整理、统一上做出了突出贡献,所以《荀子‧解蔽》中记载「好书者众矣,而仓颉独传者,一也」,而汉朝淮南子一书更描述仓颉的贡献为「天雨粟,鬼夜哭」:描述文字的发明有如天上降下五穀广披大众,使得资讯透过文字能传载给任何人;而仓颉之前已去逝的人(鬼)都痛哭没有办法享用到文字的好处。

有观点认为《周易》中的八卦对汉字形成有较大影响,但支持者甚少。

[编辑] 字形史

[编辑] 原始文字

文字发明前的口头知识在传播和积累中有明显缺点,原始人类使用了结绳、刻契、图画的方法辅助记事,后来用特徵图形来简化、取代图画。当图形符号简化到一定程度,并形成与语言的特定对应时,原始文字形成。

1994年湖北杨家湾大溪文化遗址出土了大量陶器,其上170多种符号中,部分特徵与甲骨文有较大类似之处。这一发现将原始汉字的形成过程推定到距今6000年以前。此外,山东大汶口出土的陶器上的象形符号,西安半坡彩陶上的几何符号河南贾湖距今8000年前龟甲上的几何符号贾湖契刻符号等,都可能是原始文字形成中(或形成前)不同阶段的表现。

但是,商朝以后的汉字和这些几何符号是否一脉相承?这个问题还在争议中。许多学者提出,这些符号不一定是汉字的前身,甚至不能绝对肯定是文字符号。

[编辑] 象形指事时代

甲骨文小篆,汉字经历了从钜细靡遗描绘意象的方式往简化成容易纪录刻画的方向变迁,字形逐步脱离事物的具体形象。这一时期的汉字也称为古文字。

时期的甲骨文已经是一种比较完整的文字体系。在已发现的4500多个甲骨文单字中,目前已能认出近2000字。与甲骨文同期,青铜器上铸造的文字称为金文或钟鼎文,西周时期的《散氏盘》、《毛公鼎》具备很高的史料和艺术价值。

春秋时代开始,各地诸侯相争,而原本周文化独尊的局面逐渐破坏,各地区文化开始有"在地化"的改变趋势。到了战国时代以后,这种情况更明显,在文字使用方面可以粗略依照地域分为五大系统:东方齐系、东北燕系、南方楚系、北方晋系和西方秦系文字,各系统的文字大体上相近,只有小部份文字有所差异,因此彼此文书往来并没有太大问题。Template:Fact

秦始皇统一中国后,李斯大篆(秦系文字)和六国古文的基础上,进行规范和整理,制定出了小篆作为秦朝的标准书写字体,统一了中国的文字。小篆呈长方形,笔画圆润流畅。

小篆解决了各国文字间出现大量异体字的情况,「书同文」的历史从此开始。文字的统一有力促进了不同语族间的文化传播,对中国的统一以及东亚各国的文化交流发挥了重要作用,为世界文字史所罕见。

汉字的发展经历了许多不同的演变。初期汉字系统的字数很少,以象形与指事的独体字为主,大量事物以通假字来表示,使文字表述存在较大歧义。例如先秦的「文」,兼有后世的新字「纹」的功能,表示一组成各种事务的规律、型式,不单指文字的文,也包含野兽身上的花「文」、布上面的织「文」、手指的指「文」等数种含意。

除了「凹」、「凸」等特例直到唐朝才发明,大部分的象形指事字很早就已经定型,成为下个时代形声会意组字法的基础。

[编辑] 形声会意时代

为了能更精准的表述,最早从小篆的时代开始一直到现代,因应随文明发展不断增加的新事物,以基本的象形指事字为基础,发展了形声、会意的组字法,以组合方式,来细化大量的字出来,使得文书上记载越来越精密,到今天一直为造字的主力。

例如:

  • 最早海上的交通工具就只有:「舟」一种;但演化到现在,细分成「舨、舟、艇、船、舰」等不同小大规模与形制的「舟」。
  • 一开始金属只有「金」一种,但随着冶金技术的发展,对于金属的知识更加丰富,「金」被细化成「金」、「银」、「铜」、「铁」等等。
  • 隋文帝杨坚原为-{随}-国公,但因「-{随}-」字的「辶」有不稳定之意,故去掉「辶」,而造「隋」字作为国号
  • 唐朝武周时,武则天根据「日月当空」之意而造字「曌」(同「照」字)作为她的名字。同时发明的文字还包括圀、瞾、囝等。人称则天文字
  • 五代刘龑取「飞龙在天」之意创了自己名字内的「-{zh-hans:䶮;zh-hant:龑}-」字。
  • 在近代,由于大量西方知识的涌入,也造了许多字。例如随着「Beer」传入中国,如何用汉字表达是一个问题,最初译为皮酒,后觉不妥,于1910年左右创造了「啤」字——译为「啤酒」。(而在同一时期,朝鲜半岛与日本採用了「麦酒」这个名字作为「啤酒」的译名。)
  • 近代化学名词在翻译成中文时,也用了形声会意造字法,造了一系列的新字,例如「溴」、「钸」元素与「醇」基、「醛」基等有机化合物名词。另外化学上还有很多将两个字的部分凑合起来表示新的意义的字,其发音也是两字发音凑合而来。如“”(碳氢)、“”(碳氧)、“”(氢硫)、“”(氢氧)等。
  • 为了表示英制的单位,还造了一些多音节的字,如浬(海-{里}-)、嗧(加仑)、瓩(千瓦)、呎(英尺)等。不过这些多音节的字在1977年7月20日大陆中国文字改革委员会和国家标准计量局所发的《关于部分计量单位名称统一用字的通知》中被淘汰,在大陆地区已不再使用,但香港澳门由于当时乃它国的殖民地,所以并未受到简体字的影响;而台湾则因是不同的政体也未受简体字的影响。

有了造好的象形、指事的独体字为基础,使用形声、会意组字法随着文明的发展,组出表示新事物的合体字,这使得记载为文时,以前述的各种不同的船来说,只要看一单位的字形,我们就知道指的是那一种「舟」,这样辨识理解的效率非常高;反过来,以组词的方式就要看过前后文(或短或长)有其他哪些字才能判断正确的意义,较缺乏辨识效率,但方便口语沟通(汉字同音字太多,听觉不易辨识,解法一为组词,二为如韩日语数音为一字:「浬」发音为海-{里}-)。

[编辑] 字体史

小篆笔画以曲线为主,后来逐步变得直线特徵较多、更容易书写。到汉代隶书取代小篆成为主要书体。隶书的出现,奠定了现代汉字字形结构的基础,成为古今文字的分水岭。

汉代以后,汉字的书写方式逐步从木简和竹简,发展到到在帛、纸上的毛笔书写。草书楷书行书等字体开始出现,不仅满足了公文和日常需要,还形成了浓郁东方特色的书法艺术。古代印刷术发明后,出现了用于印刷的新字形宋体,传入日本,衍生出明体(可能是在明朝传入。微软作业系统预设字形,细明体即为之),在现代又陆续出现了黑体、彷宋体等字形。

[编辑] 汉字的语文知识

[编辑] 造字原理

六书是汉字组字的基本原理,在周礼中就有提到了六书,只是没有说明具体内容。到了东汉,许慎在《说文解字》中,详细阐述了「六书」这个汉字构造原理:象形指事会意形声转注假借。近代中国大量推行简体字,又为造字原理加了第七书 - 简化.

象形
这种造字法是依照物体的外貌特徵来描绘出来,所谓画成其物,随体诘诎是也。如日、月、山、水等四个字,最早就是描绘日、月、山、水之图桉,后来逐渐演化变成现在的造型。
指事
这是指表现抽象事情的方法,所谓「各指其事以为之」是也。如人在其上写作「上」,人在其下写作「下」,有人称为抽象的象形。
会意
这个造字法,是将两个字根组合起来,使衍生出新的含意。如「日」和「月」组起来,就是日光加月光变成「明」。「人」字和「言」字合成「信」字,意思就是人过去所言;有信,就是这个人都很遵守自己说过的话。
形声
此乃文字内以特定形状(字根)表特有的音。例如:胡,这个字也可为一个声符,结合不同的属性部件,表不同意义如蝴、湖、葫、瑚、醐等,而以同样的发音元素(也有的是完全同音),表达不同的事物。但形声字,也因古今语言音韵变迁,不少古代同类形声字在今天的官话已无共同音素了,如过、蜗。
转注
这是用于两个字互为注释,彼此同义而不同形,汉代许慎解释道:「建类一首,同意相受,考、老是也。」,这怎么说呢?此二字,古时「考」可作「长寿」讲,「老」、「考」相通,意义一致,即所谓老者考也,考者老也。诗经的《大雅·棫朴》亦云:「周王寿考。」。苏轼的《屈原塔诗》也有古人谁不死,何必较考折。一语。其中的「「考」皆「老」意,特别注意的是,后代的文字学家针对许慎的前述的定义也作了大量的解释。其中包括「形转说、声转说、义转说」三类,只是这三种说法有人认为不够全面,当代古文字家林沄先生也有解释说「转注」就是一个形体(字根)记录两个读音和意义完全不同的两个词。例如「帚和-{妇}-」与甲骨文中的「母和女」等等。
假借
这法简言之,借用一字,去表达别的事物。一般来说,是有一个无法描述的新事物,就借用一个发音接近或是属性近似的字根,来表达这个新事物。例如:「又」,本来是指右手(最早可见于甲骨文),但后来被假借当作别的意思。闻,本意是用耳朵听东西的意思。例如《大学‧第七章》中有「视而不见,听而不闻,食而不知其味」,但后来被假借成嗅觉的动词(不过也有人认为这是错用)。

(其中「转注」「假借」两项的意义,至今争讼不休,尚无令人满意的说法。)

简化
减少笔划.

总结以上古代六书,前两项,「造字法」也;中两项,「组字法」也;后两项,「用字法」也。这六个原理,是古代文字学学者归纳出来的字学理论。其所含汉字构成法则,是长期演化而成的,不是任何一个人独创的。第七书简化因为在近代中国大量使用而显得重要,不能不提.

[编辑] 汉字结构

汉字由一个或以上的字根以二维方式(欧语系是一维文字)在特定的正块空间内组成,因此有方块字的别称。

所谓的「文字」,古代是两个东西,东汉许慎《说文解字》叙:「仓颉之初作书,盖依类象形,故为之字,其后形声相益,即谓之文。」;宋郑樵《象类书》云:「独体为文,合体为字」。这个,现代的术语叫作字根部件,汉字是以意念的表达需要组合所需部件于一方块,合成千千万万的字。

[编辑] 基本字根部件

郑樵的搜集,以形为主的文有三百三十个,称为形母,以声为主的文共有八百七十个,称为声母,合计一千二百文。

但郑樵的声母形母已经失传,近代周何教授依据中文资讯交换码(CCCII)第二集的22394字的字集重新整理的结果,得出汉字有869个声母及265个形母,共计1134个

  • 形母:郑樵的搜集,有三百三十个。现代的研究整理,是265个。
  • 声母:郑樵的搜集,有八百七十个。现代的研究整理,是869个。

[编辑] 特点

  1. 单一字内就有很高的讯息密度,在表达同样的事物时,可比表音文字用更短的篇幅表达同样的讯息,而且更为精密,鲜需依赖前后文的情境理解某字含意(此指传统字而言,不适当的简化字有跟表音文字一样的情形),所以汉字的阅读效率很高。
  2. 所有汉字乃由1134个字母为基本字根,如金、木、水、火、土、爻、又、心、攵、乂、弋等,像积木一样组合而成。以意念的联结组合各种成各式各样的字,表达各种意涵。
  3. 如不认识一字之意,可拆字,从组成字根以及空间的配置推断出其字义。当时代演进出现新事物,难以词的方式来表达或是缺乏效率时,也能以字根组合原则,合成出新字来用,例如'铀'字,就是近代为了表达新发现的化学元素而新造的字。
  4. 汉字组成的字根空间配置对字义有影响:如同样是「心跟亡」的合体,左右排是「忙」,上下排是「忘」,排列不同,导致不同涵义;文字右边有「乂」这个字的字根,这表示右手(手的左偏旁表示左手)持某物进行某事(金文、甲骨文考古的发现),如果右手拿斧头就变成「攵」,有这个字根的,字本义几乎都是有针对性武力的使用或强制维护一个秩序相关的事物,例如攻、败、收、散、政、牧、敕、赦、放等字,跟一个秩序的建立消灭、维持有关。

[编辑] 字形(汉字书法

汉字有各种不同的书写方式,即有不同的字体;不同的字体,汉字的字形不一样。

规整的字体(如楷书宋体隶书篆书等)书写下的汉字是一种方块字,每个字佔据同样的空间。汉字包括独体字和合体字,独体字不能分割,如「文」、「中」等;合体字由基础部件组合构成,佔了汉字的90%以上。合体字的常见组合方式有:上下结构,如「笑」、「尖」;左右结构,如「词」、「科」;半包围结构,如「同」、「趋」;全包围结构,如「团」、「回」;複合结构,如「赢」、「斑」等。汉字的基末级部件(或称基础部件)包括独体字、偏旁部首和其他非字部件。

末级部件,再行拆解,及为汉字的最小构成单位:笔画

书写汉字时,笔画的走向和出现的先后次序,即「笔顺」,是比较固定的。基本规则是,从上到下,从左到右,先横后竖,先撇后捺,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。

[编辑] 读音

汉字是多种语言的共同书写体系,每个字代表一个音节或数个音节(视语言而定)。此外念法上在日语以及各汉语方言中,读音有「音读」和「训读」之分。

中国大陆标准语普通话与台湾的国语,皆由一个声母、一个韵母声调确定,实际用到1300多个音节。由于汉字数目庞大,因而有明显的同音字现象;同时还有同一字多音的情形,称为多音字或破音字。这一情况在各种汉语中是普遍存在的。

日语,在汉字的发音上,有着多音节,如国(こく)、肉(にく),也有单音节如空気(空气)的気(き,Ki),此外有许多字因训读、音读,在不同状况,发不同音的情形。

朝鲜语中汉字大致为一字一种发音,没有训读。


[编辑] 注音

最早的注音方法是读若法直注法。读若法就是用音近的字来注音,许慎的说文解字就採用这种注音方法,如「埻,射臬也,读若准」。 直注法就是用另一个汉字来表明这个汉字的读音,如「女为说己者容」中,使用「说者曰悦」来进行注音。

以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以发挥注音的作用,例如「-{袜}-音-{韈}-」等。

魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以透过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如「练,朗甸切」,即「练」的发音是「朗」的声母与「甸」的韵母及声调所拼成。

近代以来,又发展出了彷汉字形式的注音符号及众多拉丁化拼音方式。注音符号一直都是台湾教学的一部分,学生在学习汉字前先要求必需掌握。而目前中国大陆最为广泛使用的是汉语拼音

由于汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方世界一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度,必须进行专门的汉语音韵学才能推测它们在上古汉语中古汉语的发音。例如「庞」从「龙」而得声,但今日北京话前者读「páng」(ㄆㄤˊ),后者为「lóng」(ㄌㄨㄥˊ)。


[编辑] 汉字与词语

表意上,汉字是汉文组成的最小单位,大半汉字就可以为独立表意单位,为单字词。随着语言文字的发展,有大量惯用的双字词甚至多字词出现,近代白话尤其众多,主要分为

  • 同义複词:如遭遇(二字同义)
  • 反义複词:一笑泯恩仇(两字反义,两个意思都保存)
  • 偏义複词:不吝惜「去留」(两字反义,但只有「留」的意思)

不过,从另一方面来说,准确掌握为数众多的複合词的搭配形式和用法也成了一种负担。汉语常用词彙约为几万条,总词彙量约有百万条,虽然从数量上来说显得有些令人望而却步。

而从古文的角度来看,多用字本义,比起过度依赖词语,会来的精确且有效率,例如朱邦复先生就提倡精确使用「字」的复古作为。

[编辑] 汉字的数量

汉字由于是开放集合,数量并没有准确数字,日常所使用的汉字约为几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字时已到99%,简体与繁体的统计结果相差不大。

汉字数量的首次统计是汉朝许慎在《说文解字》中进行的,共收录9353字。其后,南朝顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字。此后收字较多的是宋朝官修的《类篇》,收字31319个;另一部宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书。

另外有些字典收字也较多,如清朝的《康熙字典》收字47035个;日本的《大汉和字典》收字48902个,另有附录1062个;《中文大字典》收字49905个;《汉语大字典》收字54678个。21世纪已出版的字数最多的是《日本今昔文字镜》,收字15万个。

本世纪所新创的,还有第一批简化字后跟第二批的「二简字」,不过二简字已被大陆官方废除,只有少数字在社会上流行。

在汉字计算机编码标准中,目前最大的汉字编码是CNS11643,目前(4.0)共收录可考证之繁简、日、韩语汉字共76,067个,但并不普及,只有在户政系统等少数环境使用。台港民间通用的大五码收录繁体汉字13053个。GB 18030是中华人民共和国现时最新的内码字集,GBK收录简体、繁体及日语、韩语汉字20912个,而早期的GB 2312收录简体汉字6763个。而Unicode中日韩统一表意文字基本字集则收录汉字20902个,另有两个扩展区,总数亦高达七万多字。

初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步複杂、字数大量增加的阶段。过去在汉字组成基本因子(前述字根部件)研究与教学上落后,造成学习上必须逐字学习难以举一反三,汉字数量越多学习越困难,组建新字的风气日趋保守,也没有相应的资讯处理技术,于是有许多单一的汉语意义是以词表示,例如常见的双字词,所以近代书写的发展多朝向造新词而非造新字。

[编辑] 笔划最少与最多的汉字

最简单的汉字只有一划,但却不止一个字:除了「一」字以外,「丨」、「亅」、「丿」等都是汉字,而且都有各自的读音。而现时已知最多笔画的汉字,应该是由3个「-{龙}-」字和3个「-{云}-」个组合而成,共有96划,这个字收录于日本的TRON[1]计划内。其次是由四个「-{龙}-」字组成的「Unihan|2A6A5」字,有64划,收录于统汉码;再之后的是由四个「雷」字组成的字,有52划,收录于《说文解字》。

[编辑] 字形

由于各地对字形的使用并没有统一,加之大陆地区使用“新字形”,便产生了许多差异。例如“刃”及“角”,在各地写法都不尽相同。又如“口”字,台湾规定最后一横要写得超过上面的横折露出来一点,其他地区的写法却是不出头的(注意右图“-{启}-”字的“口”)。

[编辑] 汉字的影响

[编辑] 衍生字

汉字书写体系也是世界上最主要的基础文字之一,在汉字的影响下,还产生过契丹文女真文西夏文古壮字(方块壮字)、古白字(方块白字)、古布依字(方块布依字)、字喃等文字。但它们都因各种原因而消亡,而汉语中的女书,如今也无几人能识。日语的假名(仮名)在创製时也大量受到汉字字形的影响。

此外如蒙古文满文锡伯文等也是在汉字书写方式和书写工具的影响下,将从右向左书写的源自察合台文的书写方式改为从上到下书写,文字的结构也随之有所变化。

[编辑] 汉字文化圈

汉字是承载文化的重要工具,目前留有大量用汉字书写的典籍。不同的方言、甚至语言都使用汉字作为共同书写体系。在古代日本朝鲜越南,汉字都曾是该国正式文书的唯一系统,因而汉字在历史上对文明的传播分享有着重要作用。

「汉字」发音
中华区
普通话/国语 hànzì
粤语 hon3 zi6
闽南语 hàn-jī
朝鲜半岛
韩语 hanja
日本
日语 kanji
越南
越南语 hán tự

由于汉字和发声的联繫不是非常密切,比较容易被其他民族所借用,如日本、朝鲜半岛和越南都曾经有过不会说汉语,单纯用汉字书写的历史阶段。汉字的这个特点对于维繫一个文化圈—一个充满各种互相不能交流的方言群体的民族——发挥了主要的作用。

汉字对周边国家的文化产生过巨大的影响,形成了一个共同使用汉字的汉字文化圈,在日本越南朝鲜半岛,汉字被融合成它们语言的文字「汉字(かんじ)」、「汉字(한자)」、「汉字(hán tự)」。直到现在,日语中仍然把汉字认为是书写体系的一部分。在朝鲜越南,已经完全不再使用汉字;在韩国,汉字的使用在近几十年来越来越少;但是由于朝鲜语/韩语中使用了大量的汉字词彙,并且重音现象严重,所以在需要严谨表达的场合时仍然会使用汉字。虽然在通常情况下人名、公司机构名称等均使用韩文书写,不过大多数的人名、公司机构均有其对应的汉字名称。

日本 
汉字于公元3世纪经朝鲜半岛辗转传入日本。二战后日本开始限制汉字的数量和使用,颁布了《当用汉字表》及《人名用字表》等,其中简化了部分汉字(日本新字体),不过文学创作使用的汉字,并不在限制之列。日本除从中文中传入的汉字外,还创造和简化了一些汉字,如「-{辻}-」(十字路口)、「-{栃}-」、「-{峠}-」(山路)和「-{広}-」(广)、「-{転}-」(转)、「-{働}-」(劳动)等。详见:日文汉字
朝鲜半岛 
公元3世纪左右,汉字传入了朝鲜半岛,朝鲜语/韩语曾经完全使用汉字来书写。相传薛聪在当时发明了吏读,把朝鲜语用同音或同义的汉字来表示。例如:「乙」字被用来表示韩语中的后缀「-l」。由于有不少发音都没有对应的汉字,所以朝鲜半岛的人民又运用组字法,把两个或多个汉字合组成为一个新的吏读字。相传后来的契丹小字就是受到吏读字的影响。1444年,朝鲜世宗大王颁布《训民正音》,发明了谚文与汉字一起使用,但当中有不少部件仍然有昔日吏读字的痕迹。现在的大韩民国虽禁止在正式场合下使用汉字,并停止了在中小学中教授汉字,不过汉字在民间仍在继续使用,且可以按照个人习惯书写,但是现在能写一笔漂亮汉字的韩国人越来越少。朝鲜民主主义人民共和国1948年废除了汉字,仅保留了十几个汉字。详见:韩文汉字
越南 
公元1世纪汉字便传入了越南越南语也曾完全使用汉字做为书写用文字,并在汉字的基础上创造了喃字,但是由于书写不便,汉字仍是主要的书写方式。1945年越南民主共和国成立后废除了汉字,使用了称为「国语字」的拼音文字。现在的越南文已经看不出汉字的痕迹了。详见:喃字儒字

[编辑] 汉字民俗

中国许多民俗都与汉字有关,例如:

  • 射虎:就是猜灯谜,也叫打灯虎,与汉字有着密切关係。旧时的射虎大致可以分成两类,一类是文人射虎,谜面深奥谜格複杂多样谜底多为四书五经中的原句;一类是市井灯谜,谜面谜底均很通俗。射虎是元宵节的一项重要活动。
  • 合体字:中国民间常将一些带有吉祥含义的短语合写为一个字,以祈求吉祥,常见的合体字如「招财进宝」、「双喜」等。
  • 谐音字:华人喜欢利用汉字的同音特点用谐音字取吉祥之意,比如蝙蝠的「蝠」谐音为幸福的「福」,于是庙宇中常见石柱刻有蝙辐。而走兽的「兽」亦谐音为「寿」。
  • 九九消寒图:中国北方地区的一项民俗在每年数九的季节写下「-{庭前垂柳珍重待春风}-」九个双钩字,这九个字每字九划,从冬至开始每天根据天气为一个笔画填充颜色,到数九结束完成全图。
  • 花鸟字:一些民间艺人用一些花卉和禽鸟的图桉拼写成汉字,近看细节是一些花鸟画,远看整体却是一幅字,这种字画结合的艺术形式被称作花鸟字,是一种多彩花鸟虫鱼组合书法。在中国,只有在春节庙会中,和一些节日集会中才可以看到。花鸟字在英美等西方国家也成为一种街头艺术。早期的鸟字画大多写的是一些吉祥话语,以祈求吉利,现在在庙会见到的鸟字画则以书写顾客的姓名为主,购买者的目的也由祈求吉祥逐渐转变为猎奇。

[编辑] 汉字艺术

汉字独特优美的结构,书写的主要工具——毛笔有多样的表现力,因而产生了中文独特的造型艺术——书法。而篆刻是和书法相关的艺术,用刀在石材上凋刻出篆字作为印章。

[编辑] 近代以来汉字的变化

[编辑] 组字

汉字历史上是不断在组新字的,目前所见的各种汉字并非一口气完成在某一年代,而是应时代需要渐渐发展成今的面貌。例如:「人」这个字商朝就有了,凹凸这二字则是在唐朝的时候才出现。

此外不同的行业有不同的用字需求因而组字。例如传统国乐在记谱上会用到减字谱工字谱,台湾政府各专门机关也有各自的特有用字:如户政用字等等。

组字往往比组词在表意上更有效率,但组字组得太複杂又适逢变成常用字的话,就会衍生简化的努力。

[编辑] 简化

汉字书写複杂,传统印刷更複杂。所以自古以来就已经有许多的简字,但多半是人民私下使用,正式的文书仍然是用繁体字,而虽然活字印刷是中国人发明的,但由于汉字的结构特性,活字印刷帮助有限。

近代,处于强势地位的西方文明开始进入东亚,整个汉字文化圈的各个国家中纷纷掀起了学习西方的思潮。当中有人坚持汉字的传统,但亦有不少人鼓吹放弃使用汉字。这些鼓吹放弃汉字运动的立论「汉字落后论」,内容为:跟西方拼音文字相比,汉字是繁琐笨拙的。尤其在近代个人电脑还没有普遍化以前, 因为汉字不能透过打字机书写,而必须使用巨型的排版房的铅字,也就是说汉字已成为教育及资讯化上的瓶颈。但是近代个人电脑普遍化以后,汉字能透过个人电脑输入,此种论述已经不具说服性.许多使用汉字国家以政治推行的方式,进行了不同程度的汉字简化,甚至还有完全拼音化的尝试。日本的使用假名方桉以及汉语多种拼音方桉的出现都是基于这种考量。

中华人民共和国1956年1月28日发布《汉字简化方桉》,1964年5月审定通过《简化字总表》,1986年经少量修订后重新发表,一直在中国大陆使用至今。1977年,曾公布《第二批汉字简化方桉(草桉)》,发布「二简字」,试用一段时间(约八年)后因为字形过于简单且溷乱而于1986年正式宣布废除。新加坡马来西亚分别发布了同《简化字总表》相同的简化字表。

日本、韩国也有各自的汉字简化,但都没有中国简体字激进。

[编辑] 拉丁化

近四百年来,西方人和华人本身都提出了很多汉字的拉丁化方桉,主要包括:

现在,汉语拼音方桉是使用最广且被联合国接受的汉字拉丁化方桉。

「汉字落后论」的说法存在了很长时间,认为汉字是教育及资讯化的瓶颈,并有「汉字拉丁化」甚至废除汉字的推动行为。现在一般认为汉字也有突出优点,初始学习难度虽大,但掌握常用字之后就不会有类似大量英文单词的继续学习问题,且其表意特性也能充分训练人脑的学习能力。在电脑输入问题获得解决后,「汉字落后论」及「汉字拉丁化」在现实上已逐渐被大多数人抛弃。

[编辑] 异体字整理

除了造字以外,另外还有许多异体字。他们是意义和读音完全相同,但写法不同的字。有的是因为历史缘故,有的是名人造字,如“和”与“龢”,“秋”、“秌”和“龝”等。

中国大陆于1956年公布整理异体字表,废除了大量异体字,但后来因为各种原因恢复了部分异体字。如“于”曾被当作“于”的异体字废除掉,但在1988年发表的《现代汉语通用字表》中又恢复成为规范字,因爲姓氏中于、于同时存在,不宜合併。另外,不同地区对异体字的取捨有所不同,例如:韩国就以汉字各种异体字中最早出现的样式为标准写法。所以,在韩语汉字的标准中,取“甛”而不取“甜”、取“幇”而不取“帮”、取“畵”而不取“画”。


[编辑] 计算机处理

由于打字机键盘在设计时本身没有考虑汉字输入的问题,输入汉字往往比输入拼音文字困难。汉字没有经过中文打字机的普及,直接进入了电脑中文信息处理阶段。在电脑发明初期曾引起汉字能否适应电脑时代的问题,支持汉字拉丁化的学者甚至以此为理据。

随着各种中文输入法的出现,汉字的计算机输入、存储、输出技术得到了基本解决,大大提高了中文写作、出版、信息检索等的效率。目前中文输入法有上千种之多,主要包括表音输入和表形输入两类,也有两者兼之的。汉字的语音输入、手写识别和光学字符识别(OCR)技术也已得到广泛应用。

如收录数千字的GB 2312(中国大陆)、Big5CNS 11643(台湾)、HKSCS(香港)、JIS(日本),以及收录两万多字的GBK(中国大陆)、国际标准UnicodeISO 10646等等。在这个过程中,因为技术及其他种种因素,在收录字数,及收录字体等方面或做不同层次的调整。

中国政府为了解决邮政,户籍整理等领域用字的迫切需要,于2000年实行了一个新的汉字编码的国家标准《汉字编码字符集-基本集的扩充》GB 18030-2000,共收汉字27484个。并强制所有在中国售卖的计算机产品必须支持这个新的国家标准。

[编辑] 汉字编码

为进行信息交换,各汉字使用地区都制订了一系列汉字字符集标准。

  • 国标码(“国标”是中华人民共和国国家标准的简称)在中国大陆使用。GB 2312收录6763个汉字,GBK收录20912个汉字,最新的GB 18030收录27533个汉字。
  • Big5码。收录13053个汉字。在台湾和香港使用的一字节或两字节编码。
  • Unicode:中国政府不接受。中国政府要求在中国大陆出售的软体必须支持GB 18030编码。
  • 在国际通信化和软体设计领域,中日韩统一表意文字编码收集了汉语日语朝鲜语/韩语中的汉字集。

[编辑] 动态组字

到目前为止流通的各种汉字编码规格,过去号称万码奔腾,是在没有文字学专家的指导下,科技人员以欧美处理字母的作法在处理汉字,汉字就因此被西方资讯技术所束缚,走向无法造新字,只好固定字数,弱化文字本身表义机能,把字当作字母来组词以表达事物。结果製作、运行成本远高于表音文字不说(汉字常用字就一万五千多,最简化也要六千多),汉字的诸多形、音、义等问题更不能很好的解决,中文还因此变成了一个停滞发展的文字系统。反观英文可是仍然不断在演化,例如「Central Processing Unit」一开始是很複杂的一个词,但是后来为了频繁的使用需要,缩写为:「CPU」;在中文全名是「中央处理器」,无法找到合适的中文缩写,不同科技产业都有如此表达新技术名词的痛苦,这使得欧语文大量侵蚀了中文。

经过数十年的研究,两岸各有不同的人研究出动态组字这新兴技术,这技术简单的来说,就是藉由资讯科技重新解放汉字原有的生命力:任何汉字都可以由基本的百来个字根(也就是汉字的字母)以二维编码的方式即时合成为汉字,简单的理解,就以前面的中央处理单元来说,可以形声的原则创新:「电心」,既有效率,且本身表意,学过百来个字根的,就可以知道它代表甚么,再赋予一个读音(通常与心同音),如此这般以此类推,就可以一次解决汉字形音义以及成本高的等等问题,使汉字与西文站在同样的资讯平等点,甚至因表意的特性比起西文更佔新时代资讯处理的优势(比较好做电脑理解)。

[编辑] 汉字的未来

现在简化汉字主要通行于中国大陆马来西亚新加坡东南亚华人社区;繁体汉字则通行于台湾欧洲美洲华人社区。

然而随着中国大陆政治上和经济的影响力提高,简体字的影响力也会越来越大。虽然如此,在电脑科学进步的今天,输入汉字的方便与单字的高资讯量可以并行不悖,且印刷的成本跟表音文字已无差异之时,汉字简化的方向被重新检视。其中也有务实的看法:如同欧语文,繁体字作印刷用,简体字作书写用(识繁写简)。无论如何,根据使用用途,选择适合的字体,会是必然趋势。

此外一个文字系统的:可持续发展永续发展,随时代演进必然还是有造字的需求,这就有待动态组字技术的发展。

韩国自1991年以来开始举办国际汉字研讨会,邀请使用汉字的国家的专家和学者共同讨论汉字的使用和比较。2007年第二届的国际汉字研讨会于北京举行。大会一致达成共识,首次作出简体字和体字繁体字共存,将来慢慢趋向于繁体字的使用的决定。

[编辑] 繁简体汉字的比较

  • 繁体字:以台湾人为主的部分人称正体字,优点是单一字内讯息量大,所以辨识快速,缺点则是笔画较多,书写速度慢。
  • 简化字:相对于传统汉字,是简化程度比较大的,废除且合併了很多字,也简併了很多的部件,优点是书写容易、快速,缺点是
  1. 辨识度低:由于笔划大为删减,部件也减少,讯息量变小,辨识度大为降低,常常必须依赖前后文文意来判断一字字义,影响阅读效率。且较不能精密用字,例如:到此一(简体),究竟是在陆上移动或是水上移动就必须看前后文来判断。
  2. 简併不合理:简化字有很多合併的状况,但合併上当初没有做过适当的统计,例如使用比例较高的合併成游,但却有像冈、岗现代语意已相差无几的,没有合併。

虽有前述差异,然常用汉字的个体差异据统计,不到25%。此外,在日本与韩国也有各自简化的作为。在台湾,正式用字仍维持使用繁体汉字;在手写的文书中,有些人会使用、或民间的俗写(例:「-{台}-」(-{台}-)、「-{门}-」(-{门}-)、「-{与}-」(-{与}-));但是,几乎不会使用大陆简化字中的合併字(例:「-{里}-」(-{裡}-)、「-{后}-」(-{后}-)、「-{余}-」(-{馀}-)、「-{制}-」(-{製}-)、「-{面}-」(-{麵}-,亦作-{麪}-)、「-{谷}-」(-{穀}-)、「-{复}-」(-{复}-)、「-{复}-」(-{複}-),皆不简化)。

由于汉字书写複杂,「汉字落后论」的说法存在了很长时间,认为汉字是教育及信息化瓶颈,并有「汉字拉丁化」甚至废除汉字的推动行为。现在一般认为汉字也有突出优点,初始学习难度虽大,但掌握常用字后不存在类似海量英文单词的继续学习问题,且其表意特性也能充分调动人脑的学习能力。在计算机输入问题基本解决后,「汉字落后论」及「汉字拉丁化」已实际上逐渐被大多数人抛弃。


[编辑] 参看


[编辑] 外部链接

个人工具
工具箱