汉字的未来(转)

有人这么说:明祝枝山擅行草,写过气势磅礴的《洛神赋》,由此获明朝“第一草书”之誉。千年后,祝枝山的第N代后人,竟不知道这上面涂画的是什么。这个事是不是真发生过,不得而知,但要说今人大多不识行草,大致所言不虚。
作为一种符号,汉字的能指意味很强——符号包括能指、所指、意指三个部分[1]——大致在全球比较通用的文字中,它的能指意味是最强的。在英文中,elephant为啥是elephant这种拼法大体上没什么太多道理可讲,但“象”这个字为啥要这么写,就可以讲得头头是道了。中国古人用象形意会等方式造字,是一种很了不起的智慧。
但在今天,汉字遇到了一些问题。好学不好学倒是其次(英文背单词也不是很轻松的事);提笔忘字也不是只是中文,英语单词在word的友好帮助下一样会让人忘记拼写;至于繁体字简化成简体字所谓丢掉了老祖宗的文化,在我看来,也不是什么了不得的事——老祖宗还没有标点呐,你今天没个标点试试?
关键的问题在于,汉字的分词是一个麻烦。我曾经教过一个学生,名字就叫“果然”,如何让计算机知道这是个人名而不是一个副词,是需要一些技术技巧的。另外,“管理和服务”要让计算机意识到这里不存在“和服”,也是需要再行学习一下。我这里举的都是简单的分词例子,实际情况是分词是非常复杂的问题,一直到今天,都不是一个可以被精准解决的问题——你不信在百度里搜一个能指试试,看它第一页里会不会返回“能指望谁”的结果,但在Google里,signifier就是signifier,绝对不会搞错。
汉字天然是一种智慧,但它不是一种智能,它需要联想力和理解力,这个事计算机最欠缺。人工智能的研究进路曾经有一条就是想让计算机能理解信息,结果发现折腾了半天,理解力尚不如三岁小孩。今天的人工智能主要是匹配:计算机得到一个信息,然后进行信息匹配,最后返回结果。你以为搜索引擎真能理解你说些什么么?不,它只是匹配信息罢了,它把信息搬来搬去,但其实完全不懂这里的所指和意指是什么。要把信息匹配做好,就要把信息分解成若干片段,这里面重要的环节就是分词。汉字恰恰就是在这点上,比英文差很多。
汉字的另外一个麻烦是:其实我们早就在用无意义的符号来输入汉字了:拼音输入法。虽然有一些和汉字结构有关的输入法——比如五笔——但我绝对相信的一点是,今人大部分是在使用拼音输入法,有部分人——主要是中老年人——在用手写输入。大多数英文单词会拼就会写(或者写出来也差不离),但汉字不是,会说和会写完全是两回事。在汉字输入(以前叫写)这个环节,其实是很脱离的。拼音输入法看似找字是件麻烦事,但如果用联想输入,它的效率比手写输入高很多。拼音输入成语的速度远远快过手写输入的。
这是一个计算机横行的时代,什么是计算机?就是具备输入、输出、算法三种功能的东西。现在我们在输入上,已经抛弃了“写字”而采用无意义的符号,在算法上,汉字又有一定的缺陷,只剩下输出还是汉字了:不过为了展示考虑,什么篆体、行草基本上都被忽略了,大体上只有做一些设计的时候,才会考虑到这种字体。
文化论者对此表示莫大的愤慨和悲哀,我也有那么一丝丝,毕竟正如我前文所说,汉字彰显的,是一种智慧,还很高级。但高喊保护传统文化之类的口号其实是没意义的,人说到底是功利的,什么简单什么方便,大多数人就会选什么。发个短信还要考虑要保卫老祖宗的东西,就赶紧换成手写输入,还得用繁体字书写,我猜也不是很多人能做到的。爱国主义也好、民族主义也好、文化捍卫也好,在效率面前,都是苍白的——这句工具至上论的话看似有点悲凉,但真的是事实。
这事最终的解决方案不是文科生能解决的,得有理工科的人来解决。重点的环节在于输入和算法。当这两样东西变得高效率起来,汉字自然就没什么问题。尤其是算法,计算机对中文的理解能做到对英文的理解一样好的时候,汉字就不可能会消亡。毕竟,十多亿人在用这种符号系统。

[1]这个说法其实并不是严谨的学术说法。我当年读研的一位同学直接私信来说:你把*教授的传授全忘记了?我当然知道在索绪尔的说法里,符号由能指和所指组成,其实意指是一种“关系模式”,它是用来看待能指所指一种整体的方式。但我始终认为,象这么写法,是能指,指代的那个动物,是所指,人们看到“象”而引起的联想(比如笨拙,比如巨大),是意指,这三样东西才完整构成了一个符号。事实上,我对索绪尔的能指所指之间是任意的自由的,也深表怀疑。一家之见,不是学术定论,绝对可能有错误成分。

—— 南方都市报 供稿 ——
转载说明:
1、本博客文字,除特别注明外,均为本人原创,可以自由转载;
2、转载时请注明本人大名,魏武挥,不是魏武辉,不要搞错。
3、转载时请保留此段:本文由扯氮集博主魏武挥原创撰写,欢迎于微信中搜索ItTalks以订阅公众账号,或于搜狐新闻客户端科技频道订阅“魏武挥”

原文地址:http://weiwuhui.com/5593.html

:D:D同意楼主的观点 汉字得进化 不然前途不明朗 同样 也会有那么一批汉字爱好者前赴后继的传承者古老的文明 那样就挺不错的

:lol:lol沙发是我的 这样顺手把板凳一起拿了吧

其实我倒是觉得,随着技术的发展,汉字的弱点会慢慢变得不那么明显。
汉字最大的障碍是比较难学,这也是新中国使用简化字的一个重要原因——为了扫盲。
随着义务教育的普及,这个问题已基本不存在。到了初高中,中国人的中文写作能力与美国人的英语写作能力,估计也没拉开什么差距吧。正如文中所说,汉字的难学已不是个重要的问题。
而文中提到的分词问题,确实存在,但我觉得这个问题在可预见的将来能得到比较好的解决。
英文在书写时使用空格分词,但在阅读时没有空格,语言识别已经能比较好的解决这个问题。
因此我觉得基于统计学原理,结合上下文,中文的分词也会做的比较好。

文字总是在进化的,因为文字是鲜活的。即使在楷书定型,文字基本不变的上千年,我们的祖先为了方便创造了大量简体字,并广为流传。
五四时期激进的人希望用拼音代替汉字,个人觉得也没有必要。

文字该怎么走,没有必要刻意去规划,人们怎么好用,就顺其自然吧。

汉字有成为世界文字的潜质:4_87:

潜质大大滴,现在中文在世界上越来越流行了,学习的人也越来越多了,期待那一天的到来~:5_116:

现在中国经济发展速度很快,学中文的人会越来越多,就像几十年前的日文一样。
不过要成为世界文字难度比较大,对于非母语人群来说,中文还是太难学了:发音上中文是有声调的,难倒一大片人;阅读上至少需要掌握最少2000多个基本汉字才算起步。
话说真的很憧憬全世界都学中文,无聊了就去国外教教中文,顺便旅游,真爽啊

:3_52:偶也一直期待中文成为国际语言,不过之前一直是觉得英文太难学,中文是国际语言的话就可以偷懒不用学英文了!嘿嘿~

文字可统一,但语言还是会五花八门的。。。

文字和语言是两个东西,用汉字不一定用汉语,这正是汉字的成为通用文字的潜质。
我国各地区的一些方言间的差异已经超过某些外语之间的差异了,但都使用同一种文字;朝鲜和日本开始也是使用自己的语言,而文字使用汉字,后来才有了自己的文字。

朝鲜和日本用汉字是有特殊原因,越南以前也是用汉字。
从本质来说,文字的起源有两种——象形文字和记音文字。
古埃及的象形文字非常有名,最初的中文也是象形文字,大部分字母文字则从一开始就记音文字。
不管哪个民族,总是先有语言,而后有文字。
象形文字的特点是用象形的符号记录特定事物,通常最简单的是名词——太阳、月亮、花鸟鱼虫……,之后通过组合表达动词(当然也可以不组合而直接发明动词符号),如一个人拿着网组成“捕鱼”的“捕”,甚至逐渐衍生出更为复杂的含义——形容词、副词等。
这些符号所表达的含义在语言中有对应的发音,于是很自然的,这些发音就对应到象形文字。
最初的文字只有少数人理解,大部分人不认识,更不会读。
而且语言是鲜活的,变化非常快。因此古埃及人又发明了表音符号,它们也是一些图形,这样就方便了文字的交流。这对腓尼基字母产生了重要的影响,随着腓尼基的发明,记音文字迅速扩散开来。各民族发现对字母稍加改动,就可以用来记录本民族的语言,实在是太方便了。
陆地的另一侧,古代中国发明了甲骨文、金文、石刻文,几千个表意符号,恰巧古代中国人(至少是重要的一支)的语言是单音节的,一个字对应一个音表达一个意思——“老虎”叫“虎”、“河流”叫“水”、“跑步”叫“走”,大家看古文觉得很简洁,其实先秦的人就是这么说话的。后来经历了五胡乱华、民族大融合,语言才开始往多音节发展。
正因为一字一音,古代汉语就有了记录语言的条件。汉字没有成为简洁的记音文字,而是保留象形文字的特征,但经过数千年的演变,已跟原来的形象相去甚远,所以不属 于象形文字,而属于表意文字。
日本原来没有文字,后来到中国留学,借用中文记录本民族的语言,所以日文很多字有“音读”和“训读”,汉语词汇为音读,是从中国引入的词汇;日语固有词汇为训读,这些词汇在日语中有本来的读音,发音不变,只是用中文记录而已。但这样做实在别扭,而且很难学,只有常年接受教育的人才能掌握。所以日本几个牛人把中文楷体和行书拆开,发明了“平假名”、“片假名”,类似于汉语拼音,小孩子只要会说话,稍微一教就能认识。
朝鲜有类似的问题,所以也搞了一套拼音系统,就是现在的韩文,最开始也是给小孩和女人使用,因为汉字实在太难掌握,也不符合朝鲜本民族的发音系统。

说了这么多,总体而言,中文的出现非常特殊。记音文字在传播上更具优势,而中文的特点就是凝聚力强,大家写同一个文字,就算发音的差别达到了粤语和普通话的程度,还是能交流。不过中文学起来难度确实比较大,日本韩国学过去一千多年也没能消化,最后还是得依靠拼音辅助。不像腓尼基字符早已开枝散叶,走遍全球。
所以我个人觉得中文没有成为通用文字的潜力。

汉字和英文相比有稍难上手的缺陷,但是缺有着后者无法比拟的先进性,大家常看美剧的就不难理解,里面的人表达自己的感情经常表达不清楚,特别是在交流双方情绪激动的时候,他们只会说 恩 啊 you know… 之类
这仅是一斑,期待优化后的汉语成为世界通用语言的那一天。:7_138: