汉字输入技术的历史和演变

汉字输入技术的历史和演变
2024年08月29日 21:06 DeepTech深科技

来源:DeepTech深科技

(来源:MIT TR)(来源:MIT TR)

每一天的每一秒,都有人在用中文打字。他们可能在香港的一个公园里,在台湾的一张桌子上,在上海一家便利店排队结账时。尽管这种机制看起来与英语或法语打字有点不同,人们通常输入一个字符的发音,然后从弹出的选项中选择它,但很难想象还有什么比这更日常的了,以至于几乎每个使用它的人都没有意识到实现这一切的输入法软件的存在。

人们基本上忘记了,而且大多数亚洲以外的人从一开始就根本不知道,一大批语言学家、工程师和其他学者们在 20 世纪的大部分时间里都在思考,汉字将如何从毛笔转向其他媒介。这个转变过程是过去两年出版的两本书的主题:《The Chinese Computer: A Global History of the Information Age》(Thomas Mullaney 著)和《Kingdom of Characters: The Language Revolution That Made China Modern》(Jing Tsu 著)。

(来源:MIT TR)(来源:MIT TR)

Thomas Mullaney 的书重点介绍了 20 世纪 40 年代开始的各种中文输入系统的发明,而 Jing Tsu 的书则涵盖了一个多世纪以来使用电报、打字机和计算机规范中文和传输中文所做的努力。

汉字并不像它们有时看起来那么神秘。一般规则是,它们代表一个单词,或者有时代表单词的一部分,学习阅读是一个记忆的过程。在这个过程中,猜测一个字符应该如何发音变得更加容易,因为语音元素通常隐藏在其他符号中。

早先,汉字是用毛笔手写的,想要识字就需要记住笔画的顺序,如果笔顺错了,字可能看起来不太正常,或者更确切地说,正如我几年前在中国广州作为第二语言学习时所发现的那样,看起来很幼稚。(我的丈夫是一位中国文学翻译家,他觉得我 30 岁的时写的汉字像幼儿园孩子一样滑稽可爱。)

然而,问题在于汉字的数量实在是太多了。一个人至少需要认识几千个基本汉字才能被认为是“识字”,除了这些基本汉字之外还有数千个不常见的汉字。许多现代汉语学习者基本上全身心投入到学习阅读中,至少在开始的时候是这样。

早在 19 世纪,当时中国还有很大一部分人是“文盲”,他们几乎没有接受过教育,基本不认识汉字,或认识有限的少数汉字。

王照是一位改革家,他相信一种更简单的汉语口语书写方式对于国家的生存至关重要。他的想法是使用一组拼音符号,代表一种特定的汉语方言。如果人们能够像使用字母表的语言的人那样,只需要记住少数字母形状,就能读出单词发音,那么他们就能更快地识字。有了识字能力,他们就可以学习技术技能、研究科学,助力中国各个方面的综合发展。

王照对这个目标坚信不疑。戊戌变法失败后,他逃亡日本,而后秘密潜回中国,在天津创制“官话字母”,并写成《官话合声字母》,此书成为中国第一套汉字笔画式的拼音文字方案。

王照的故事充满了戏剧性,构成了 Jing Tsu 书中的第一章。王照开创的普通话学习系统被一些学校使用了几年,但最终在 1911 年清朝灭亡后不久随着竞争体系的兴起和席卷中国的混乱时期,它并没有幸存下来。

后来,中国出现了一些奇怪的发明。海外的中国学生和科学家已经开始研制汉字的打字机,他们认为汉字打字机落后于其他语言。使用罗马字符的英语和其他语言的文本可以通过键盘控制的机器快速而廉价地打印出来。这些机器将液态金属注入到字体模具中,然而,中文文本需要将成千上万的汉字放入手动印刷机中。虽然英文信件可以用打字机打印出来,但经过这么长时间,中文信件仍然是手写的。

在 Thomas Mullaney 和 Jing Tsu 描述的所有技术中,这些“金属怪物”最让人印象深刻。它们配备了滚筒和轮子,一个个汉字排列成特定形状并放在一个巨大的托盘中,看起来似乎是“书写机器和关于如何组织语言的哲学化身”。

因为汉字没有固有的顺序(没有 ABCDEFG),而且汉字数量实在是太多了(如果你只看一眼 4000 个汉字,根本无法很快找到你需要的那个汉字),人们试图根据可预测的规则排列这些汉字。

林语堂发表的第一篇文章描述了一种根据笔画数对汉字进行排序的系统,发明了第一台具备打字机键盘的中文打字机,首次将“搜索”与“书写”结合起来,通过将打字过程转化为搜索过程,从根本上改变了机械书写的运作方式。

(来源:MIT TR)(来源:MIT TR)

技术似乎常常需要新的方式来与人接触,中文打字机也不例外。当我第一次在瑞士的私人博物馆看到一个样机时,我被这个蛋糕大小的设备的滑动臂和细长导轨迷住了,它的托盘上装满了汉字字符。“操作这台机器更像是一项全身锻炼。”Jing Tsu 在谈到 1890 年代末的一台非常古老的打字机时写道,该打字机由一位美国传教士设计。它的发明者预计,随着时间的推移,肌肉记忆将占据主导地位,打字员将在机器周围平稳移动,挑选字符并按下按键。

然而,尽管中文打字机最终取得了成功(第一台商用打字机于 20 年代问世),但几十年后,下一个挑战是让汉字融入计算机时代,还有如何让更多人阅读的问题。

在 20 世纪 30-60 年代,中文排序和打字系统继续占据知识分子的头脑。特别令人难忘的是广州中山大学图书馆员的故事,他在 20 世纪 30 年代发明了一种像信号旗一样的明暗字形系统来代表字符。

为了更好的帮助学习阅读,如今中国大陆现在都学习拼音,这是一种使用罗马字母表示汉字如何发音的系统。与此同时,数千个汉字将被简化版本所取代,需要学习的笔画也更少。今天在中国大陆仍然是这样做的,尽管在中国台湾和香港,汉字并没有简化。此外,中国台湾使用不同的发音指南,一个基于 37 个拼音符号和 5 个声调标记的发音指南。

为了将这些汉字字符输入计算机,人们提出了无数的想法。Thomas Mullaney 的书中上记录着“失败设计墓地”的图像,比如 256 键键盘和巨大的 Ideo-Matic 编码器圆柱体(一种具有 4000 多个选项的键盘)。

按照 Jing Tsu 的说法,这个专用硬件的尴尬时期与当今快速的手机打字之间最重要的联系可能出现在 1988 年,这是由加利福尼亚州的工程师提出的一个想法。“Unicode 被设想为一个主转换器。”她写道,“它将把所有人类文字系统,无论是西方的、中国的还是其他语言字符,都纳入一个统一的标准之下,并为每个字符分配一个单一的、标准化的代码,以便与任何机器进行通信。”

一旦汉字有了 Unicode 代码,它们就可以像任何其他字形、字母或符号一样通过软件进行操作,当今的输入系统允许用户使用拼音或笔画顺序等选项来调用和选择字符。

然而,这两本书的结局都让人感到沮丧。Thomas Mullaney 对上世纪打字机的仔细记录和 Jing Tsu 的关于语言的冒险故事集都表明了同样的事情:人们投入了令人难以置信的时间、精力和智慧,使汉字更容易被机器和人类大脑识别。但这些系统似乎很少对当前的解决方案产生任何直接影响,比如现在有超十亿人用来输入中文的发音输入系统。

这种进化模式并不是语言所独有的。作为一个未来主义者的孩子,我亲眼目睹了我们前进的道路上充斥着技术的“死胡同”。谷歌眼镜(眼镜式计算机)成为头条新闻后的一个月,我母亲帮助举办了一场个人抬头显示器展览,各种发明家试图在我们眼前放一个屏幕。增强现实似乎最终可能会到达人们的手中,或者更确切地说,出现在他们的脸上。

那个版本的未来并没有实现,如果增强现实观看真的成为日常生活的一部分,那也不会是通过这些设备。当历史学家在这样的书中写到这些设备时,我认为他们无法追踪一条完整的思想链,从想法的出现到成果的实现。

Thomas Mullaney 书中,一个迷人时刻说明了这一点。他一直在向中国专利数据库中被列为输入法发明者的人的邮箱中发送信件。现在他在北京星巴克遇到了一位这样的发明者,一位老人和他的孙女。老人很高兴地谈论他的方法,其中涉及到汉字的图形形状。但他的孙女靠过来低声说道:“我认为我的输入系统更容易使用。”事实证明,她和她的祖父都建立了自己的系统。

换句话说,故事还没有结束。

人们需要“修补技术和思想系统”,就像这两本书中详细介绍的那样,不仅因为他们必须这样做,而且因为他们想要这样做。尽管人类的本性是想从我们身后的事物中走出来,让现在成为一个伟大的顶峰,但这些书详细描述的是语言生命中的片段,没有开始,没有中间,也没有令人满意的结局,只有进化。一种无休止的展开,总是在成为自身更完整版本的过程中。

本文作者 Veronique Greenwood 是一位来自英国的科普作家和散文家,她的作品曾刊登在《纽约时报》、《大西洋月刊》以及许多其他出版物上。

原文链接:

https://www.technologyreview.com/2024/08/26/1096630/chinese-writing-technology-evolution-thomas-mullaney/

机器
新浪科技公众号
新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

创事记

科学探索

科学大家

苹果汇

众测

专题

官方微博

新浪科技 新浪数码 新浪手机 科学探索 苹果汇 新浪众测

公众号

新浪科技

新浪科技为你带来最新鲜的科技资讯

苹果汇

苹果汇为你带来最新鲜的苹果产品新闻

新浪众测

新酷产品第一时间免费试玩

新浪探索

提供最新的科学家新闻,精彩的震撼图片