语言与互联网的关系日益受到广泛关注。人们普遍认为,语言深刻影响着人们的互联网体验,决定了社交媒体的交谈对象以及在网络社区中的行为方式。语言对于建立在线和离线的人际联系同样重要,构成了用户相互识别的基础、排斥和包容的界限,以及社区围绕共同利益发展的边界。9月16日,印度观察家研究基金会安全、战略和技术中心副主任特丽莎·雷(Trisha Ray)于该机构官网发文称,虽然目前英语依然是互联网的通用语言,但随着各种替代英语平台的本地方案的出现,这种现状可能会逐渐发生改变。

英语在互联网占据主导地位


(相关资料图)

语言增强了人与人之间的联系,并以强大的方式塑造了人们在现实世界和互联网中的生活。在全球市场上,客户对真正使用与自身相同语言的网站拥有更多的信任,并会在这些网站上进行更多消费。荷兰语言专家贾斯顿·多伦(Gaston Dorren)表示,随着英语国家的经济、文化、政治和军事优势与全球化同时发生,英语成为全球各交流领域的默认语言,互联网也不例外。这不仅限制了那些希望从事编程职业的非英语使用者,还可能对更广泛的人群产生影响。从本质上看,任何想要使用计算机或互联网的人都必须等待适合自己语言的“定制”版本。

英国广播公司(BBC)的一项研究显示,英语在互联网上占主导地位,使得许多语言及其代表的文化在网络上处于尴尬境地。世界上有近7000种语言,但只有7%可以体现在已发布的在线内容中。联合国教科文组织2008年发布的一项调查发现,互联网上98%的网页主要以12种语言发布,其中一半以上是英语。这使那些非英语使用者陷入窘境。2003年,联合国教科文组织通过了一项促进在线使用多种语言的建议,却面临互联网的接入问题。根据互联网世界统计网站(Internet World Stats)的数据,世界上只有不到60%的人口可以使用在线基础设施。与此同时,虽然76%的网络人口生活在非洲、亚洲、拉丁美洲和加勒比地区,但大部分在线生产的内容来自其他地区,以维基百科为例,超过80%的文章来自欧洲和北美地区。

互联网的基础设施鸿沟有据可查。国际电信联盟(ITU)的相关数据显示,在没有宽带互联网接入的29亿人口中,其中96%都生活在发展中国家。此外,这些来自发展中国家的人口接入互联网必须克服的一大障碍就是语言。

语言鸿沟存在不同层次

互联网存在的语言鸿沟比人们想象得要大,当下存在的各种编程语言中,只有四种是多语言的。此外,由于英语是大多数编程人员的入门语言,因此,即使是来自非英语国家的现代编程语言,也使用了英语术语。特丽莎·雷认为,出现这一现象的重要原因是,互联网本身是英语国家的产物,天生具有排他性。正如美国《连线》(WIRED)杂志2019年的一篇文章所指出的,“‘网络最初的承诺’只是对说英语的用户的承诺……对许多人来说,网络最初的承诺更多的是一种威胁——不说英语就会被排除在网络之外”。

这种语言鸿沟有不同的层次,从键盘等硬件到编程语言,从网站域名到应用程序和社交媒体平台,缺乏多样化的字母表几乎是阻碍所有本土语言成为在线内容的首要因素。20多年前,在埃及开罗召开的互联网名称与数字地址分配机构 (ICANN)会议上,与会者表示迫切需要非英文域名。第一个国际化域名(IDN)协议由国际互联网工程工作组(IETF)于 2003 年提出,但直到2009年ICANN才开始对IDN进行操作测试,其中包括汉字、日语、阿拉伯语等。

释放在线语言多样化的力量

美国麻省理工学院全球语言网络研究项目展示了多语言用户的运作模式和行为。牛津大学互联网研究所的数据科学家斯科特·黑尔(Scott Hale)发现,多语言人士在互联网表现活跃,会在线编辑更多内容和发表更多言论。无论是将不同国家的概念通过翻译引入互联网的不同语言版本,还是将本地新闻故事转移到新的语言社区和不同的地区,这部分人群可以为打破英语的互联网主导地位作出贡献。

翻译技术为弥合在线语言鸿沟提供了一种解决方案,同时也为企业开辟了新市场。黑尔认为,还有更多的方式可以释放在线语言多样化的力量。比如修改互联网平台,使多语言用户更容易找到其他语言的内容,并鼓励用户使用多种语言。

匈牙利布达佩斯技术与经济大学数学语言学家安德拉斯·科尔奈(András Kornai)表示,访问互联网为语言赋权提供了机会。互联网有助于记录和保存语言,分享教学材料,为边缘化群体翻译重要信息,甚至可以为一些濒危语言建立虚拟社区,使其实现线上生存。此外,访问设备和资源并不是唯一的问题,世界上有近43%的语言和方言是没有文字的,这对它们如何适应以文本为基础的互联网世界,提出了另一个重要挑战。目前存在一些大规模开放式录音系统,可以记录大量的口语录音,以帮助此类语言脱离濒临消失的危险境地。

在国家和地区层面,英语的互联网主导地位在过去十年中有所下降,数字化、智能手机的全球普及、互联网的接入以及社交媒体的出现引发了这种变化。特丽莎·雷表示,本地的平台替代品,例如韩国的聊天软件Kakao、中国的抖音和微信、印度的短视频平台Moj等正在迅速发展,在本国市场取代了一些全球平台,冲击了英语在互联网平台的主导地位,推动了互联网语言多样化。

关键词: 社交媒体 编程语言