人类语言信息中隐藏神秘常数,传输效率都是39.15比特每秒

我们的语言不仅仅是一种交流工具,它还是一种数学,一种信息科学。当我们在进行语言表达时,音节是我们的信息编码单元,是可以用信息最小单位“比特”来衡量的。这些音节将我们要表达的信息传递给讨论对象,并进一步降低了表达主题的不确定性。

新的研究给出了人类不同语言信息传输效率比较的数学计算结果。这是一个奇特的数学研究结论:尽管人类的语言种类成千上万,但他们不约而同选择了同样的信息传输速度,即 39.15 比特每秒。

(来源:SHUTTERSTOCK.COM)

显然,这个速度与我们目前的电脑效率不可同日而语,要知道,1959 年第一台计算机的传输速度为每秒 110 比特,而今天的家庭互联网带宽为 100 兆(1 亿比特)。然而这个研究似乎意味着,39.15 比特每秒的语言信息传输效率是人类进化的必然,是一个最佳的结果。

这个研究来自法国里昂大学 Fran?ois Pellegrino 团队,该研究成果以题为《不同的语言,接近的编码效率:跨种族信息交流的效率比较》发表在 9 月 4 日的《科学进展》(Science Advances)上。

可能与脑电波频率有关

人类的各种语言之间有巨大的差异,这些语言的音素(Phoneme)数量、音节数量和音高复杂性迥异。研究人员分析了包括英语、日语、普通话和广东话在内的 17 种语言的音节信息密度,让每种语言的母语使用者朗读 15 篇同一文章的不同译本(每种语言 10 人,共计 170 人),受试者被要求熟悉这些文本,然后以舒适的节奏和清晰的发音来大声朗读。

结果发现,尽管人们的讲话速度各异,但口语信息密度高的语言使用者的语速较慢。那么,一个奇妙的结果就出现了:巴斯克语的音节信息密度为 4 比特,而越南语的音节信息密度为 8 比特,而巴斯克语的语速为平均每秒 8 个音节,而越南语的语速平均每秒 5 个音节。也就是说,信息密度的大的语言表达速度更慢,信息密度小的语言表达速度更快。总的来说,这些不同语言的信息传输速度是接近的。

换个例子而言,英语的音节多达 6949 个,而日语的音节只有 643 个,也就是说,每个日语音节相当于 11 个英语音节之多,但日语的表达速度并不比英语表达速度高出多少。

为何会有这么巧合的结果呢?研究人员推测说,人类的大脑结构是类似的,发音器官也很接近,那么我们对语言的理解能力也就相似。作者之一 Dan Dediu 猜测说,这可能与脑电波频率有关。

一个可以理解的解释是,我们的语言表达难以兼顾语速和信息密集,因为两者结合带来的信息高通量对于发言者的表达能力与听者的接受能力都是巨大挑战。

作者认为,这个研究结果是发言者在其母语语言结构特性与交际压力下的神经认知和生物学的反馈,也就是说,语言是一种交流环境中生物学、环境学和文化环境多尺度的进化产物。

39.15比特每秒的门槛

高智商的人会迈过 39.15 比特门槛吗?对于这个问题,论文的第一作者、香港大学的 Christophe Coupé 博士在接受 DeepTech 采访时表示了谨慎的态度。他认为都有可能,是值得进一步研究的问题。

不过他说,没有调查就没有发言权,对于此问题,需要调查很多样本,分析语速/信息率与智商之间的关联,并且这还可能需要调查包括认知、社交在内的其他变量。

Christophe Coupé 博士关注语言进化和语言多样性研究,特别是以计算方法和统计方法来研究语音。他于 2003 年在里昂大学获得认知科学博士学位,之后他在法国国家科学研究中心(CNRS)担任研究员,最近加入了香港大学,目前希望利用数据科学来探索语言多样性。

那么,对于目前热门的脑机接口研究有什么启示呢?脑机接口解码的效率是否会突破人类大脑生物学的局限并实现更高的效率?换句话说,脑机接口的解码效率是否受限于 39.15 比特每秒?

对此,Christophe Coupé 博士同样表示出科学家的严谨。他说,这是一个令人着迷的问题,但目前没有答案,并且还需要很长的时间才可能有进展。

不过脑机接口研究终究会推动我们对语言发生和处理过程的深入了解。Christophe Coupé 认为,脑机接口在近年来有了巨大进步,只是我们对大脑和语言处理的理解还很有限。

Christophe Coupé 强调说,因为语言的个体差异很大,语言的测量研究需要大量实验来推动。

对于 39.15 比特每秒语言传输效率的研究,研究人员准备将研究范围扩展到非洲、美洲和巴布亚新几内亚的语言。语言种类越多,这个研究的普适性会更强。