>文化>>正文

奇奇怪怪的语言学奥林匹克谜题篇1 数字、翻译和书写系统

原标题:奇奇怪怪的语言学奥林匹克谜题篇1 数字、翻译和书写系统

在AI时代中,人类的语言处理与理解是关键的核心技术。在继承传统的基础上,各国政府都在积极加大投入,抢攻与培养具有完备现代语言学知识结构,掌握语言信息的模式分析、归纳与逻辑判断等多重能力的新型人才。

如果你是第一次见到“语言学奥林匹克”,对于语言学不甚了了,对这项活动不明就里,不妨先读一读下面的这段文字吧!

有志报考剑桥大学的中国学生可以在官网的招生指南中看到这样一句话:(见下图)。这里提到的“science Olympiads”,中文是“科学类奥林匹克”。

提到奥林匹克,不难想到有大名鼎鼎的“五大”,究竟还有哪些科学活动也是奥林匹克呢?

没错,语言学也有奥林匹克

International Linguistics Olympiad (IOL)

十七届国际语言学奥林匹克(International Linguistics Olympiad,简称IOL)将于今年的7月29日至8月2日在韩国外国语大学(Hankuk University of Foreign Studies)龙仁校区举行,来自全球40多个国家拥有不同肤色和文化背景的青少年,将运用逻辑思维、算法思维、团队协作和问题解决等综合能力破解语言现象背后的规律和秘密,并通过丰富有趣的学术交流活动开阔视野,增进文化了解。

为选拔和输送合格的选手,由北京语言大学语言学系、中国中文信息学会语言学奥林匹克工作委员会、科技日报社中国科技网联合主办的“2019年国际语言学奥林匹克中国区终选夏令营”(以下简称“夏令营”)将于6月6日-6月9日在北京语言大学举办。从夏令营中脱颖而出的选手,将有机会代表中国,与来自世界各国的优秀头脑们同台竞技、合作、交流。报名工作已正式启动,我们诚挚邀请拥有较强逻辑思维、热爱语言学谜题(linguistic problems)的中国高中生,以组队方式参加这项年度科学挑战活动!

2019年语言学奥林匹克活动时间轴

什么是语言学?

What is linguistics?

创造这个世界,我们需要各种各样的东西,例如,数字和形状、固体和液体、植物和动物、时间和空间、陆地和海洋、国家和风俗、思想和情感,当然还有具有意义的声音,和文字。

了解这个世界,我们需要一个充满好奇心的物种,比如,人类。我们想要知道关于这个世界所有的知识,并通过科学研究去验证这些经验,或通过教学,将我们所掌握的一切传承给下一代。

当然这些我们已经在做了,我们通过数学、物理、化学、生物学、天文学、地理学、人类学、历史学、心理学等等学科来阐释这个世界,然而还有一种不太经常出现在高中、乃至大学本科课程表中的学科-语言学Linguistics。

词条解释

语言学(英语:linguistics)是一门关于人类语言的科学研究。

Linguistics is the scientific study of language, and involves an analysis of language form, language meaning, and language in context.

--维基百科

语言看似平常,正像很多平常的事情往往含着极不平常的奥妙一样,其中隐藏着深奥的秘密。谁能够看到并且揭示这些奥妙,谁就能够推动科学的发展。人们很早就开始了对语言的研究,并逐渐地形成了一门独立的科学。

语言学的任务是研究、描写自然语言的结构、功能及其历史发展,揭示语言的本质,探索语言的共同规律。因为只有人类有语言、使用有声语言进行交际,因此通过语言研究,可以更加清楚地了解人类在世界或宇宙中的位置,从而更加透彻地理解人类的本质。

至于什么是科学的方法,这是一个与现代科学体系建立相关的持久的话题,但其基本要义是:客观!客观!客观!要摆事实、讲证据。

语言的科学研究目前还在萌芽期,语言学所获得知识,目前还没有成为我们传统教育的一部分。在我们的国家,就如同在别的许多地方一样,中学教授语言的方式围绕着语法与文学这两个中心,这意味着无数聪明好学的年轻人,很难有机会在大学本科甚至硕士阶段之前接触到语言的科学研究。而这是一门极端重要,且既包括人文知识又包含数理逻辑趣味的学科。

在AI时代中,人类的语言处理与理解是关键的核心技术。在继承传统的基础上,各国政府都在积极加大投入,抢攻与培养具有完备现代语言学知识结构,掌握语言信息的模式分析、归纳与逻辑判断等多重能力的新型人才。

什么是语言学谜题

What is a linguistic problem?

语言学谜题是一些看似与语言学这门学科无直接关联的趣题,实际上是命题者通过将语言研究的一个或几个子领域中的现象或概念,例如,音系学、形态学、句法学、语义学、书写系统、计算语言学等等,以逻辑趣题的形式表现出来。

语言学谜题的内在机制是,每一项语言数据都反映了语言的基本结构。命题专家通过调研、头脑风暴和模式分析等手段,精挑细选一些语言片段,为参与者提供挖掘信息的数据,并希望选手能够在解题过程中,将题目隐藏的一些规律作为知识加以内化,从而掌握该语言的结构感,无论是文字系统、语音、语法、词法,还是语义等方面。

这一过程表现为:

解决语言学谜题需要哪些思维能力

What thinking skills are needed to solve linguistic problems?

与大部分学科知识型测试不同,IOL要点不在于考察先前学过的概念或原理,选手无需具备深厚的语言学理论背景。揭开谜题所需的三种核心思维能力是联想思维、科学思维、算法思维,创造性的运用一般知识与语言直觉来破解语言现象背后的规律和秘密。

在这里,重点推荐一下“算法思维”。

首先,算法思维是一种问题解决的方式。它将问题分解,并且利用所掌握的知识找出解决问题的办法。算法思维可以划分为四个主要组成部分:其一,所谓“解构”,即把问题进行拆分,同时理清各个部分的属性;其二,所谓“模式识别”,即找出拆分后问题各部分之间的异同;其三,所谓“模式归纳”,或“抽象化”,即探寻形成这些模式背后的一般规律;其四,所谓“算法设计”,即针对相似问题提供逐步的解决办法。

算法思维不同于传统的标准答案思维的地方在于,它直面了真实世界问题的复杂性及多样性,好比我们的人类语言,数量及其庞大,结构也非常复杂,充满了各种各样的差异。我们认识到,可能存在一种算法可以很好的解决当前的问题,但是又不太确定当前的算法是否是最佳的解决办法,因而能够不断的去探索更好的、更优的方案。

简而言之,不光是学习计算机编程的人,任何学科背景或年龄段的人都应该学习和应用算法思维,这是一种让人受益匪浅的技能。

常见的语言学谜题-第一篇-翻译、数字和书写系统

What are the common linguistic problems?

每一道语言学谜题都是相对独立的,选取的语言片段也很少发生重复,可以说五花八门,设计出创新的题目本身也是命题者们非常看重的方面,不过根据往届出现过的赛题,还是可以归出几类比较常见的题型。

1. Translation problems

题型描述:有并列的两组语料,A组语料(词组、短语或句子)来源于某陌生语言,B组是A组的翻译文本(被译作选手指定的语言,例如简体中文)。两组可能是乱序排列,解题者的任务是尽可能仔细地观察,按要求先进行排序,再对新的语料进行翻译。

例题1-1:

题目来自北美计算语言学奥林匹克(North American Computational Linguistics Olympiad)。

以这道比较简单的翻译题为例,为了将经过拉丁字母转写之后的古希腊语短语和英语译文对齐,你可以先从弄明白master, son, donkey, house等英文单词对应的古希腊语单词着手,包括找出他们的单、复数形式。

1) 词汇

古希腊语 英语
hyi son
dul slave
cyri master
oic house
on donkey
adelph brother
empor merchant

2) 古希腊语短语结构(顺序)是:第一个冠词以“h”开头+第二个冠词以“t”开头+第一个名词是所有者the owner+第二个名词是被所有者the owned。

3) 单复数形式:

4) 冠词和名词的对应关系:

① 第一个冠词的结尾与第二个名词(被所有者)的单复数相匹配。

例1. "ho"是单数,"hoi"是复数。

古希腊语冠词 对应英语 古希腊语名词 对应英语
ho the dulos slave (单数)
hoi the cyroi masters (复数)

②第二个冠词的结尾与第一个名词(所有者)的单复数相匹配。

例2. "tu" 是单数, "tōn" 是复数。

古希腊语冠词 对应英语 古希腊语名词 对应英语
tu the cyriu master (单数)
tōn the hyion sons (复数)

例题1-1答案:

每种语言都可能包含非常“棘手”的结构和语法特征,例如:德语句子常常以动词结尾;日语中对别人家庭成员以及自己的家庭成员的称呼有所不同;有些语言不使用冠词,或“to be”的等价结构;有些语言则依据对生命体和无生命体的认知加以词性的划分。你要做的就是从题干给出的这两组有限的语言片段中,找出这些隐藏其中的特征,才能进行正确的翻译。

2. Number problems

题型描述:包含一组用某种陌生语言描述的基本算术事实,比如“6x4=24”。在这样的题中,你的任务就是找出如何翻译不同的数字和运算表达式。需要注意的是,有些语言使用非十进制,有些则使用不同的词来表示相同的数字,这种不同可能取决于所要计算的对象。

例题2-1:

题目来自2016年IOL中国区终选。

例题2-1答案:

3. Writing systems

题型描述:你的任务是观察题目中给出的某种陌生语言的文字片段,例如古代铭文,弄清楚其特定的书写方式。有些语言文字是从右到左书写,有些则从下到上读,有些文字的音节里从不出现元音,有些文字包含表示声音的符号,和表示概念的符号,而这些需要你去发现、总结。

例题3-1:

以卢维语的文字为例,解决这个问题的过程中,你需要推敲出从左向右书写,一个单词有三种书写形式:

① 用表意的符号

② 用表音的符号

③ 用表意+表音符号

例题3-1答案

在下周的常见谜题第二篇中,我们将继续认识另外一些常见的题型:句法题、语音问题,和一些类型没有定义的题目。

欢迎访问IOL中国区官网www.ioling.org.cn,免费听录播课,下载真题,动手做练习!

想要了解更多奥林匹克?点击了解更多

--------------------

原创出品

===============

17710862437返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
投诉
免费获取
今日搜狐热点
今日推荐