<<登录旧系统审稿   登录新系统审稿>>

建议您登录自己的邮箱点击审稿链接自动登录审稿系统 ×

在线办公

期刊检索

您当前的位置:首页 >> 新闻动态 >> 2016当代语言学前沿论坛——大数据及语言的获得与发展

2016当代语言学前沿论坛

——大数据及语言的获得与发展





 


中国社会科学院语言研究所《当代语言学》主办

中国多语言多模态语料库暨大数据研究中心(北外)

北京外国语大学网络教育学院、中国外语网络教育研究中心承办

20161227-28



(会场:外研社大楼九层多功能厅

 

20161227(周二) 议程

 

      

 开幕式 主持    中国多语言多模态语料库暨大数据研究中心主任   顾曰国

08:3008:40

北京外国语大学副校长致辞

孙有中

08:4008:50

《当代语言学》主编致辞

胡建华

08:5009:00

全体合影


第一场        主持:王伟

09:0010:00

建构汉语词汇与句法复杂程度的计算基准

戴浩一

10:0010:15

  歇(15分钟)

         第二场        主持:吴国良、张永

10:1511:15

意向、意图、目的、目标与言语行为

——思辨与实证研究

顾曰国

11:1512:15

人类句法的双向生长模式

——语言获得的演化观

 

胡建华

第三场        主持:高军

14:0015:00

语言获得研究中的两种张力

李行德

15:0015:15

  歇(15分钟)

       第四场        主持:李芸、胡钦谙

15:1516:15

大数据和社会场景下的

互动语言意图深度理解研究

宋大为

16:1517:15

人脑语言功能区的定位与保护

谭力海

17:1518:00

自由讨论

顾曰国

18:0018:10

总结发言

胡建华

(会场:外研社大楼二层洽四会议室

 

20161228(周三) 议程    主持:胡建华、顾曰国

09:0011:30

中国社会科学院登峰战略“特殊学科”

心理语言学—语言的获得与发展

学科建设会议

 

1.多模态数据库建设

2.儿童语言的获得与发展

3.老龄化引起的语言蚀失现象

专家代表:

戴浩一、李行德、宋大为、谭力海。

 

特邀代表:

高军、张永伟、

胡钦谙、王伟、

李芸、吴国良、

刘红艳、李汝亚、黄立鹤、彭鹭鹭、郭秀丽、朱佳蕾、隋  娜、杨萌萌、王蕾、葛成章、

杨梦琦、刘小兰、李晨、赵玉珊。

 

11:3012:00

            总结发言

顾曰国

 



2016当代语言学前沿论坛


主旨发言摘要及主旨发言人简介





建构汉语词汇与句法复杂程度的计算基准

 

戴浩一

 

台湾中正大学

语言学研究所暨高龄社会研究中心

 

 

本文试图建构一个汉语词汇与句法复杂程度的计算基准,以便侦测汉语高龄者在记忆力及注意力衰退下,语言能力保存的质与量,并希冀能成为协助检测失智前期认知经度受损(MCI, mild cognitive impairment)以及介入治疗的重要标记之一。

本文将简单介绍语言学计算不同类型语言复杂程度的计算模式(metric models)的动机与方法,接着介绍脍炙人口的 The Nun Study(Riley, Snowdon, Desrosiers,& Markesbery,2005; Snowdon, Grenier& Markesbery, 2000; Snowdon, Kemper, Mortimer, Greiner, Wekstein, & Markesbery, 1996) 用来测量高龄者语言能力以及其语言流失极其重要的两种基准:概念稠密度(Idea density)以及语法复杂度(grammatical complexity)。这两种基准同时也是神经老化与“认知储存”(Cognitive Reserve)互动的关键。

汉语语法与英语语法有相当程度的差异,因此要利用它们来测量汉语高龄者的语言需要大幅度的修正计算方式。本文主要的目的是初步建立计算汉语概念稠密度以及语法复杂度的计算方式,并测试其对汉语高龄者(正常与失智)语言能力及流失测量的有效度。

本文也将进一步探讨此种计算基准用来计算儿童语言习得发展进程的应用,以及提供汉语二语学习不同阶段的评量的适用性。言习得发展进程的应用,以及提供汉语二语学习不同阶段的评量的适用性。


戴浩一教授简介


 

 戴浩一(James H-Y. TAI)教授,美国印地安那大学Indiana University语言学博士台湾中正大学讲座教授。研究兴趣为口语、手语两种语言沟通模式的句法语义组合关系,进而探讨人类语言的共性及差异;自2010年起开始与认知心理学家、认知脑神经学家、临床神经内科医生合作,以汉语材料为基础,探讨语言衰退与记忆、注意力、脑神经组织退化的关联,冀望能研发有效语言训练之方法,以延迟认知的老化,同时建立能侦察早期失智的语言标记。戴浩一教授曾在美国南伊利诺大学(Southern Illinois University)及俄亥俄州立大学(Ohio State University)任教长达25年(1970-1995)。1995年受邀返台创设中正大学语言学研究所并担任第一任及第二任所长,先后历任文学院院长(1998-2002)、副校长(2009)及台湾国科会人文及社会科学发展处处长(2002-2005)。戴浩一教授于2004年获选为国际中国语言学学会(IACL)会长,2010年获颁台湾语言学学会终身成就奖。现任台湾中正大学讲座教授兼人文与社会科学研究中心主任、偏乡高龄社会研究行动计划召集人以及台湾认知神经科学学会监事长。



意向、意图、目的、目标与言语行为

—思辨与实证研究

 

顾曰国

中国社会科学院语言研究所

 

本文讨论五个核心概念,用英文表达分别为 intentionalityintention purposegoalspeech act,即意向、意图、目的、目标和言语行为。这五个概念西方有,我国也有。本文主要侧重讨论西方学者对这五个概念的研究,附带讨论我国学者的相关观点。

这五个概念,说破了,很容易懂。当我们睡醒了睁开眼睛时,我们就开始意识到我们所处的环境。有趣的是我们的意识总是注意到意识自身之外的东西。换句话说,人类意识总是关于”(about) 什么。这个现象被抽象为一个概念,即intentionality(意向)。

Intention (意图)就更容易理解了。我们经常是先想做什么,然后再做。也有只想而不做的。这个哲学上抽象为 intention (意图)这个概念。我们做事,一旦没有purpose (目的),就成了无头的苍蝇乱撞。目的意图的关系,可以这么理解:意图是从行为者的角度说的,目的是从观察者的角度说的。意图处于行为的初始状态,而目的代表行为的终结点。

目的目标的区别在于,目的蕴涵拥有目的的心灵具有形成意向意图能力的脑,而目标则没有这种蕴涵。比如导弹飞向目标,而不是飞向目的。

言语行为指人们说话时不但说话,同时还在做事,即以言行事。

很显然,以上五个概念所涉及的现象是人类社会普遍存在的,是非常基本的东西。每个概念都有单独的专题研究,如何把单独的研究集成起来,形成合成型的研究,属于前沿课题。最有代表性的研究是美国哲学家 Searle的系列成果。也是本文着力阐述的理论。

本人的兴趣是探讨五个概念跟人类多模态互动之间的联系。比如患智退症视觉失识的老人,其行为看上去像是无目的的。再比如,新生婴儿睁开眼睛时,有意向性吗?如果有,如何界定与描述?新生婴儿的肢体动作有意图吗?有目的吗?哲学家当然对这些问题都有过探讨。本文研究的个性特点在于,探讨这些问题首先放到儿童、老人跟周边环境做多模态互动的场景里。这些多模态互动通过录像可以捕捉下来,由此把纯哲学思辨性研究跟实证型研究结合起来。


顾曰国教授简介


 

顾曰国,现任中国社会科学院语言研究所研究员、应用语言学研究室主任、语料库暨计算语言学研究中心主任、北京外国语大学中国多语言多模态语料库暨大数据研究中心主任、博士生导师、中国社会科学院创新工程首席研究员。

1985年获英国兰开斯特大学语言学系语言研究优等硕士学位,1987年获该系语用学与修辞学博士学位,师从英国学术院院士Leech教授。1988年从英国学成回国,1988年至1990年在北京外国语大学外国语言研究所从事博士后研究, 1991-1998年先后任该校英语二系主任、应用英语学院院长、校长助理。1998-至今中国社会科学院语言研究所研究员(二级)。

主要研究兴趣包括语料库语言学、语用学、话语分析、英语教育等。代表作有Studies in Pragmatics and Discourse Analysis,Using the Computer in ELT: Practice and Theory,Chinese Painting,编写英语教材40余部。

国际学术刊物编委有: Journal of PragmaticsText and TalkPragmatics Journal of Intercultural Communication, Journal of Multicultural Discourses, Journal of Corpora, International Review of Pragmatics, Pragmatics and Society, Dialogue and Language, Journal of Asian Art and Communication

国际学术兼职有英国诺汉大学特聘教授、兰斯特大学特聘研究员,香港理工大学校外学术顾问、澳大利亚西悉尼大学外聘教授、彼得大帝彼得堡理工大学访问讲习教授等。国内学术兼职有北京外国语大学冠名讲习教授、浙江大学、同济大学、人民大学、重庆大学、山西大学、安徽师范大学等客座教授。中国计算机辅助外语教学专业委员会(ChinaCALL)主任委员。

先后获霍英东教育基金第四届青年教师科研类一等奖、北京市哲学社会科学优秀论文一等奖、中国国氏博士后奖、国家级优秀回国人员、国家级优秀博士后称号以及英国兰卡斯特大学荣誉博士等。



人类句法的双向生长模式

—语言获得的演化观

 

胡建华

中国社会科学院语言研究所

 

本文以演化的视角研究人类句法结构的生长。本文认为,儿童出生后即以双向生长的模式建构句法结构。在会说话之前,儿童就通过以(表达情感、态度的)发声(vocalization)为特点的互动和指向(pointing)来构建传递信息的结构,从而以言行事。互动和指向是儿童早期建构句子的基础:指向用来建构VP层,发声则建构CP层。儿童的发声体现命题态度(propositional attitude),而指向体现命题内容(propositional content)。

从演化的角度看,互动发声与指向的结合是人类交际系统与动物传讯系统分离的第一步。指向是一种境况化认知(situated cognition)活动,既可以指物,也可以表征事件,因此根据相应境况(situation),既可以理解为NP,也可以理解为VP。人类交际系统的进一步精细化,就是对时空以及可能世界的量化表征,时体以及情态系统的发展使得人类交际系统进入了人类语言的世界。

人类从互动、指向到发展出合并技术,经历了漫长的历史发展过程,而这一切都是演化选择的结果。语言是在演化中被自然不断选择的大脑的副产品,而不是大脑基因突变的产物。在演化的长河中,先是具有互动能力的大脑胜出,然后在这一基础上,经过长期演化,具有指向能力的大脑进一步胜出。指向需要以互动为基础,需要一个具有共享意图的社会心灵来支撑。指向的进一步发展,必然导致指称,而指称的复杂化和精细化则会导致合并。合并的动因在于区分不同的指向,在于指称表达的精确化。



胡建华教授简介


 

胡建华博士,中国社会科学院语言研究所研究员、当代语言学研究室主任、《当代语言学》主编、中国社会科学院研究生院语言学系博士生导师、国际中国语言学学会执行秘书长。

研究方向为形式句法学、语义学、理论语言学、演化句法学、儿童语言获得与认知发展。曾主持完成国家教育部人文社会科学研究九五规划项目《西方语言理论和汉语研究的结合与中国语言学的发展》、国家社科基金一般项目《量化辖域的句法-语义接口研究》、中国社会科学院重点研究课题《论元结构与现代汉语形式句法研究》、中国社会科学院哲学社会科学创新工程项目《汉语儿童语法获得与认知发展:跟踪调查与横向实验研究》以及中国社会科学院-匈牙利科学院合作研究项目《自然语言信息结构的接口研究》。

目前主持国家社科基金重点项目《论元选择中的显著性和局部性研究》和中国社会科学院登峰战略特殊学科建设项目《心理语言学语言的获得与发展》。



语言获得研究中的两种张力

 

李行德

香港中文大学语言学及现代语言系

 

语言获得研究的历程中一直呈现着两种张力:一种张力来自理性主义和经验主义的对立:体现理性主义的语言天赋论,以语言获得的逻辑问题为出发点,凸显刺激的贫乏现象,探讨与生俱来的语言知识和专司语言的认知能力,以解释语言获得为何如此迅速而且呈现系统性;代表经验主义的基于使用理论,则强调语言与其他认知能力的同质性,关注语言发展中的社会和互动因素,探讨人们如何利用一般的认知能力以及语言输入的特征,逐步而零散地掌握语法格式,从而最终掌握成人语法。两种学术思路所关心的现象及所提倡的研究法都不大一样,造成两个针锋相对的学派只能共存而缺乏真正的学术对话。另一种张力源于语言共性和个性之间存在着一定的复杂性:在生成语法的原则与参数的框架底下,一些似乎放之四海皆准的句法原则,落实到具体语言反映了理论和语料不相符的矛盾,往往即使运用参数这个概念也无法圆满地加以解决。本文讨论以上两种张力是如何影响汉语语言获得研究的,以及这些张力的必然性和必要性。



李行德教授简介


李行德Thomas Hun-tak Lee教授在香港接受中小学教育;在美国索思摩Swarthmore大学获得文学学士,主修英国文学;香港大学获得语言学硕士学位;1986年在加州大学洛杉矶分校获得语言学博士学位。博士毕业后分别在香港城市大学和香港中文大学任教,现任香港中文大学语言学及现代语言系教授、系主任。担任Journal of East Asian LinguisticsInternational Journal of Chinese Linguistics、《当代语言学》、《现代外语》、《外语教学与研究》、《台湾语言学》等语言学期刊编委。曾任Language and Linguistics副主编(2013-15)Journal of Chinese Linguistics编委 1999-2013)。曾任广东外语外贸大学、台湾中正大学、北京语言大学客座教授,2003-2005年任湖南大学认知科学研究所岳麓学者。1990-1991任香港语言学会会长,2010-2011任国际中国语言学学会会长。

李行德教授的研究领域为句法和语义学、语言获得,尤其关注粤语和普通话母语的获得过程。主导创建了CANCORP(香港粤语儿童语言语料库),自2002年以来作为研究团队重要成员创建香港粤语口语语言量表(HKCOLAS)。曾分别在北京、湖南、香港主持汉语儿童语言获得项目(CELA),研究0-2岁中国儿童如何获得目标语的重要特质。目前研究项目主要为汉语与格结构中的量化辖域、粤语A-逻辑量词、粤语名词短语的句法演变、以及上海话语法获得。



大数据和社会场景下的互动语言意图深度理解研究

 

宋大为

天津大学计算机科学与技术学院

 

随着在线社会媒体的快速发展,海量的真实互动对话文本在互联网空间中构建了一个现实社会的平行系统。典型的互动场景包括在线论坛和评论、电子邮件、在线实景聊天对话(文本或语音转录文本)等。这一平行系统中的互动语言大数据环境为我们分析社会、了解社会乃至管理社会都提供了珍贵的资源,特别是真实场景中的互动对话意图(例如话题和情感)的深度分析的社会价值尤为凸显。我们在真实的社会互动场景下,针对互联网存在的大规模互动对话文本信息,结合语言学和社会学相关理论,融合语义、情感和语境上下文,建立意图的可计算定义和表示体系,并建设大规模标注语料库。利用以深度学习为核心的计算方法,深入刻画人际互动语言中的语义和情感属性,构建面向对话人-话题-情感的混合知识图谱,进而实现社会互动场景下语言意图的深度理解和动态分析,并建设实时、可视和交互式的验证平台。


宋大为教授简介


宋大为教授,2000 7 月在香港中文大学系统工程与工程管理系获得博士学位。2012 3 月至今,担任天津大学计算机科学与技术学院天津市千人计划特聘教授,同时兼任英国开放大学(The Open University)兼职讲席教授和罗伯特戈登大学(The Robert Gordon University)荣誉讲席教授。在此之前,自2008 11月起担任英国罗伯特戈登大学计算机学院讲席教授,20059月至200810月,在英国开放大学知识媒体研究所担任高级讲师,兼任Director of Research20009月至20057月,在澳大利亚分布式技术研究中心任高级研究科学家。

主要研究兴趣包括信息检索、自然语言处理和计算智能,致力于发展符合人类信息推理和认知特点的智能信息检索和大规模知识发掘理论与方法。近年来,大力推动基于量子力学理论的探索式信息检索、用户认知和自然语言理解研究。已发表高水平论文160余篇,获得若干国际学术会议(包括2011年国际信息检索理论会议、2011年欧洲信息检索会议、2015年全国信息检索学术会议)最佳论文奖。

近年来,作为项目负责人获得了英国EPSRC、英国皇家学会、欧盟第七框架和地平线计划,以及中国国家自然科学基金委和科技部973863计划等共10余个项目资助。特别是2016年获得欧盟地平线计划玛丽居里创新研究网络项目350万欧元和中国自然科学基金重点项目300万元资助。其研究也得到若干知名国内外组织和公司的支持,例如IBM、雅虎、微软、百度等。

作为学术领导者活跃在多项国际学术活动中,曾担任英国计算机学会信息检索专家组秘书长、亚洲信息检索会议(Asian Information Retrieval Societies Conference - AIRS)指导委员会(Steering Committee)主席、以及多个在信息检索领域有影响力的国际学术会议( SIGIRECIRICTIRAIRS ) 的程序委员会主席、组委会主席或领域主席。自2012年加入天津大学后,带领团队成功主办2012年亚洲信息检索会议和2014年中文信息处理技术暑期学校,最近获得2018年国际计算机学会(ACM)信息检索理论国际会议(ICTIR)主办权。


人脑语言功能区的定位与保护

 

谭力海

深圳神经科学研究院语言与大脑实验室

 

语言在人脑中的神经表达问题一直是语言学和神经科学研究的重要问题一百多年来,国际神经科学领域的学者普遍主张大脑语言功能区统一论Universal Theory),认为世界上所有各类语言均由相同的大脑区域处理(如Paulesu et al., Science, 2001Dehaene et al., PNAS, 2012)。然而,我们实验室过去十几年应用功能磁共振技术对中文脑机制的研究发现,中文作为一种表意文字,与拼音文字(如英文)在语言特征和神经表达方面有显著区别。我们设计了不同语言水平的实验范式,研究了千余名中国正常和异常人群(如阅读障碍者)),发现与英文不同,除国际公认的语言加工脑区外,中文还涉及到左脑额中回、左脑顶上回、右脑视觉皮层三个西方语言加工通常不涉及的关键脑区。这些发现表明,与传统的认为负责英文加工的靠近听觉区的脑区不同,临近大脑运动区的额中回主管中文;相对于英文来说,左顶上回和右视觉区两个负责空间分析和基本视觉过程的脑区对中文信息处理极为重要。在大量实验事实的基础上,我们提出了大脑语言功能区文化特异性理论。我们的研究结果为脑疾病患者手术前的语言脑功能区的临床诊断提供了重要科学根据。此外,通过对中文阅读障碍者的遗传基础研究,我们发现,CNTN4是导致中文阅读障碍的基因,这一基因与神经发育异常有关,但过去对西方语言阅读障碍的研究并没有发现这一基因的变异。对基因异常与大脑活动和大脑结构的关系的探讨将是未来神经语言学和神经科学研究的重要方向。


谭立海教授简介


 

谭力海博士,深圳市神经科学研究院院长、深圳大学医学部特聘教授、中组部千人计划创新长期项目专家、科技部国家重点基础研究计划(973计划)项目首席科学家。

曾任香港大学神经语言学终身教授、香港大学脑与认知科学国家重点实验室主任(20059 – 2014年)。现为《当代语言学》、Human Brain MappingNeuroscienceJournal of NeurolinguisticsCulture and Brain等学术期刊的编委。已发表百余篇学术论文,包括作为第一作者或者通讯作者发表在Nature (1)PNAS (10)Current Biology (1)的论文。国际学术期刊 Nature, Science, PNAS, Current Biology, Neuron, Journal of Neuroscience等二十余种杂志特邀评审委员。主要研究方向:应用神经影像技术对人脑处理语言的区域进行精准定位。主要研究成果包括:在国际神经科学界创立了大脑语言功能区文化特异性理论 (Culture-specific Theory);应用人脑语言功能区的发现到颅脑手术,指导临床上对脑疾病患者进行个体化手术入路设计,在最大程度上保护我国国民大脑的语言功能;在基因、脑、行为三个层面对中文失读症进行系统研究,探寻我国国民语言障碍的特定脑功能异常模式和基因表达,为早期干预设计科学方案。