汉语垂悬话题句的理解与计算

主讲人 孙坤
主持人 桑紫宏
开始时间 2023年10月13日(周五)13:30
结束时间 2023年10月13日(周五)15:00
地点 虹口校区-会议中心-凯旋厅
主办方 国际文化交流学院
语言 汉语
内容提要

话题结构在汉语中普遍存在,垂悬话题结构是汉语语言学研究的难点之一。本研究使用计算和认知实验相结合的方法来揭示垂悬结构的本质特点。首先,计算方法上,我们使用点式互信息(PMI)和语义相似性来计算垂悬式话题结构中的话题与评述之间的关系, 提出了利用自然语言处理和人工智能最新的三种技术来计算话题和评论之间的关系。 其次,人类行为实验收集了对垂悬结构认知理解的数据,使用了让测试者对垂悬式话题结构的接受程度进行评分的方法。高级统计回归分析结果表明,PMI和三种语义相似度测量可以较好地预测人类评分数据。这是首次利用 PMI 和基于句子的语义相似性来预测人类如何理解和处理整体句子。PMI和语义相似性测量可以模拟计算话题结构内部语义关系,有助于深入洞察汉语母语者如何从整体上理解句子。更重要的是,本研究创造了一种新颖、高效和实用的计算方法来量化和计算汉语话题句,这种计算方法可以应用到多种汉语语言现象量化研究中。本文提倡的计算与认知结合的研究范式可以进一步推动语言学理论和汉语研究的科学化进程。

人物简介

孙坤

男,副教授,现任职于德国图宾根大学语言学系。研究领域为计算语言学、语言认知、篇章语言学和语言变化等。研究方法主要有计算模型、机器学习/深度学习、语料库和认知实验。截至目前,以第一作者(或独立作者)在《中国语文》《当代语言学》《语言教学与研究》《汉语学习》等语言学类CSSCI期刊上发表研究论文11篇(其中《中国社会科学文摘》转载1篇,人大复印资料全文转载3篇)。以第一作者(或独立作者)在PNAS, TACL, Psychonomic Bulletin & Review, Corpus Linguistics & Linguistic Theory, Scientometrics, Language Sciences, Discourse Studies等SSCI语言学、认知和计算科学类国际期刊上发表研究论文17篇。曾完成国家社科基金项目一项,全国博士后基金特别资助一项,以及其他省部市级项目若干项。参与多项欧盟科学基金高级项目。

更多活动
选择日期当天没有活动!