现代汉语构式的语义表征与构式知识库的构建

2015年06月16日
|
浏览量:103
现代汉语构式的语义表征与构式知识库的构建
主讲人:詹卫东教授
时间: 2015-06-18 15:10
地点:北大哲学系 B114 (地下)
简介: 传统的基于词汇语义组合的句义表示框架,在应用于真实语料的句法语义分析和内容理解任务时,虽可以覆盖一般的情况,但还是碰到不少问题,其中构式( construction )的语义该如何分析,就是一个很大的问题,是面向语义计算的语料库标注中需要解决的难题。本文在借鉴国外形式化构式语法理论研究(如 Sign-based Construction Grammar 以及基于框架网的构式语料标注研究( FrameNet Construction )基础上,探讨汉语构式的语义表征问题。本文把构式看作是词和短语之外的语言单位。作为基于语块( chunk )的语言单位,构式是对基于词的常规语法组合的必要补充。构式的语义描述,需要在语块中区分常项和变项,融汇词语与结构的语义模式、综合内部和外部的约束条件,进行分层描写,给出语义描述框架。
在语言工程层面,构式的知识描述更适合采用类似词库的方式。为此,我们收集了现代汉语 1300 多条构式,大体分为四种类型:( 1 )短语型构式;( 2 )复句型构式;( 3 )半凝固型构式;( 4 )实例化构式。现阶段重点分析了短语型构式( 484 条,占 37% )的句法形式和语义构成特征,大体有六种情况:( 1 )异常组配(例如:那个紧张啊);( 2 )同型复现(例如:一天比一天严重);( 3 )成分省略(例如:糊涂得可以);( 4 )成分冗余(例如:像做贼似的);( 5 )语序异常(例如:老百姓一个);( 6 )论元结构异常(例如:跑了我一身汗)。在此基础上,本文通过示例方式,介绍目前初步提出的一个分层级描写构式语义的框架,包括:( 1 )字面义;( 2 )命题义;( 3 )指称义;( 4 )交际义。其中字面义对构式内部成分所属的基本概念范畴加以描写。命题义对构式所包含的基础谓词事件结构加以描写(还有待扩展到复合事件内部关系语义描述)。指称义则说明构成成分中名词性成分取内涵语义还是外延语义。交际义是构式语义描写的重点,对说话人的交际意图,构式适用语境,交际效果(如修辞色彩)等加以说明。
* 本文研究工作得到国家重点基础研究发展计划( 2014CB3405042013 ),教育部人文社科重点研究基地重大项目( 13JJD740001 ),国家社科基金重大项目( 12&ZD175 )和国家社科基金面上项目( 12BYY061 )资助,特此致谢。
主讲人简介: 詹卫东 男, 1999 年获北京大学博士学位后留校任教。现为北京大学中文系教授,计算语言学研究所副所长。主讲课程 现代汉语 ”“ 自然语言处理导论 ”“ 语言工程与中文信息处理 ”“ 计算语言学概论 等。主要研究领域为现代汉语语法、词汇语义学、语言知识工程、语文文字规范研究等。著有《面向中文信息处理的现代汉语短语结构规则研究》(清华大学出版社 2000 年),合编应用语言学教材《计算语言学概论》(商务印书馆 2003 年),主编《出版物上数字用法》国家标准(中国标准出版 2011 年)。
欢迎老师和同学们参加!
北京大学语言、逻辑、认知、计算跨学科论坛