现代汉语构式的语义表征与构式知识库的构建
主讲人:詹卫东教授
时间:
2015-06-18 15:10
地点:北大哲学系
B114
(地下)
简介:
传统的基于词汇语义组合的句义表示框架,在应用于真实语料的句法语义分析和内容理解任务时,虽可以覆盖一般的情况,但还是碰到不少问题,其中构式(
construction
)的语义该如何分析,就是一个很大的问题,是面向语义计算的语料库标注中需要解决的难题。本文在借鉴国外形式化构式语法理论研究(如
Sign-based Construction Grammar
以及基于框架网的构式语料标注研究(
FrameNet Construction
)基础上,探讨汉语构式的语义表征问题。本文把构式看作是词和短语之外的语言单位。作为基于语块(
chunk
)的语言单位,构式是对基于词的常规语法组合的必要补充。构式的语义描述,需要在语块中区分常项和变项,融汇词语与结构的语义模式、综合内部和外部的约束条件,进行分层描写,给出语义描述框架。
在语言工程层面,构式的知识描述更适合采用类似词库的方式。为此,我们收集了现代汉语
1300
多条构式,大体分为四种类型:(
1
)短语型构式;(
2
)复句型构式;(
3
)半凝固型构式;(
4
)实例化构式。现阶段重点分析了短语型构式(
484
条,占
37%
)的句法形式和语义构成特征,大体有六种情况:(
1
)异常组配(例如:那个紧张啊);(
2
)同型复现(例如:一天比一天严重);(
3
)成分省略(例如:糊涂得可以);(
4
)成分冗余(例如:像做贼似的);(
5
)语序异常(例如:老百姓一个);(
6
)论元结构异常(例如:跑了我一身汗)。在此基础上,本文通过示例方式,介绍目前初步提出的一个分层级描写构式语义的框架,包括:(
1
)字面义;(
2
)命题义;(
3
)指称义;(
4
)交际义。其中字面义对构式内部成分所属的基本概念范畴加以描写。命题义对构式所包含的基础谓词事件结构加以描写(还有待扩展到复合事件内部关系语义描述)。指称义则说明构成成分中名词性成分取内涵语义还是外延语义。交际义是构式语义描写的重点,对说话人的交际意图,构式适用语境,交际效果(如修辞色彩)等加以说明。
*
本文研究工作得到国家重点基础研究发展计划(
2014CB3405042013
),教育部人文社科重点研究基地重大项目(
13JJD740001
),国家社科基金重大项目(
12&ZD175
)和国家社科基金面上项目(
12BYY061
)资助,特此致谢。
主讲人简介:
詹卫东
男,
1999
年获北京大学博士学位后留校任教。现为北京大学中文系教授,计算语言学研究所副所长。主讲课程
“
现代汉语
”“
自然语言处理导论
”“
语言工程与中文信息处理
”“
计算语言学概论
”
等。主要研究领域为现代汉语语法、词汇语义学、语言知识工程、语文文字规范研究等。著有《面向中文信息处理的现代汉语短语结构规则研究》(清华大学出版社
2000
年),合编应用语言学教材《计算语言学概论》(商务印书馆
2003
年),主编《出版物上数字用法》国家标准(中国标准出版
2011
年)。
欢迎老师和同学们参加!
北京大学语言、逻辑、认知、计算跨学科论坛