书目

组织机构名称多维度研究

内容简介

本书基于大规模动态流通语料库,抽取395万条左右的海量中文组织机构名称数据及其相关信息。以大数据为基础,从分词标注技术、语言资源开发与应用、语言规范化、语言本体等多个角度,针对组织机构名称这一特殊词语类别进行深入研究,从中心词角度提出中文组织名称形式化分类体系,提出中文组织名称“领域表征值”概念,并应用这一概念研究文本分类和通用词语,提出组织机构名称的两种结构模式、四类结构成分及其形式、性质、规则条件,以及组织机构名缩略的九个规则。确定了中文组织名称的三类上下文搭配形式、组织机构名称的分布特征,及中文组织机构名称识别方案。本书的主要内容包括组织机构名称识别、组织机构名称的界定与资源建设、组织机构名称规则、组织机构名称动态监测、组织机构名称的规范化等。

作者简介

陈慧,北京外国语大学中文学院副教授,汉语国际教育专业硕士研究生导师。华中科技大学汉语言文学学士,武汉大学社会语言学硕士,北京语言大学自然语言处理博士。在计算语言学、对外汉语教学、计算机应用、教育学、教育技术学等领域公开发表中英文论文近五十篇。多篇论文被SCI/EI/ISTP/CSSCI收录。为《国家语言生活状况绿皮书》(2005、2009、2013年)作者之一。参与并结项国家社科项目“语言接触对聋人手语发展演变的影响研究”、国家自科项目“中文文本自动分类关键技术研究”、国家语委重大项目“国家语言资源监测”。独立承担并结项国家语委重大项目子项目“基于语料库的组织机构名研究”、汉办多语种基地项目“汉语课堂教学实例库建设”及五项北外中文学院院级项目。当前独立承担并在研校级项目为“汉语中介语语料库技术及教学应用”。

目录

—  END  —