用户姓名:
用户密码:


科研管理
规范标准
普通话和语言教学研究
汉字与汉语拼音研究
社会语言与媒体语言研究
计算语言学研究
 计算语言研究室
 简介·职责  人员介绍  科研项目  科研成果  联系我们
 
科研成果
  ·现代汉语语料库
  大型通用语料库, 按照通用性、描述性、实用性等原则系统地抽样选择了1919-1992年的现代汉语语言材料7000万字,由人文与社会科学、自然科学及综合三个大类约40个小类组成。每年增补约350万字的新语料。目前语料库规模为1亿字,已切分标注好5千万。
  ·信息处理用现代汉语词类标记集规范
  ·现代汉语分词词表,88000词条
  ·句法树库,5万句
  ·语料库查询检索、词语切分和词性标注、频率统计、例句提取等一系列软件工具。
  ·超大规模通用平衡语料库
    规模大:共15亿字以上,首期生语料15亿,平衡抽样且带XML标记的约8千万字。
    通用性:A.语料库以XML标记文档形式提供,有利于资源共享;
        B. 语料库选材广泛,覆盖面广,适合多种领域的应用需求;
    平衡性:从客观反映现代汉语使用情况的角度出发制定语料库平衡原则。
  ·国家语委普通话测试语音数据库
   精选自国家语委普通话水平测试中心全国测试数据,已完成1千人250小时语音数据,并进行了语音内容标注。
政策法规|普通话知识|课程教材|测试指南|测试样卷|测试研究
教育部语言文字应用研究所(国家语委普通话与文字应用培训测试中心)版权所有 不得复制 2005
北京市朝阳门内南小街51号
电话:010-65592909(办公室) 010-65224901(中心)yysbgsh@sina.com