金罡博士开发的《蒙古秘史》全文检索系统(测试版)上线 http://118.187.5.224/ ,欢迎大家使用并提出宝贵意见。本系统主要针对秘史语言研究,可从文本、词性、词法、词元(lemma)、语义类、旁译等多重视角检索利用。
本系统在前人所研究的基础上,融入了国际标准建库方案,既基于TEI(Text Encoding Initiative)标注模式的语料库建设方案,将学界最受欢迎的《四部丛刊三编》影印顾广圻校本《蒙古秘史》数据化、并利用XML(eXtensible Markup Language)置标语言构建为符合国际标准格式的语料库,专门针对语言学研究标注了《蒙古秘史》全部词汇的词性、词法、词元(lemma)、语义类、旁译等大量信息,并通过Web技术为《蒙古秘史》研究人员提供了极为方便的操作共享平台,从而改善了先行研究中构建的《蒙古秘史》语料库中没有完全标注语料及不能方便地共享语料库的缺陷。利用本系统不仅可快速方便地检索、统计、排序《蒙古秘史》语言形式,亦可依据检索到的数据进一步分析、挖掘《蒙古秘史》深层知识,探索蒙古语言文字历史变迁。
本研究是金罡博士于2012-2016年完成的国家社科基金项目《蒙古语TEI标注模式历时语料库的建设与应用研究》的部分成果。
金罡,8455线路检测中心蒙古文化研究所副教授,内蒙古民族文化产业研究院特聘研究员,毕业于东京外国语大学地域文化研究科语言学专业,美国印第安纳大学东欧亚研究系博士后。主要研究方向为自然语言处理、蒙英日语言研究等。