当前位置:新励学网 > 秒知问答 > 语料库汇总

语料库汇总

发表时间:2024-07-21 02:47:20 来源:网友投稿

1.BCC语料库

北京语言大学的BCC汉语语料库,总字数约150亿字,包括:报刊(20亿)、文学(30亿)、微博(30亿)、科技(30亿)、综合(10亿)和古汉语(20亿)等多领域语料。

网址:http://bcc.blcu.edu.cn/

网站页面如下图:

2.CCL语料库

北京大学中国语言学研究中心的CCL语料库,包括现代汉语语料库、古代汉语语料库、汉英双语语料库(仅限北大校内用户使用)。

网址:http://ccl.pku.edu.cn:8080/ccl_corpus/index.jsp

网站页面如下图:

3.语料库在线

功能强大除了可以实现语料库检索功能以外,还可分析处理语料。语料库检索包括现代汉语语料库、古代汉语语料库、语料库字词索引。语料分析处理包括:分词和词性标注、汉语拼音标注、字词频率统计。

网址:http://corpus.zhonghuayuwen.org/index.aspx

网址页面如下:

4.澜科语言科技

澜科语言科技语料库包括汉语教材语料库、全球华语语料库、中小学作文语料库、网页分类新闻语料库。

网址:http://www.languagetech.cn/corpus/

网站页面如下:

小rainbow

2019.7.25

免责声明:本站发布的教育资讯(图片、视频和文字)以本站原创、转载和分享为主,文章观点不代表本网站立场。

如果本文侵犯了您的权益,请联系底部站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!