当前位置:新励学网 > 秒知问答 > 自然语言处理有哪些实际开源项目,新手学习

自然语言处理有哪些实际开源项目,新手学习

发表时间:2024-07-27 17:05:37 来源:网友投稿

最近我们实验室整理发布了一批开源NLP工具包,这里列一下,欢迎大家使用。未来不定期更新。

2016年3月31日更新,在THULAC新增Python版本分词器,欢迎使用。

中文词法分析

THULAC:一个高效的中文词法分析工具包

包括中文分词、词性标注功能。已经提供C++、Java、Python版本。

中文文本分类

THUCTC:一个高效的中文文本分类工具

提供高效的中文文本特征提取、分类训练和测试功能。

THUTag:关键词抽取与社会标签推荐工具包

GitHub-YeDeming/THUTag:APackageofKeyphraseExtractionandSocialTagSuggestion

提供关键词抽取、社会标签推荐功能,包括TextRank、ExpandRank、TopicalPageRank(TPR)、Tag-LDA、WordTriggerModel、WordAlignmentModel等算法。

PLDA/PLDA+:一个高效的LDA分布式学习工具包

知识表示学习

知识表示学习工具包

GitHub-Mrlyk423/Relation_Extraction:KnowledgeBaseEmbedding

包括TransE、TransH、TransR、PTransE等算法。

考虑实体描述的知识表示学习算法

GitHub-xrb92/DKRL:RepresentationLearningofKnowledgeGraphswithEntityDescriptions

词表示学习

跨语言词表示学习算法

LearningCross-lingualWordEmbeddingsviaMatrixCo-factorization

主题增强的词表示学习算法

GitHub-largelymfs/topical_word_embeddings:Ademocodefortopicalwordembedding

可解释的词表示学习算法

GitHub-SkTim/OIWE:OnlineInterpretableWordEmbeddings

考虑字的词表示学习算法

GitHub-Leonard-Xu/CWE

网络表示学习

文本增强的网络表示学习算法

GitHub-albertyang33/TADW:codeforIJCAI2015paperNetworkRepresentationLearningwithRichTextInformation

免责声明:本站发布的教育资讯(图片、视频和文字)以本站原创、转载和分享为主,文章观点不代表本网站立场。

如果本文侵犯了您的权益,请联系底部站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!