自然语言处理有哪些实际开源项目,新手学习
最近我们实验室整理发布了一批开源NLP工具包,这里列一下,欢迎大家使用。未来不定期更新。
2016年3月31日更新,在THULAC新增Python版本分词器,欢迎使用。
中文词法分析
THULAC:一个高效的中文词法分析工具包
包括中文分词、词性标注功能。已经提供C++、Java、Python版本。
中文文本分类
THUCTC:一个高效的中文文本分类工具
提供高效的中文文本特征提取、分类训练和测试功能。
THUTag:关键词抽取与社会标签推荐工具包
GitHub-YeDeming/THUTag:APackageofKeyphraseExtractionandSocialTagSuggestion
提供关键词抽取、社会标签推荐功能,包括TextRank、ExpandRank、TopicalPageRank(TPR)、Tag-LDA、WordTriggerModel、WordAlignmentModel等算法。
PLDA/PLDA+:一个高效的LDA分布式学习工具包
知识表示学习
知识表示学习工具包
GitHub-Mrlyk423/Relation_Extraction:KnowledgeBaseEmbedding
包括TransE、TransH、TransR、PTransE等算法。
考虑实体描述的知识表示学习算法
GitHub-xrb92/DKRL:RepresentationLearningofKnowledgeGraphswithEntityDescriptions
词表示学习
跨语言词表示学习算法
LearningCross-lingualWordEmbeddingsviaMatrixCo-factorization
主题增强的词表示学习算法
GitHub-largelymfs/topical_word_embeddings:Ademocodefortopicalwordembedding
可解释的词表示学习算法
GitHub-SkTim/OIWE:OnlineInterpretableWordEmbeddings
考虑字的词表示学习算法
GitHub-Leonard-Xu/CWE
网络表示学习
文本增强的网络表示学习算法
GitHub-albertyang33/TADW:codeforIJCAI2015paperNetworkRepresentationLearningwithRichTextInformation
免责声明:本站发布的教育资讯(图片、视频和文字)以本站原创、转载和分享为主,文章观点不代表本网站立场。
如果本文侵犯了您的权益,请联系底部站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!
新励学网教育平台
海量全面 · 详细解读 · 快捷可靠
累积科普文章数:18,862,126篇