es分词字段类型
在 Elasticsearch 中,分词字段类型主要有以下几种:
1. text: 用于存储未被分词的文本数据,也称为“原始文本”。
2. keyword: 用于存储已经被分词的文本数据,并使用关键字(keyword)进行索引。这种类型的字段可以被搜索、排序和聚合,但不支持模糊匹配。
3. ngram: 用于存储使用 n-gram 分词算法分词后的文本数据。n-gram 分词算法可以将文本划分为连续的 n 个字符或单词,并将这些划分存储为一个字段。这种类型的字段可以被搜索、排序和聚合,并且支持模糊匹配和前缀匹配。
4. edge_ngram: 用于存储使用 edge-ngram 分词算法分词后的文本数据。edge-ngram 分词算法将文本划分为连续的 n 个字符或单词,并将这些划分存储为一个字段。与 ngram 不同的是,edge-ngram 分词算法只考虑文本中的边缘字符,而不考虑中间的字符。这种类型的字段可以进行搜索、排序和聚合,并且支持模糊匹配和前缀匹配。
5. keyword_prefix: 用于存储使用前缀分词算法分词后的文本数据。前缀分词算法将文本划分为以某个前缀开头的单词,并将这些单词存储为一个字段。这种类型的字段可以进行搜索、排序和聚合,并且支持模糊匹配和前缀匹配。
6. keyword_suffix: 用于存储使用后缀分词算法分词后的文本数据。后缀分词算法将文本划分为以某个后缀结尾的单词,并将这些单词存储为一个字段。这种类型的字段可以进行搜索、排序和聚合,并且支持模糊匹配和前缀匹配。
7. text_ngram: 用于存储使用 n-gram 分词算法分词后的文本数据。n-gram 分词算法可以将文本划分为连续的 n 个字符或单词,并将这些划分存储为一个字段。与 ngram 不同的是,text_ngram 分词算法只考虑文本中的字符,而不考虑单词。这种类型的字段可以进行搜索、排序和聚合,并且支持模糊匹配和前缀匹配。
免责声明:本站发布的教育资讯(图片、视频和文字)以本站原创、转载和分享为主,文章观点不代表本网站立场。
如果本文侵犯了您的权益,请联系底部站长邮箱进行举报反馈,一经查实,我们将在第一时间处理,感谢您对本站的关注!
新励学网教育平台
海量全面 · 详细解读 · 快捷可靠
累积科普文章数:18,862,126篇