社区教程 Wiki

注册登录

创作新主题

社区所有版块导航

Python

python开源 Django Python DjangoApp pycharm

DATA

docker Elasticsearch

分享

问与答闲聊招聘翻译创业分享发现分享创造求职区块链支付之战

aigc

aigc chatgpt

WEB开发

linux MongoDB Redis DATABASE NGINX 其他Web框架 web工具 zookeeper tornado NoSql Bootstrap js peewee Git bottle IE MQ Jquery

机器学习

机器学习算法

Python88.com

反馈公告社区推广

产品

短视频

印度

印度

关注

Py学习 » Elasticsearch

999 - Elasticsearch Analysis 04 - Token Filter

歌哥 • 4 年前 • 320 次点击

2019年10月09日阅读 2

999 - Elasticsearch Analysis 04 - Token Filter

太多了不想写了，随便写了两个，这个根据需要去官网看文档吧。

ASCII Folding Token Filter

转为Ascii码等效项。

Length Token Filter

删除过长、过短的字词。

参数	说明
min	最小数值. 默认 0.
max	最大数值. 默认 Integer.MAX_VALUE.

Lowercase Token Filter

小写词元。

参数	说明
language	greek, irish, turkish

Uppercase Token Filter

大写词元

NGram Token Filteredit

nGram词元过滤器。

参数	说明
min_gram	默认为1。
max_gram	默认为2。

Edge NGram Token Filter

edgeNGram词元过滤器。

参数	说明
min_gram	默认为1。
max_gram	默认为2。
side	已弃用。front或back，默认front。

Stop Token Filteredit

删除停止词。

参数	说明
stopwords	停止词列表。默认`_english_`。
stopwords_path	停止词文件。文件路径相对于config目录或使用绝对路径。每个停止词必须单独一行。文件为UTF-8编码。
ignore_case	设为true所有词被转为小写。默认false。
remove_trailing	设置为false忽略最后一个字词是停止词的情况。默认true。

Python社区是高质量的Python/Django开发社区
本文地址：http://www.python88.com/topic/46607

320 次点击

登录后回复

关于移动版 · 三行代码 · 今天看啥 · Code · link之家 · 卧龙搜索 · 藏经阁 · 小百科

Py学习 - 专注于Python技术发展的社区(原Django社区)

沪ICP备11025650号