Elasticsearch服务器开发(第2版)

出版日期:2015-3
ISBN:9787115380325
作者:[波兰] Rafa. Ku. Marek Rogoziński
页数:292页

作者简介

本书介绍了Elasticsearch这个优秀的全文检索和分析引擎从安装和配置到集群管理的各方面知识。本书这一版不仅补充了上一版中遗漏的重要内容,并且所有示例和功能均基于Elasticsearch服务器1.0版进行了更新。你可以从头开始循序渐进地学习本书,也可以查阅具体功能解决手头问题。

书籍目录

第1 章 Elasticsearch集群入门  1
1.1 全文检索  1
1.1.1 Lucene词汇表和架构  1
1.1.2 输入数据分析  3
1.1.3 评分和查询相关性  4
1.2 Elasticsearch基础  4
1.2.1 数据架构的主要概念  4
1.2.2 Elasticsearch主要概念  6
1.2.3 索引建立和搜索  6
1.3 安装并配置集群  8
1.3.1 安装Java  8
1.3.2 安装Elasticsearch  8
1.3.3 在Linux 上用二进制包安装Elasticsearch  9
1.3.4 目录布局  9
1.3.5 配置Elasticsearch  10
1.3.6 运行Elasticsearch  11
1.3.7 关掉Elasticsearch  12
1.3.8 Elasticsearch作为系统服务运行  13
1.4 用REST API操作数据  14
1.4.1 理解Elasticsearch的RESTfulAPI  14
1.4.2 在Elasticsearch中存储数据  15
1.4.3 新建文档  15
1.4.4 检索文档  16
1.4.5 更新文档  17
1.4.6 删除文档  18
1.4.7 版本控制  18
1.5 使用URI请求查询来搜索  20
1.5.1 示例数据  20
1.5.2 URI 请求  20
1.5.3 Lucene查询语法  26
1.6 小结  27
第2 章 索引  28
2.1 Elasticsearch索引  28
2.1.1 分片和副本  28
2.1.2 创建索引  29
2.2 映射配置  31
2.2.1 类型确定机制  31
2.2.2 索引结构映射  33
2.2.3 不同的相似度模型  43
2.2.4 信息格式  45
2.2.5 文档值  47
2.3 批量索引以提高索引速度  48
2.3.1 为批量索引准备数据  48
2.3.2 索引数据  48
2.3.3 更快的批量请求  50
2.4 用附加的内部信息扩展索引结构  50
2.4.1 标识符字段  50
2.4.2 _type字段  51
2.4.3 _all字段  52
2.4.4 _source字段  52
2.4.5 _index字段  53
2.4.6 _size字段  54
2.4.7 _timestamp字段  54
2.4.8 _ttl字段  55
2.5 段合并介绍  56
2.5.1 段合并  56
2.5.2 段合并的必要性  56
2.5.3 合并策略  57
2.5.4 合并调度器  57
2.5.5 合并因子  57
2.5.6 调节  58
2.6 路由介绍  58
2.6.1 默认索引过程  59
2.6.2 默认搜索过程  59
2.6.3 路由  61
2.6.4 路由参数  62
2.6.5 路由字段  62
2.7 小结  63
第3 章 搜索  64
3.1 查询Elasticsearch  64
3.1.1 示例数据  65
3.1.2 简单查询  66
3.1.3 分页和结果集大小  67
3.1.4 返回版本值  68
3.1.5 限制得分  69
3.1.6 选择需要返回的字段  69
3.1.7 使用脚本字段  71
3.2 理解查询过程  72
3.2.1 查询逻辑  72
3.2.2 搜索类型  73
3.2.3 搜索执行偏好  74
3.2.4 搜索分片API  75
3.3 基本查询  76
3.3.1 词条查询  76
3.3.2 多词条查询  77
3.3.3 match_all查询  77
3.3.4 常用词查询  78
3.3.5 match查询  79
3.3.6 multi_match查询  81
3.3.7 query_string查询  82
3.3.8 simple_query_string查询  84
3.3.9 标识符查询  84
3.3.10 前缀查询  84
3.3.11 fuzzy_like_this查询  85
3.3.12 fuzzy_like_this_field查询  86
3.3.13 fuzzy 查询  86
3.3.14 通配符查询  88
3.3.15 more_like_this查询  88
3.3.16 more_like_this_filed查询  89
3.3.17 范围查询  90
3.3.18 最大分查询  90
3.3.19 正则表达式查询  91
3.4 复合查询  91
3.4.1 布尔查询  92
3.4.2 加权查询  93
3.4.3 constant_score查询  94
3.4.4 索引查询  94
3.5 查询结果的过滤  95
3.5.1 使用过滤器  95
3.5.2 过滤器类型  96
3.5.3 过滤器的缓存  104
3.6 高亮显示  105
3.6.1 高亮显示入门  105
3.6.2 字段配置  106
3.6.3 深入底层  107
3.6.4 配置HTML标签  107
3.6.5 控制高亮片段  108
3.6.6 全局设置与局部设置  108
3.6.7 需要匹配  109
3.6.8 信息高亮器  111
3.7 验证查询  113
3.8 数据排序  115
3.8.1 默认排序  115
3.8.2 选择用于排序的字段  116
3.8.3 指定缺少字段的行为  118
3.8.4 动态条件  118
3.8.5 排序规则和国家特有字符  119
3.9 查询重写  119
3.9.1 重写过程示例  119
3.9.2 查询重写的属性  120
3.10 小结  121
第4 章 扩展索引结构  122
4.1 索引树形结构  122
4.1.1 数据结构  122
4.1.2 分析  123
4.2 索引非扁平数据  124
4.2.1 数据  124
4.2.2 对象  125
4.2.3 数组  125
4.2.4 映射  125
4.2.5 向Elasticsearch发送映射  127
4.2.6 动态还是非动态  127
4.3 使用嵌套对象  128
4.4 使用父子关系  131
4.4.1 索引结构和数据索引  131
4.4.2 查询  132
4.4.3 父子关系和过滤  134
4.4.4 性能考虑  134
4.5 使用更新API修改索引结构  135
4.5.1 映射  135
4.5.2 添加一个新字段  135
4.5.3 修改字段  136
4.6 小结  137
第5 章 更好的搜索  138
5.1 Apache Lucene评分简介  138
5.1.1 当文档被匹配时  138
5.1.2 默认评分公式  139
5.1.3 相关性的意义  140
5.2 Elasticsearch的脚本功能  140
5.2.1 脚本执行过程中可用的对象  140
5.2.2 MVEL  141
5.2.3 使用其他语言  141
5.2.4 使用自定义脚本库  142
5.3 搜索不同语言的内容  145
5.3.1 区分处理不同语言  145
5.3.2 多语言处理  145
5.3.3 检测文档的语言  146
5.3.4 示例文档  146
5.3.5 映射文件  147
5.3.6 查询  148
5.4 使用查询加权影响得分  150
5.4.1 加权  150
5.4.2 为查询添加加权  150
5.4.3 修改得分  153
5.5 索引时加权何时有意义  160
5.5.1 在输入数据中定义字段加权  160
5.5.2 在映射中定义加权  161
5.6 同义词  161
5.6.1 同义词过滤器  161
5.6.2 定义同义词规则  162
5.6.3 查询时或索引时的同义词扩展  164
5.7 理解解释信息  164
5.7.1 理解字段分析  164
5.7.2 解释查询  165
5.8 小结  167
第6 章 超越全文检索  168
6.1 聚合  168
6.1.1 一般查询结构  168
6.1.2 可用的聚合  170
6.1.3 聚合的嵌套  185
6.1.4 桶排序和嵌套聚合  187
6.1.5 全局和子集  187
6.2 切面  190
6.2.1 文档结构  190
6.2.2 返回的结果  190
6.2.3 使用查询进行切面计算  191
6.2.4 使用过滤器进行切面计算  192
6.2.5 terms切面  193
6.2.6 基于范围的切面  194
6.2.7 数值和日期直方图切面  196
6.2.8 数值型字段统计数据的计算  197
6.2.9 词条统计数据的计算  198
6.2.10 地理切面  199
6.2.11 切面结果的过滤  200
6.2.12 内存考虑  201
6.3 使用建议器  201
6.3.1 可用的建议器类型  201
6.3.2 包含建议器  201
6.3.3 term建议器  203
6.3.4 phrase建议器  204
6.3.5 completion建议器  205
6.4 预匹配器  209
6.4.1 示例索引  209
6.4.2 预匹配器的准备  209
6.4.3 深入  211
6.5 文件的处理  214
6.6 地理  217
6.6.1 为空间搜索准备映射  217
6.6.2 示例数据  218
6.6.3 示例查询  218
6.6.4 任意地理形状  222
6.7 卷动API  226
6.7.1 问题定义  226
6.7.2 作为解决方案的卷动  226
6.8 多词条过滤器  228
6.9 小结  232
第7 章 深入Elasticsearch集群  233
7.1 节点发现  233
7.1.1 发现的类型  233
7.1.2 主节点  234
7.1.3 设置集群名  235
7.1.4 节点的ping设置  236
7.2 时光之门与恢复模块  236
7.2.1 时光之门  236
7.2.2 恢复控制  237
7.3 为高查询和高索引吞吐量准备Elasticsearch集群  238
7.3.1 过滤器缓存  238
7.3.2 字段数据缓存和断路器  238
7.3.3 存储模块  239
7.3.4 索引缓冲和刷新率  240
7.3.5 线程池的配置  240
7.3.6 结合起来,一些通用建议  241
7.4 模板和动态模板  244
7.4.1 模板  244
7.4.2 动态模板  245
7.5 小结  246
第8 章 集群管理  248
8.1 Elasticsearch时光机  248
8.1.1 创建快照存储库  248
8.1.2 创建快照  249
8.1.3 还原快照  251
8.1.4 清理:删除旧的快照  252
8.2 监控集群的状态和健康度  252
8.2.1 集群健康度API  252
8.2.2 索引统计API  253
8.2.3 状态API  256
8.2.4 节点信息API  256
8.2.5 节点统计API  257
8.2.6 集群状态API  257
8.2.7 挂起任务API  258
8.2.8 索引段API  258
8.2.9 cat API  258
8.3 控制集群的再平衡  260
8.3.1 再平衡  260
8.3.2 集群的就绪  260
8.3.3 集群再平衡设置  260
8.4 控制分片和副本的分配  261
8.4.1 显式控制分配  262
8.4.2 集群范围的分配  264
8.4.3 每个节点上的分片和副本数量  265
8.4.4 手动移动分片和副本  265
8.5 预热  267
8.5.1 定义一个新的预热查询  267
8.5.2 获取定义的预热查询  268
8.5.3 删除一个预热查询  269
8.5.4 禁用预热功能  269
8.5.5 查询的选择  270
8.6 使用索引别名来简化你的日常工作  270
8.6.1 别名  271
8.6.2 创建别名  271
8.6.3 修改别名  271
8.6.4 合并命令  272
8.6.5 获取所有别名  272
8.6.6 移除别名  273
8.6.7 别名中的过滤  273
8.6.8 别名和路由  273
8.7 Elasticsearch插件  274
8.7.1 基础知识  274
8.7.2 安装插件  274
8.7.3 移除插件  275
8.8 更新设置API  275
8.9 小结  276

内容概要

作者简介:
Rafał Kuć
solr.pl网站联合创始人,现为Sematext集团顾问和软件工程师,专注于Apache Lucene、Solr、Elasticsearch和Hadoop等开源技术。Rafał拥有超过12年的多领域软件经验,其中既包括银行软件又包括电子商务产品。Rafał也是Apache Solr 3.1 Cookbook等技术图书的作者,并且一直是Lucene Eurocon、Berlin Buzzwords、ApacheCon和Lucene Revolution等会议的演讲嘉宾。
Marek Rogoziński
solr.pl网站联合创始人,拥有10年以上的软件架构师和顾问从业经验,专门研究基于Solr和Elasticsearch等开源搜索引擎的解决方案,以及Hadoop、HBase和Twitter Storm等用于大数据分析的软件。
译者简介:
蔡建斌
敏捷践行者,擅长Scrum/XP/Kanban等敏捷实践,现在英孚教育全球研发中心任Technical Lead,除了50%时间写代码以外,业务需求分析、前后端架构设计、性能调优、自动化测试、流程改进、发布运维、代码评审……无所不为,只为开发出更好的软件。爱好围棋,弈城4段5段之间跳跃。目标:工作上有所不为;爱好上添加一项健身。Email:caijianbin93@126.com。


 Elasticsearch服务器开发(第2版)下载 更多精彩书评



发布书评

 
 


精彩书评 (总计1条)

  •     很好的入门手册,讲的很全面。开篇介绍各种基础概念,第三章对基本的搜索语句讲的比较详细。拿到这本书后,在同事的帮助下花了三天时间从无到有完成了个模糊查询的 Java 小需求,感觉很nice :p。还没有看完,回头补上后续评论。

精彩短评 (总计11条)

  •     第二版针对ElasticSearch 1.0
  •     太简单了
  •     不知道是翻译的差 还是原版就很差 第二张还没读完就扔到一边了
  •     翻译太差了
  •     翻译的一般,比较生硬,难理解;好的翻译应是译者对此技术深入理解,充分理解作者原意,用简明的语言表述出来,而不是逐词直译,再好一点的话,译者对原文难理解的地方加上一些的说明,这样的作品可以加快读者的阅读速度、更容易理解讲述的内容,会让读者读起来很舒心。最主要是此书写的不怎么好。
  •     入门级
  •     不知道为什么,我觉得如果是书的话,应该是对官方文档的补充和扩展,而这本书是对官方文档的裁剪。不过我竟然耐着性子看完了,浪费时间。
  •     还不错,主要从ES外围展开,适合一个已经上手,想从使用上更进一步熟悉ES的用户非常适合。有比较详尽的ES 功能介绍。收货不少。
  •     点到为止,看得云里雾里
  •     一般般,1.0版本的,现在已经2.x版本了
  •     入门还不错
 

农业基础科学,时尚,美术/书法,绘画,软件工程/开发项目管理,研究生/本专科,爱情/情感,动漫学堂PDF下载,。 PDF下载网 

PDF下载网 @ 2024