Lucene搜索引擎开发权威经典

当前位置:首页 > 计算机网络 > 程序设计 > Lucene搜索引擎开发权威经典

出版社:中国铁道出版社
出版日期:2008-10
ISBN:9787113092511
作者:于天恩
页数:629页

作者简介

《Lucene搜索引擎开发权威经典》基于Lucene的当前最新版本(2.1)精解了Lucene搜索引擎的相关知识,从基础知识到应用开发,精练简洁,恰到好处《Lucene搜索引擎开发权威经典》共包括16章,分为6部分。第1部分Lucene基础。介绍了Lucene的基础知识,包括Lucene的历史和发展情况、使用Lucene创建索引和执行搜索的基本方法以及中文分词的应用,最后做了两个应用项目。第2部分:数据解析。介绍解析不同格式数据(如Word、PDF等)的方法,包括常用的数据解析组件、Lucene自身的数据解析机制和Lius类库。第3部分:索引的高级知识。介绍了 Lucene建立索引的过程,索引的查看和删除,索引的同步,索引的合并和优化等内容。第4部分:搜索的高级知识。介绍使用不同的Query对象构建搜索请求,使用QueryParser解析用户的搜索请求,搜索结果的过滤和排序等内容。第5部分:Lucene应用实例。应用本节介绍的所有知识构建一个桌面搜索引擎和一个Web搜索引擎。这部分作为对前面所有内容的总结。第6部分:Nutch搜索引擎框架。介绍了基于Lucene的完整搜索引擎Nutch。
《Lucene搜索引擎开发权威经典》适合从Lucene初学者到高级开发人员之间的一切Lucene爱好者。

书籍目录

第1部分 Lucene基础(第1~5章)  第1章 Lucene简介  1.1 认识Lucene     1.1.1  Lucene是什么     1.1.2  Lucene的作者     1.1.3  Lucene的历史     1.l.4  Lucene的现在   1.2  Lucene体验实例     1.2.1 下载Lucene     1.2.2 编写辅助粪     1.2.3 最简单的搜索引擎     1.2.4 索引器的开发     1.2.5 索引器的运行     1.2.6 搜索器的开发      1.2.7 搜索器的运行    小结 第2章 创建索引    2.1 创建索引的基本方式     2.1.1 理解创建索引的过程     2.1.2 创建Field     2.1.3 创建Document     2.1.4 创建Index Writer   2.2 创建索引实例     2.2.1 简单索引     2.2.2 复杂一点的索引     2.2.3 为文件创建索引     2.2.4 为某一目录下的所有文件创建索引   小结 第3章 执行搜索   3.1 执行搜索的基本方式     3.1.1 创建搜索器对象:IndexSearcher     3.1.2 封装搜索条件:使用Term和Query对象     3.1.3 执行搜索     3.1.4 提取搜索结果:了解Hits对象     3.1.5 提取搜索结果:了解Document对象     3.1.6 提取搜索结果了解Field对象  3.2 执行搜索实例     3.2.1 简单搜索     3.2.2 分词问题   小结 第4章 中文分词  4.1 说说分词     4.1.1 分词的方法     4.1.2 做分词器   4.2  Lucene的分词器     4.2.1 二分法分词器     4.2.2  Lucene自带的中文分词器     4.2.3  NGram分词器的原理和用法     4.2.4  JE分词器的原理和用法     4.2.5  IK分词器的原理和用法     4.2.6 其他分词器  小结  ……第2部分 数据解析(第6~8章)第3部分 索引的高级知识(第9~10章)第4部分 搜索的高级知识(第11~12章)第5部分 lucene应用实例(第13~14章)第6部分 Nutch搜索引擎框架(第15~16章)

编辑推荐

  《Lucene搜索引擎开发权威经典》基于Lucene的当前最新版本(2.1)精解了Lucene搜索引擎的相关知识,从基础知识到应用开发,精炼简洁,恰到好处。  《Lucene搜索引擎开发权威经典》包含了必要的理论,但以实践为主。所讲的理论都不是纸上谈兵,都是可以立即付诸实践进行工程应用,代码可以直接拿来用。  书,不见得要写得深透。书的好坏要由书面向的读者群来评价。《Lucene搜索引擎开发权威经典》适合从Lucene初学者到高级开发人员之间的一切Lucene爱好者。  内容精练实用,《Lucene搜索引擎开发权威经典》中所列代码可以搭建一座中型搜索平台,完整实例再现,让读者紧跟作者构建思路,Lucene搜索引擎技术完美演绎。

内容概要

于天恩,现任某大型软件开发公司技术总监,高级软件工程师,精通主流软件编程技术(100多种),具有大量软件项目开发经验。主持开发过大中型企业网站,短信服务系统,办公自动化系统(OA),CRM系统等。
  已经出版的作品:《PHP精解案例教程》、《做自己的搜索引擎——搜

章节摘录

  第1部分 Lucene基础(第1~5章)  作为本书的第一部分,笔者在这里使用五章的篇幅介绍了Lucene的基础知识。包括Lucene的历史和发展情况、使用Lucene创建索引和执行搜索的基本方法以及中文分词的应用,最后做了两个应用项目,来说明使用Lucene建立搜索引擎的详细过程。  这部分内容是很浅的,只是基础。学过了这部分之后,读者就可以做一些实际的应用项目了。比如:给自己的网站添加全文搜索引擎。

图书封面


 Lucene搜索引擎开发权威经典下载 更多精彩书评



发布书评

 
 


精彩书评 (总计2条)

  •     在图书馆看到这本书,原本想买的,但是翻阅了这本书一下就完全没有兴趣了整本书,每次出现代码,都会出现以下片段:1.对程序进行封包,封包到“tianen里面”,这使得我们的代码严整,有条理。这是个良好的习惯。代码如下:package tianen;2.引入所需的java类,代码如下:import org....;以下省略若干条import语句。以上片段在全书出现的次数应该不少于100次。程序的代码也是大量重复,总之感觉就是完全凑页数的。
  •     这本书是我在看不太懂Lucene In Action的情况下去看的,用了一个星期的时间,将这么一本厚厚的书给看完了。这本书的确有很多很多的代码或者其他内容的重复,但是它整体的思路是很适合初学者的啊,就纯当基本的入门,花最少的时间入门。看完这本书,至少脑海中有了对于Lucene整体框架有最基本的构造,然后书中提到的一些关键名词,你可以再去深入的去看,他只是提了,但并未细讲,你可以自己再去网上搜。作者自己说花了30多个小时的时间构成了初稿,当然内容不可能多有深度,只是泛泛的告诉你,lucene中涉及哪些内容,如果想深入,还是Lucene In Action适合,而且最好是外文原版。

精彩短评 (总计20条)

  •     大量重复代码,代码每行空隙很大,明显拼凑字数。去掉重复代码,估计这书要少二分之一厚度,作者毫无节操,想钱想疯了,现在买技术书籍看见于天恩就绕行
  •     讲的很幽默。 有凑字数的嫌疑。 不明白不到一天为什么能写出一本书来。
  •     从来没见过这么滥竽充数的技术书籍。亏作者还好意思显摆。他那点积累太浅薄了。
  •     就是介绍了一下lucene,告诉你怎么去用这些工具而已 普普通通没啥亮点
  •     烂书一本。这个于天恩真是个烂书之王。
  •     书写的还算靠谱,就是作者措辞比较生硬,文笔一般,吹嘘成分甚多,又言而无文,三十分钟翻了一遍
  •     《搜索引擎权威经典》一书约630页厚,售价为88元,买了一本试试,总算没有白花书费。该书的主要优缺点如下:

    优点:
    1)lucene部分写的比较细致,容易读懂。例程结构清晰、错误较少,有一定重用的价值,多数情况不作或只稍为修改就可以运行。
    2)对PDF、WORD、EXCEL、XML、HTML等文件的解析较好。
    3)光盘中附带了运行lucene的一些插件。光盘没有附带的,还可以在书中推荐的网址下载。没有软件版本不匹配的问题。

    缺点:
    1)说了很多重复的话,用了很多重复的代码。很多程序只是修改了2~3行代码,连程序的名字都没有换。
    2)使用CMD,在DOS界面下调试运行程序十分不便,建议改用Eclipse/MyEclipse。
    3)Nutch部分只有区区20余页,到总页码的5%,而且介绍没有Nutch和Lucene的联系。似乎,有点不负责任。

    看完觉得写的虎头蛇尾 过于罗嗦,谈不上什么“权威”,只不过适合那些需要容易上手并迅速深入lucene的人。
  •     经典
  •     从当当买了这么多书,这是我买得最失望的一本书,作者纯粹就是想凑字数赚稿费,看完什么东西也学不到,还不如看lucene源代码来得实在,也没有一些网站上对lucene分析得好,总的来说很让人失望的一本书。
  •     感觉还不错
  •     唉,这是我读过的最会堆砌的书了,非常遗憾看到这样的技术书籍,极不推荐购买
  •     很失望,不好,代码连最基本的java格式都不是,是c的排版格式,而且很多地方都是java所不推荐的编程方式,重复的代码一堆,来撑篇幅,不少实例图也是错误的,张冠李戴,不值得买。
  •     没见过更锉的书了
  •     实质内容不多,可以作为入门书,几个小时可以读完
  •     看序言以及正文,似乎于天恩是哈工大的,可是google baidu搜不到关于这个人以及他创立的社团(哈工大天萌联合)的任何介绍。 内容一般,大量重复罗嗦的文字、代码、图片,真正有价值的东西不多。但对了解lucene还是有一定帮助的。
  •     又一本不专业无内涵骗钱的书, 作者几天粘贴出来的吧?
  •     中国人写的垃圾书,就我这种高考英语不及格的人都发现官网的英文文档比这本书写的更好.中国人写的技术书籍看一次伤心一次,好在弄了个电子版,让我去书店花88块买这种垃圾,那是做梦.
  •     写的很好,中国人自己写的好书
  •     大量重复代码,作者完全是为了赚稿费。内容浅显,作者根本没啥深入的理论基础~和没良心的作者
  •     垃圾中的战斗机,这种书大一的孩子就能写
 

农业基础科学,时尚,美术/书法,绘画,软件工程/开发项目管理,研究生/本专科,爱情/情感,动漫学堂PDF下载,。 PDF下载网 

PDF下载网 @ 2024