爱悠闲 > 相关文章 >

全文检索方案讨论

Apache Solr 介绍(1)
说起Apache Lucene,可以说无人不知,无人不晓,但是说道Apache Solr,恐怕知道的不多。看看Apache Solr的说明: Solr是一个基于Lucene java库的企业级搜索服务器,包含XML/HTTP,JSON API, 高亮查询结果,faceted search(不知道该如何翻译,片段式搜索),缓存,复制还有一个WEB管理界面。Solr运行在Servlet容器中。所以SolrLucene的本质区别有以下三点:搜索服务器,企业级和管理。Lucene本质上是搜索库,不是
Apache Solr 介绍
导言 说起Apache Lucene,可以说无人不知,无人不晓,但是说道Apache Solr,恐怕知道的不多。看看Apache Solr的说明: Solr是一个基于Lucene java库的企业级搜索服务器,包含XML/HTTP,JSON API, 高亮查询结果,faceted search(不知道该如何翻译,片段式搜索),缓存,复制还有一个WEB管理界面。Solr运行在Servlet容器中。所以SolrLucene的本质区别有以下三点:搜索服务器,企业级和管理。Lucene本质上是搜索库
windows solr基础配置
简介: solr是基于Lucene Java搜索库的企业级全文搜索引擎,目前是apache的一个项目。它的官方网址在链接地址  。solr需要运行在一个servlet 容器里,例如tomcat。solrlucene的上层提供了一个基于HTTP/XML的Web Services,我们的应用需要通过这个服务与solr进行交互。  下载Solr, 链接地址 可以通过以下三种方式之一设置   Solr   的主位置:    1。设置   java   系统属性   solr.solr.home
使用solr搭建全文检索
/lucene/solr/ ik-analyzer下载地址: https://code.google.com/p/ik-analyzer/downloads/list 一、 solr介绍 solr是基于Lucene Java搜索库的企业级全文搜索引擎,目前是apache的一个项目。它的官方网址在链接地址 。solr需要运行在一个servlet 容器里,例如tomcat5.5。solrlucene的上层提供了一个基于HTTP/XML的Web Services,我们的应用需要通过这个服务与solr进行
Solr 企业级搜索引擎简介
Solr 企业级搜索引擎简介       Solr 是一个独立的企业级搜索引擎服务器,并提供类似web-service 的API接口。可以通过http协议把文档以xml格式的方式放入索引库。同样通过HTTP的GET协议接收XML格式的文档。     看到这里我想起了车东主持开发的WebLucene,早在3年前车东就为lucene提供了XML接口,后来吕克让也在此基础上添加了很多功能,大大方便了后继的维护工作。那么Solr有什么特别的呢?     首先,Solr 师出名门,apache的孵化项目
使用solr搭建你的全文检索
    Solr 是一个可供企业使用的、基于 Lucene 的开箱即用的搜索服务器。对Lucene不熟?那么建议先看看下面两篇文档: 实战Lucene,第 1 部分: 初识 Lucene:链接地址 用Lucene加速Web搜索应用程序的开发:链接地址 一、 solr介绍 solr是基于Lucene Java搜索库的企业级全文搜索引擎,目前是apache的一个项目。它的官方网址在链接地址 。solr需要运行在一个servlet 容器里,例如tomcat5.5。solrlucene的上层提供
Apache Solr : 基于Lucene的可扩展集群搜索服务器
Apache Solr项目,是一款基于Apache Lucene的开源企业搜索服务器,最近发布了1.3版。InfoQ采访了Solr的创建者Yonik Seeley,了解了新版本的更多信息和Solr提供给最终用户的功能。 Seeley首先描述了目标用户:“需要搜索框、分面浏览(导航)或者两者结合的任何人”,Solr的关键特性包括: 基于标准的开放接口——Solr搜索服务器支持通过XML、JSON和HTTP查询和获取结果。 易管理——Solr可以通过HTML页面管理,服务器统计数据以JMX输出
Apache Solr:基于Lucene的可扩展集群搜索服务器
全文搜索引擎。   文档通过Http利用XML 加到一个搜索集合中。查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。 Apache Solr:基于Lucene的可扩展集群搜索   关于Solr的未来计划,Seeley提到了更多的可扩展性、对大集群更方便的配置和管理、基于区域和实时的搜索、重构
8 个基于 Lucene 的开源搜索引擎
Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大... Apache Solr Solr是一个高性能,采用Java5开发,基于Lucene全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析
Nutch-2.2.1学习之七Nutch与Solr的集成
索引。在学习如何将Nutch与Solr结合在一起使用之前,先看一下Solr官网的介绍。 Solr是从apacheLucene项目发展而来的流行的,非常快速的开源企业级搜索平台。主要特征包括强大的全文检索,分面搜索,近乎实时索引,动态集群,与数据库的集成,丰富的文档处理(比如word、PDF),还有地理空间搜索。Solr是高可靠、可扩展和容错的,提供分布式索引,复制和负载均衡查询,自动化的故障转移和恢复,集中管理等。Solr强化了很多世界上最大网站的搜索和导航特性。 Solr是用Java开发
Apache Solr 4.0今日发布
经过了三年的开发努力,Apache Solr Server 4.0终于发布了。 Apache Solr是流行的,速度极快,开源的NoSQL的搜索平台,来自于Apache Lucene项目。它的主要功能包括强大的全文搜索,命中高亮显示、面搜索、动态集群、数据库集成、丰富的文档和地理信息搜索。Solr是高度可扩展的、提供了分布式搜索和索引的容错功能,强大的搜索和导航功能等。 Apache Solr 4.0版的亮点: 1. 重新设计了分布式索引,拥有NRT(near real-time)和NoSQL
8个基于Lucene的开源搜索引擎
Lucene是一种功能强大且被广泛使用的搜索引擎,以下列出8种基于Lucene的搜索引擎,你可以想象他们有多么强大。 1.Apache Solr Solr是一个高性能,采用Java5开发,基于Lucene全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供
solr 3.5 配置及服务器设置
</uniqueKey>进行描述。   Solr是一个高性能,采用Java5开发,基于Lucene全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。 二、solr 3.5 的下载     solr 3.5下载地址:链接地址    tomcat
apache lucene介绍
什么是lucene Apache Lucene是一个开放源程序的搜寻器引擎,利用它可以轻易地为Java软件加入全文搜寻功能。Lucene的最主要工作是替文件的每一个字作索引,索引让搜寻的效率比传统的逐字比较大大提高,Lucen提供一组解读,过滤,分析文件,编排和使用索引的API,它的强大之处除了高效和简单外,是最重要的是使使用者可以随时应自已需要自订其功能。 Luceneapache软件基金会项目组的一个子项目,是一个开放源代码的全文检索引擎工具包,即它不是一个完整的全文检索引擎,而是一个
[转]Apache Lucene介绍
  Eyebrows(EyeBrows是目前APACHE项目的主要邮件列表归档系统)邮件列表HTML归档/浏览/查询系统  也使用了它  Lucene以其开放源代码的特性、优异的索引结构、良好的系统架构获得了越来越多的应用。  Cocoon:基于XML的web发布框架,全文检索部分使用了Lucene  到现在lucene已经有C++、C#、Python和Perl的版本  更多关于lucene的应用见这里:http://wiki.apache.org/lucene-java/PoweredBy
paip.;论全文检索实现方式lucene Sphinx solr以及比较
  //////////////中文全文检索 不支持中文全文检索,但是支持英文全文检索,可以将“中文全文检索”转变为“英文全文检索”,然后再变回“中文全文检索”。那么中文又如何转换成英文呢?思路可以是:中文全文检索→拼音全文检索→中文全文检索。所以转换的思路如图1所示。 中文字词存在同音现象,重码问题要解决。     8.  /////////////////比较 没有人推荐solr吗?基于lucence的企业级搜索,虽然也是java,但提高xml,json等http服务,php操作也很方便的。 lucene功能强大
Solr整合Tomcat及IKAnalyzer 3.2.8中文分词
</uniqueKey>进行描述。   Solr是一个高性能,采用Java5开发,基于Lucene全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。 二、solr 3.5 的下载     solr 3.5下载地址:链接地址    tomcat
java开源搜索引擎开源分类列表
, Presentations Emails (.eml files) 更多Aperture信息 Apache Solr Solr是一个高性能,采用Java5开发,基于Lucene全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也是通过http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。 更多Apache Solr
在线给solr增加core的方法
</str> <str name="saved">/opt/tomcat/solr/solr.xml</str> </response> 这个例子的作用在于: 当单个core的规模增长到一定程度之后,检索速度会相应变慢,如果我们创建一个新的core,将新来的数据写入新的core中,检索起来性能会有所提升。 ps:使用lucene的时候可以使用MultiSearcher对多快索引进行多线程搜索,性能有大幅提升,但是在solr环境下没有提供MultiSearcher的支持,本例的方法有效的解决了此问题。 本文参考了:http://wiki.apache.org/solr/CoreAdmin#CREATE 最后:感谢solr为我们提供了如此强大的支持。
全文检索Lucene入门之lucene简介
一、简介  Lucene 是一个基于 Java 的全文信息检索工具包,它不是一个完整的搜索应用程序,而是为你的应用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一个开源项目。也是目前最为流行的基于 Java 开源全文检索工具包。 目前已经有很多应用程序的搜索功能是基于 Lucene 的,比如 Eclipse 的帮助系统的搜索功能。Lucene 能够为文本类型的数据建立索引,所以你只要能把你要索引的数据格式转化的文本的,Lucene 就能对你的文档进行索引