solrJava框架solr用哪个版本的好?

solr  时间:2021-08-25  阅读:()

Javaweb中redis和solr哪个性能高,感觉这两个留一个就可以了?

这2个不是一类的东西啊。

主要看你的需求。

1. redis是非关系型,在内存中以Key-Value形式存储的数据库。

特点是速度非常非常快。

2. solr是一个搜索引擎。

一般用来作为网站内的搜索功能。

如何在linux中启动solr

1.2. tomcat调优 调优tomcat 加大内存和连接数  MaxThread 500  MinSpareThread 25  MaxSpareThread75  Xmx 1024M 1.3. 操作系统网络参数优化 用做测试的各台服务器,均在/etc/sysctl.conf配置文件中增加如下内核参数: .ipv4.tcp_syncookies = 1 .ipv4.tcp_tw_reuse = 1 .ipv4.tcp_tw_recycle = 1 .ipv4.tcp_fin_timeout = 5 1.4. 下载solr 下载地址:/solr/ 详情请见:/solr/ 2. 安装过程 2.1. 安装tomcat6 安装完tomcat后修改./conf/server.xml <Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" URIEncoding="UTF-8"/> 注:如果没有设置URIEncoding="UTF-8",在提交查询的select的url会出现乱码,当然也就查不到了。

2.2. 拷贝solr.war 将下载的solr包下面的dist文件夹中的apache-solr-1.4.1.war 拷贝到 tomcat的webapps 并且改名为 solr.war 一般情况下会自动生成相应的文件夹。

2.3. 拷贝其它 新建/opt/solr-tomcat/solr文件夹,把下载的solr包中的example/solr文件夹下面的所有文件放入到/opt/solr-tomcat/solr里面。

2.4. 配置solr.home 最后一步 配置添加solr.home环境变量,可以有二种方式(两种取其一即可): a)基于环境变量 linux在当前用户的环境变量中(.bash_profile)或在./bin/catalina.sh中添加如下环境变量: export JAVA_OPTS="$JAVA_OPTS -Dsolr.solr.home=/opt/solr-tomcat/solr" b)基于JNDI 在tomcat的conf文件夹建立Catalina文件夹,然后在Catalina文件夹中在建立localhost文件夹,在该文件夹下面建立 solr.xml,Xml代码: <Context docBase="/usr/local/tomcat6/webapps/solr.war" debug="0" crossContext="true" > <Environment name="solr/home" type="Java.lang.String" value="/opt/solr-tomcat/solr" override="true" /> </Context> 注:如果没有设定solr.solr.home环境变量或JNDI的情况下,Solr查找./solr,因此在启动时候需要切换到/opt/solr-tomcat 3. 验证安装 访问solr管理界面 http://ip:port/solr 3.1. 打开管理后台 打开浏览器,输入:http://192.168.10.85:18080/solr/admin/ (注:多核心时为这个地址http://192.168.10.85:18080/solr/,首页会列出多核的链接,点击进入),就可以访问solr服务了 3.2. 如果出现如下图示,表示配置成功

solr命令怎么执行

bin/solr?-help ? ?? ? ? ? ? 可以看到solr有哪些子命令,如?start,?,?restart,?status,?healthcheck,?create,?create_core,?create_collection,?delete,?version启动startbin/solr?start ?-help ? ?查看start帮助 bin/solr?start ? ? ? ?启动单机版bin/solr?start?-f ? ? ? ? ? 前台启动bin/solr?start?-p?8984 ? ? ? ?指定端口启动bin/solr?start?-cloud ? ? ? ?启动分布式版本bin/solr?start?-e?cloud?-noprompt ? ? ? ??-e表示要启动一个现有的例子,例子名称是cloud,cloud这个例子是以SolrCloud方式启动的bin/solr?restart ? ? ? ? ?重启项目

solr和elasticsearch有什么优缺点

从两个方面对ElasticSearch和Solr进行对比,从关系型数据库中的导入速度和模糊查询的速度。

单机对比 1. Solr 发布了4.0-alpha,试了一下,发现需要自己修改schema,好处是它自带一个data importer。

在自己的计算机上测试了一下,导入的性能大概是:14分钟导入 3092730 条记录,约合 3682条/秒。

2. 3百万条记录的情况下,模糊查询和排序基本都在1秒内返回 3. 刚才的测试,是每个field单独存储,现在修改了一下配置文件,增加了一个copyField,所有的field都拷贝一份到text这个field里面去,导入的性能大概是:19分钟导入了3092730 条记录,约合 2713条/秒 4. 3百万条记录的情况下,针对text的模糊查询基本在1秒内返回,但是针对所有记录的排序,大概要2~3秒 5. 使用 elasticsearch 0.19.8,缺省配置,用单任务导入,导入性能是:20分钟导入了3092730 条记录,约合2577条/秒 6. 3百万条记录的情况下,查询基本上在1秒内返回,但是模糊查询比较慢,第一次要10秒,后来大概要1~3秒。

加上排序大概需要5秒,整体排序基本100ms 查询及排序的指令: { "query": { "query_string": { "query": "*999*" } }, "sort": [ { "TIME_UP": { "order": "asc" } } ] } 7. Es0.19.8,用两个任务导入,导入性能是:13分钟导入了3092730 条记录,约合3965条/秒 8. Solr全部建好索引后,占用磁盘空间是1.2G,es占用磁盘空间是4G 单机对比2 在一台Intel i7,32G内存的机器上,重新跑这两个的对比。

不过有个重大的区别在于,Solr是在这台性能很好的机器上跑,而es的导入进程则是在一台Intel 四核 2.5G,4G内存的机器上跑的,也许会有性能的差异。

ES版本0.19.8,Solr版本4.0-ALPHA。

1. Solr的导入性能:3400万条记录,用时62分钟,平均9140条/秒,占用空间12.75G 2. 使用 *999* 这样的模糊查询,3秒以内返回,稍长一点的查询条件 *00100014*,也是2~3秒返回 3. Es的导入性能(设置Xmx为10G):3400万条记录,用时40分钟,平均14167条/秒,占用空间33.26G,客户端采用4个并发。

4. 使用 *999* 这样的模糊查询,9秒返回,稍长一点的查询条件 *00100014*,11.8秒返回 5. 如果不是针对所有字段查询,而是针对某个特定字段,比如 SAM_CODE: *00100014*,那么也是1秒以内返回。

6. 结论:es的查询效率也可以很高,只是我们还不会用。

7. 结论2:es有个设置是把所有字段放一块的那个,缺省是放一起,但是不知道为什么没起到应有的作用。

备注: 1. Solr第一次的那个内存使用的是缺省设置,这次改为10G,结果导入性能反而变差了,400万条记录,用了8分钟,平均8333条/秒,不知道为什么。

2. 改回缺省的内存配置,导入速度仍然慢。

3. 重启Linux,用10G的内存配置,再导入,5030万条记录,用时92分,约9112条/秒,说明导入速度和内存配置没有大差别 4. 在10G配置的情况下,检索速度也差别不大。

5. 为了搞清楚lucene4.0和solr4.0的进步有多大,下载了solr3.6.1,所幸的是4.0的配置文件在3.6.1上也可以用,所以很快就搭起来进行测试,导入性能为:3400万条记录,用时55分钟,约10303条/秒,占用空间13.85G。

查询性能:*999*第一次11.6s,*00100014* 27.3s,相比4.0ALPHA的结果(5000万结果当中,*999*第一次2.6s,*00100014*第一次2.5s)来说,慢了很多,与es的性能差不多,因此,也许lucene4.0真的对性能有大幅提升? 集群对比: 采用4台同样配置(Intel i7,32G内存)的Centos 6.3组成的集群,进行对比。

1. 首先是es,很方便的就组成了一个Cluster,等上一个3400万条的Index全部均衡负载之后进行测试,导入到另外一个Index当中。

2. 导入性能:8500万条记录,用时72分钟,约为19676条/秒。

在前5千万条记录导入时的速度在2万/条以上,初始的速度在2.2万/条。

占用空间78.6G(由于有冗余,实际占用空间为157.2G) 3. 查询性能: *999*第一次13.5秒,第二次19.5秒,第三次7.4秒,第四次7.1秒,第五次7.1秒 *00100014*第一次17.2秒,第二次16.6秒,第三次17.9秒,第四次16.7秒,第五次17.1秒 SAM_CODE:*999*,0.8s,1.3s,0.02s,0.02s,0.02s SAM_CODE: *00100014*,0.1s,0.1s,0.02s,0.03s,0.05s 4. Solr4.0-ALPHA,SolrCloud的配置还算简单,启动一个ZooKeeper,然后其他三台机器访问这个地址,就可以组成一个Cloud: 机器1: nohup java -Xms10G -Xmx10G -Xss256k -Djetty.port=8983 -Dsolr.solr.home="./example-DIH/solr/" -Dbootstrap_confdir=./example-DIH/solr/db/conf/ -Dcollection.configName=xabconf3 -DzkRun -DnumShards=4 -jar start.jar & 其他机器:nohup java -Xms10G -Xmx10G -Dsolr.solr.home="./example-DIH/solr/" -DzkHost=192.168.2.11:9983 -jar start.jar & 但是在执行 data import 的时候,频繁出现 OutOfMemoryError: unable to create new native thread。

查了很多资料,把Linux的ulimit当中的nproc改成10240,把Xss改成256K,都解决不了问题。

暂时没有办法进行。

结论 1. 导入性能,es更强 2. 查询性能,solr 4.0最好,es与solr 3.6持平,可以乐观的认为,等es采用了lucene4之后,性能会有质的提升 3. Es采用SAM_CODE这样的查询性能很好,但是用_all性能就很差,而且差别非常大,因此,个人认为在目前的es情况下,仍然有性能提升的空间,只是现在还没找到方法。

Lucene 或者 solr 有什么不一样?分别何时使用

从本质上来说它们其实是一个东西,solr是对lucene的封装。

solr和lucene的关系相当于hibernate和jdbc一样。

由于solr的使用比较更为简单,且支持分布式,所以用solr的场景比较多。

但当一些大型项目需求比较特殊,需要进行很多源码性的更改时,lucene就是更好的选择了。

Java框架solr用哪个版本的好?

solr-4.10.2,当下几个出名的分词器IKAnalyzer已支持该版本。

现在开发的产品需要使用搜索功能,lucene是首选,于是再度研究了一翻,没有多大难度。

同时也不在直接使用lucene库,而是使用solr,大大简化了创建索引与查询索引的难度。

solr这种分布式索引方式对性能的控制更加有把握,因为它支持多核、复制功能,我们还可以写代码实现读写分离等性能扩展功能。

itJob

创梦网络-四川一手资源高防大带宽云服务器,物理机租用,机柜资源,自建防火墙,雅安最高单机700G防护,四川联通1G大带宽8.3W/年,无视UDP攻击,免费防CC

? ? ? ?创梦网络怎么样,创梦网络公司位于四川省达州市,属于四川本地企业,资质齐全,IDC/ISP均有,从创梦网络这边租的服务器均可以****,属于一手资源,高防机柜、大带宽、高防IP业务,另外创梦网络近期还会上线四川联通大带宽,四川联通高防IP,一手整CIP段,四川电信,联通高防机柜,CN2专线相关业务。成都优化线路,机柜租用、服务器云服务器租用,适合建站做游戏,不须要在套CDN,全国访问快...

BuyVM商家4个机房的官方测试IP地址和测速文件

BuyVM 商家算是有一些年头,从早年提供低价便宜VPS主机深受广大网友抢购且也遭到吐槽的是因为审核账户太过于严格。毕竟我们国内的个人注册账户喜欢账户资料乱写,毕竟我们看英文信息有些还是比较难以识别的,于是就注册信息的时候随便打一些字符,这些是不能通过的。前几天,我们可以看到BUYVM商家有新增加迈阿密机房,而且商家有提供大硬盘且不限制流量的VPS主机,深受有一些网友的喜欢。目前,BUYVM商家有...

VoLLcloud(月付低至2.8刀)香港vps大带宽,三网直连

VoLLcloud LLC是一家成立于2020年12月互联网服务提供商企业,于2021年1月份投入云计算应用服务,为广大用户群体提供云服务平台,已经多个数据中心部署云计算中心,其中包括亚洲、美国、欧洲等地区,拥有自己的研发和技术服务团队。现七夕将至,VoLLcloud LLC 推出亚洲地区(香港)所有产品7折优惠,该产品为CMI线路,去程三网163,回程三网CMI线路,默认赠送 2G DDoS/C...

solr为你推荐
权限表什么是DRM权限列表,怎么使用第三方接口我要开通第三方支付接口,接口金额有多大点对点短信是什么国内点对点短信多少钱一条?查杀木马请问有什么方法查杀木马化学键理论价键理论和分子轨道理论的主要区别是什么最好的电脑操作系统电脑系统哪个比较好用,运行流畅?云电视是什么意思4K2K是什么意思?wps表格数据恢复WPS工作表意外关闭如何恢复公司注册如何办理我想注册个小公司,具体怎么做。。。系统部署方案高达软件的实施服务
网站空间申请 东莞虚拟主机 个人域名备案流程 服务器配置技术网 香港bgp机房 tk域名 debian源 空间服务商 云全民 vip域名 ca187 网页提速 架设邮件服务器 带宽租赁 宿迁服务器 rewritecond SmartAXMT800 沈阳idc 月付空间 asp介绍 更多