学海无涯苦作舟!
河北经贸大学毕业论文
互联网信息检索系统的研究与实现
专业名称
_________
班级
_______________
学生姓名
_____________
指导老师 ___________完成时间:
互联网信息检索系统搜索引擎是专门提供信息检索服务的平台 它将互联网上大量的网页数据采集到服务器 经过处理形成的信息数据库和索引数据库实现对用户提出的各种信息检索作出响应。
学海无涯苦作舟!
本系统使用 Microsoft Visual Studio 2005为主要开发工具 以
Windows Server 2003操作系统为运行环境主要实现了网页数据的抓取 网页数据存储数据的索引数据的检索 日志管理等功能。
本文对互联网信息检索统中几个关键技术的设计和实现进行了研究。从理论上对这些关键技术进行了详细的讨论并完成了基于Lucene.net互联网信息检索系统的实现。文章从下面几个方面进行了讨论
首先本文介绍搜索引擎的市场需求和研究状态。这一部分阐述了搜索引擎丰富的历史背景和客观的用户需求 自身的特点 以及人们对搜索引擎的关注程度。
其次本文讨论了搜索引擎中基本结构、实现的理论基础和实现方法。这一部分研究了搜索引擎的关键技术将中文分词技术、数据采集技术和数据索引技术有机的结合起来并对全文检索引擎 Lucene.net进行分析和研究。
最后详细描述了一个基于 Lucene.net的互联网信息检索系统的设计与实现。
关键词搜索引擎 Lucene.net数据存储信息检索
ABSTRACT
In ternet in formatio n retrieval system(search engine) is desig ned toprovide a platform for in formatio n retrieval services. It wi l l col lect a lot ofpages data on the In ternet to the server,a nd processed form of the informationdatabase and index database.Made to achieve the user to respond to thevarious information retrieval .
The system uses Microsoft Visual Studio 2005 as the main developmenttool , to run Windows Server 2003 operating system en vir onment, the mai nachieveme nt of the web crawl data,web data storage,data in dex ing,dataretrieval , loggi ng man ageme nt and otherfun cti ons.
In this paper,several Internet information retrieval system design and
学海无涯苦作舟!
impleme ntati on of key tech no logies were studied.Theory on these key tech nologies are discussed in detai l ,and completed the Internet in formati on retrievalsystem based on Lucene.net real ization.The article discussed the fol low ingaspects:
First of al l , the article describes the search engine market dema nd andresearch status.This part discusses the search engine rich historical background and objective of the user requireme nts, its own characteristics,as wel l aspeople paid more atte nti on to search engine.
Secon dly, the article discusses the basic structure of search engin es, toachieve the theoretical basis and implementation methods.This part of thesearch engin e's key tech no logy,Chin ese word segme ntati on,data acquisition and data in dex ing tech no logy comb ine orga nic,and ful l-text searchengine Luce ne.net on an alysis and research.
Fin al ly,a detai led descripti on of an In ternet-based Luce ne.net Informatio n Retrieval System Desig n and Impleme ntatio n.
Keywords Search Engine;Lucene.net;Data Storage; Information Retrieval
目录
1 绪论. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
1.1 互联网信息检索系统的市场需求. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1
1.2 搜索引擎技术现状及发展动向. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2
1.2.1 搜索引擎技术现状. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2
1.2.2 搜索引擎技术发展方向. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4
1.3 研究目的和研究内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6
1.4 文章内容安排. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6
2搜索引擎技术. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7
2.1 搜索引擎体系结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7
2.1.1 Crawler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7
2.1.2 In dexer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9
学海无涯苦作舟!
2.1.3 Searcher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10
2.2 搜索引擎的性能指标. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 1
2.3 中文分词算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12
2.3.1 基于字符串匹配的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12
2.3.2 基于理解的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15
2.3.3 基于统计的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15
2.4 实际系统研究. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16
2.4.1 Google 的整体结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16
2.4.2 Google 的工作过程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17
3 Lucene.net 的分析研究. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19
3.1 Luce ne.net 介绍. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19
3.2 Lucene.net 系统结构分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20
3.2.1 系统结构组织. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20
3.2.2 索引文件分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22
3.2.3 数据流分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24
3.3 基于Lucene.net 的应用开发. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26
4 系统设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29
4.1 系统特点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29
4.2 系统总体结构设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29
4.2.1 配置管理模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29
4.2.2 数据抓取模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30
4.2.3 数据索引模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30
4.2.4 数据检索模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30
4.2.5 日志管理模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30
4.3 系统处理流程设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31
4.3.1 数据抓取处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31
4.3.2 数据索引处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .32
4.3.3 数据检索处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34
5 系统实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35
5.1 多线程网页数据抓取. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35
5.1.1 数据抓取主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35
学海无涯苦作舟!
5.1.2 多线程的实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36
5.1.3 网页文件下载. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38
5.2 HTML文档的扫描与分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .40
5.3 数据的索引. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41
5.3.1 数据索引主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41
5.3.2 索引网页数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42
5.4 数据的检索. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43
5.4.1 数据检索主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43
5.3.2 检索索引数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43
6 系统测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46
6.1 测试基础. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46
6.2 测试内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46
6.2.1 模块测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46
6.2.2 集成测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47
结束语. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49
致谢. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50
参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51
学海无涯苦作舟!
互联网信息检索系统的设计与实现
1绪论
随着互联网Internet的出现和普及人们的信息来源得到了极大的丰富互联网成为了人们获取信息的主要来源之一。在 In ternet信息不断增长的情况下如何快速准确的获取所需信息成为研究热点之一。搜索引擎技术
Search Engine就是在这种需求背景下发展起来的。
传统的信息检索技术是从一定规模的文档库中获取用户需求的信息其核心是重要文本信息的索引和检索。在信息量不大的情况下传统的信息检索能够满足需求。当面对 In ternet上分散存储动态变化的海量数据时传统的信息检索技术就无法让用户快速找到所需要的信息了。
搜索引擎技术作为传统 IR I nformatio n Retrieval技术在In ternet上的扩展涉及到Web数据的采集 中文分词技术倒排索引海量数据存储用户行为分析等关键技术。从功能上讲搜索引擎重要由信息的采集索引和查询三部分组成。 搜索引擎首先通过信息采集器 Crawler又名网络蜘蛛从In ternet中采集网页数据然后通过索引器 In dexer对采集的数据进行分析并创建索引。检索器 Searcher负责接受用户查询的请求一般采用 Web形式通过索引找到相关信息的网页数据
返回给用户。
为了满足系统的稳定性、可靠性及缩短系统开发周期本系统采用MicrosoftStudio Visual 2005作为开发平台以PC机和Windows Server 2003为测试环境借助Lucene.net实现了互联网信息检索的基本功能。
1 .1互联网信息检索系统的市场需求
随着信息技术的快速发展互联网得到了飞速的发展成为人们学习、工作、生活中的最重要的知识和信息来源。关于网页的数目没有具体的统计数据但根据
CNNIC第23次报道 中国当前拥有的网页数己经超过160亿。
In ternet上的信息资源随着In ternet的发展而呈现出以下特点
学海无涯苦作舟!
(1)信息量大而且分散
(2) 自治性强
(3)信息资源多种多样
(4)不一致和不完整性
为了获取所需的信息用户需要借助一定的工具他们通常使用以下两类网站
第一类是目录系统其典型代表是Yahoo! 。它通过有专业知识的网页编辑人员对网上的网页进行精选建立一个索引目录来给用户提供服务。这类通过手工维护得很好的系统的优点是提供的网页准确率高 可以有效的覆盖热门的主题但它们的缺点是过于主观而且需要高昂的代价来建立和维护更新改进的慢 同时不可能覆盖所有的主题。
第二类是搜索引擎搜索引擎通过程序自动地从网上搜集和分析网页建立索弓I ,为用户提供服务。这类自动更新的搜索引擎优点是涵盖的网页数量巨大 同时拥有基于关键字的全文索引它为所有网上冲浪的用户提供了一个入口 用户可以从搜索引擎出发到达自己想去的网上
任何一个地方。搜索引擎对用户是这样的重要 自然成为了用户上网的常用服务根据《中国互联网络发展状况统计报告》 用户经常使用的网络服务是 电子邮箱(92.6%)、搜索引擎(68.3%)、软件上传或下载服务(45.3%)、信息查询(42.2%)。
1 .2搜索引擎技术现状及发展动向
1.2.1 搜索引擎技术现状
由于搜索引擎巨大的商业价值和学术研究价值 各大公司都在投巨资进行搜索引擎的研制开发 不断地涌现出新的具有不同特色的搜索引
擎产品。同时各大科研机构和大学纷纷展开对搜索引擎技术相关领域的学术研究。
作为IR领域中最重要的会议之一TREC(Text REtrieval Conference)从1999年1 1月的第8届开始增加Web Track竞赛项目考察Web文档与其它类型文档在性质上的不同之处 测试在大规模的Web文档集上进行信息检索的算法性能。在 IEEE主办的国际万维网会议(InternationalWorld Wide Web Conference)和ACM主办的人机交互会议(Computer Huma n Interaction ,CH I等重要学术会议上发表了越来越多的关于搜索引擎技术研究的文
学海无涯苦作舟!
章。 搜索引擎己经成为信息检索领域中最活跃的研究方向。
Stanford大学在其DLI项目中开发了Google搜索引擎在Web高效搜索、大规模索引、文档的相关度评价等方面作了深入的研究提出了一种基于链接的网页排名算法 PageRank算法来计算网页的排名并同时利用锚文本An ch o rs信息进行网页相关度评价。
IBM Almaden研究中心研制了Clever系统提出了类似于PageRank的HITS算法主要不同是将网页分为Authority和Hub两类并就HITS算法在相关度评价、网页分类、主题搜索等方面的作用进行了研究。
NEC美国研究所开发了一个专门用于搜索学术文章的 ResearchI n d ex。其目的是建立一个网上图书馆 只收集科技人员广泛使用的 PDF和Postscript文件用“PDF” “Postscript”等检索项组成查询送往其他著名的搜索引擎对返回的结果进行信息提取 主题、摘要、作者、引用文献等 组成了一个27万篇文献的索引库供科技人员查询。现在 NEC开始致力于下一代元搜索引擎 Inquirus的开发。
国内先后有北京大学、清华大学、华南理工大学、 国家智能研究中心等高校和研究单位对搜索引擎技术进行了研究 开发出了几个实用的系统。
清华大学开发的“网络指南针”利用智能、高效的网络搜索算法收集网页 自动识别和转换常见的中文编码 向用户提供中文、英文、 拼音、英汉翻译、 BIG5码等多种输入查询服务并提供普通分类、学科分类、图书分类查询共计
3900多个分类目录收集的网页超过 20万页。
北大的“天网”中英文搜索引擎在系统规模及系统性能方面达到了国外中型搜索引擎系统的技术水平 目前天网搜索引擎维护的文档数量达到6亿之多并正在以平均每月一千万页文档的数量扩大着规模。天网搜索的中文文档数量超过4亿其中包括html、 txt、 pdf、doc、 ps、 ppt等多种类型的文档和资 源。在功能、性能、查准率、查全率等方面基本达到了实用。
华南理工大学的“木棉”搜索引擎分 Web检索和FTP检索两大部分。Web检索支持中英文混合查询、布尔查询、结构属性查询、模糊
查询等多种查询方式。FTP检索实现基于文件主要属性的结构查询以及模糊匹配等。目前系统收集约 50万网页。
学海无涯苦作舟!
1.2.2 搜索引擎技术发展方向
经过了多年的发展现在的搜索引擎功能越来越强大提供的服务也越来越全面。据研究统计 目前 In ternet上搜索引擎已达数千种之多。然而随着多元化信息的增长统一的用户入口己经不能满足用户的更深入的查询需求搜索引擎将向智能化、个性化、精确化、专业化、交叉语言检索、多媒体检索等适应不同用户需求的方向发展。
(1)智能化搜索
智能化是搜索引擎未来的发展方向。 搜索引擎的智能化体现在两方面一是对搜索请求的理解二是对网页内容的分析。通过智能代理技术对用户的查询计划、意图、兴趣方向进行推理 自动进行信息搜集过滤将用户感兴趣的信息返回给用户。这其中也包含了对服务多项化、个性化结果精确化交叉语言检索等方面的功能。
(2)个性化搜索
个性化搜索引擎的核心是通过跟踪分析用户的搜索行为 充分地利用这些信息来提高用户的搜索效率。 这种搜索行为分析技术是一种正在发展中的很有前途的搜索引擎人机界面技术。
(3)提高检索的有效性
解决查询结果过多的现象目前有以下几种方法 a)构建基于内容的搜索引擎。基于内容的搜索不是根据字形而是试图理解用户的请求 同时根据文档的内容选出符合用户要求的文档。 即通过各种方法获得用户没有在查询语句中表达出来的真正用途 实现自然语言的智能查询功能。中文搜索引擎中当前比较成熟的解决方案是依靠语义网络、汉语分词、句法分析、处理同义词等中文信息处理技术最大程度地了解用户需求。 b)将用户提问转化为系统己知的问题然后对已知问题进行解答 以求降低对自然语言理解技术的依赖性。c)用正文分类技术将结果分类使用可视化技术显示分类结构 用户可以只浏览自己感兴趣的类别。d)进行站点类聚或内容类聚减少信息的总量。 e)让用户对返回结果进行选择进行二次查询是一种非常有效的手段。
(4)实现交叉语言的检索
搜索引擎对多种语言的数据库进行交叉语言信息检索 返回能够回答用户问题的所有语言的文档。若配上机器翻译就可使返回结果以用户熟悉的语言显示。
Hostodo在九月份又发布了两款特别套餐,开设在美国拉斯维加斯、迈阿密和斯波坎机房,基于KVM架构,采用NVMe SSD高性能磁盘,最低1.5GB内存8TB月流量套餐年付34.99美元起。Hostodo是一家成立于2014年的国外VPS主机商,主打低价VPS套餐且年付为主,基于OpenVZ和KVM架构,美国三个地区机房,支持支付宝或者PayPal、加密货币等付款。下面列出这两款主机配置信息。CP...
美国服务器哪家平台好?美国服务器无需备案,即开即用,上线快。美国服务器多数带防御,且有时候项目运营的时候,防御能力是用户考虑的重点,特别是网站容易受到攻击的行业。现在有那么多美国一年服务器,哪家的美国云服务器好呢?美国服务器用哪家好?这里推荐易探云,有美国BGP、美国CN2、美国高防、美国GIA等云服务器,线路优化的不错。易探云刚好就是做香港及美国云服务器的主要商家之一,我们来看一下易探云美国云服...
易探云服务器怎么过户/转让?易探云支持云服务器PUSH功能,该功能可将云服务器过户给指定用户。可带价PUSH,收到PUSH请求的用户在接收云服务器的同时,系统会扣除接收方的款项,同时扣除相关手续费,然后将款项打到发送方的账户下。易探云“PUSH服务器”的这一功能,可以让用户将闲置云服务器转让给更多需要购买的用户!易探云服务器怎么过户/PUSH?1.PUSH双方必须为认证用户:2.买家未接收前,卖家...