搜索引擎互联网信息检索的研究与实现毕业论文

国际互联网信息中心  时间:2021-02-18  阅读:()

学海无涯苦作舟!

河北经贸大学毕业论文

互联网信息检索系统的研究与实现

专业名称

_________

班级

_______________

学生姓名

_____________

指导老师 ___________完成时间:

互联网信息检索系统搜索引擎是专门提供信息检索服务的平台 它将互联网上大量的网页数据采集到服务器 经过处理形成的信息数据库和索引数据库实现对用户提出的各种信息检索作出响应。

学海无涯苦作舟!

本系统使用 Microsoft Visual Studio 2005为主要开发工具 以

Windows Server 2003操作系统为运行环境主要实现了网页数据的抓取 网页数据存储数据的索引数据的检索 日志管理等功能。

本文对互联网信息检索统中几个关键技术的设计和实现进行了研究。从理论上对这些关键技术进行了详细的讨论并完成了基于Lucene.net互联网信息检索系统的实现。文章从下面几个方面进行了讨论

首先本文介绍搜索引擎的市场需求和研究状态。这一部分阐述了搜索引擎丰富的历史背景和客观的用户需求 自身的特点 以及人们对搜索引擎的关注程度。

其次本文讨论了搜索引擎中基本结构、实现的理论基础和实现方法。这一部分研究了搜索引擎的关键技术将中文分词技术、数据采集技术和数据索引技术有机的结合起来并对全文检索引擎 Lucene.net进行分析和研究。

最后详细描述了一个基于 Lucene.net的互联网信息检索系统的设计与实现。

关键词搜索引擎 Lucene.net数据存储信息检索

ABSTRACT

In ternet in formatio n retrieval system(search engine) is desig ned toprovide a platform for in formatio n retrieval services. It wi l l col lect a lot ofpages data on the In ternet to the server,a nd processed form of the informationdatabase and index database.Made to achieve the user to respond to thevarious information retrieval .

The system uses Microsoft Visual Studio 2005 as the main developmenttool , to run Windows Server 2003 operating system en vir onment, the mai nachieveme nt of the web crawl data,web data storage,data in dex ing,dataretrieval , loggi ng man ageme nt and otherfun cti ons.

In this paper,several Internet information retrieval system design and

学海无涯苦作舟!

impleme ntati on of key tech no logies were studied.Theory on these key tech nologies are discussed in detai l ,and completed the Internet in formati on retrievalsystem based on Lucene.net real ization.The article discussed the fol low ingaspects:

First of al l , the article describes the search engine market dema nd andresearch status.This part discusses the search engine rich historical background and objective of the user requireme nts, its own characteristics,as wel l aspeople paid more atte nti on to search engine.

Secon dly, the article discusses the basic structure of search engin es, toachieve the theoretical basis and implementation methods.This part of thesearch engin e's key tech no logy,Chin ese word segme ntati on,data acquisition and data in dex ing tech no logy comb ine orga nic,and ful l-text searchengine Luce ne.net on an alysis and research.

Fin al ly,a detai led descripti on of an In ternet-based Luce ne.net Informatio n Retrieval System Desig n and Impleme ntatio n.

Keywords Search Engine;Lucene.net;Data Storage; Information Retrieval

目录

1 绪论. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1

1.1 互联网信息检索系统的市场需求. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1

1.2 搜索引擎技术现状及发展动向. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2

1.2.1 搜索引擎技术现状. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2

1.2.2 搜索引擎技术发展方向. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4

1.3 研究目的和研究内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6

1.4 文章内容安排. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6

2搜索引擎技术. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

2.1 搜索引擎体系结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

2.1.1 Crawler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

2.1.2 In dexer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9

学海无涯苦作舟!

2.1.3 Searcher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10

2.2 搜索引擎的性能指标. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 1

2.3 中文分词算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

2.3.1 基于字符串匹配的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

2.3.2 基于理解的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

2.3.3 基于统计的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

2.4 实际系统研究. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16

2.4.1 Google 的整体结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16

2.4.2 Google 的工作过程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

3 Lucene.net 的分析研究. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19

3.1 Luce ne.net 介绍. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19

3.2 Lucene.net 系统结构分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20

3.2.1 系统结构组织. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20

3.2.2 索引文件分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22

3.2.3 数据流分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24

3.3 基于Lucene.net 的应用开发. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26

4 系统设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.1 系统特点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.2 系统总体结构设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.2.1 配置管理模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.2.2 数据抓取模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.2.3 数据索引模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.2.4 数据检索模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.2.5 日志管理模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.3 系统处理流程设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31

4.3.1 数据抓取处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31

4.3.2 数据索引处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .32

4.3.3 数据检索处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34

5 系统实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

5.1 多线程网页数据抓取. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

5.1.1 数据抓取主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

学海无涯苦作舟!

5.1.2 多线程的实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36

5.1.3 网页文件下载. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38

5.2 HTML文档的扫描与分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .40

5.3 数据的索引. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41

5.3.1 数据索引主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41

5.3.2 索引网页数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42

5.4 数据的检索. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

5.4.1 数据检索主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

5.3.2 检索索引数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

6 系统测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.1 测试基础. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.2 测试内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.2.1 模块测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.2.2 集成测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47

结束语. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49

致谢. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50

参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51

学海无涯苦作舟!

互联网信息检索系统的设计与实现

1绪论

随着互联网Internet的出现和普及人们的信息来源得到了极大的丰富互联网成为了人们获取信息的主要来源之一。在 In ternet信息不断增长的情况下如何快速准确的获取所需信息成为研究热点之一。搜索引擎技术

Search Engine就是在这种需求背景下发展起来的。

传统的信息检索技术是从一定规模的文档库中获取用户需求的信息其核心是重要文本信息的索引和检索。在信息量不大的情况下传统的信息检索能够满足需求。当面对 In ternet上分散存储动态变化的海量数据时传统的信息检索技术就无法让用户快速找到所需要的信息了。

搜索引擎技术作为传统 IR I nformatio n Retrieval技术在In ternet上的扩展涉及到Web数据的采集 中文分词技术倒排索引海量数据存储用户行为分析等关键技术。从功能上讲搜索引擎重要由信息的采集索引和查询三部分组成。 搜索引擎首先通过信息采集器 Crawler又名网络蜘蛛从In ternet中采集网页数据然后通过索引器 In dexer对采集的数据进行分析并创建索引。检索器 Searcher负责接受用户查询的请求一般采用 Web形式通过索引找到相关信息的网页数据

返回给用户。

为了满足系统的稳定性、可靠性及缩短系统开发周期本系统采用MicrosoftStudio Visual 2005作为开发平台以PC机和Windows Server 2003为测试环境借助Lucene.net实现了互联网信息检索的基本功能。

1 .1互联网信息检索系统的市场需求

随着信息技术的快速发展互联网得到了飞速的发展成为人们学习、工作、生活中的最重要的知识和信息来源。关于网页的数目没有具体的统计数据但根据

CNNIC第23次报道 中国当前拥有的网页数己经超过160亿。

In ternet上的信息资源随着In ternet的发展而呈现出以下特点

学海无涯苦作舟!

(1)信息量大而且分散

(2) 自治性强

(3)信息资源多种多样

(4)不一致和不完整性

为了获取所需的信息用户需要借助一定的工具他们通常使用以下两类网站

第一类是目录系统其典型代表是Yahoo! 。它通过有专业知识的网页编辑人员对网上的网页进行精选建立一个索引目录来给用户提供服务。这类通过手工维护得很好的系统的优点是提供的网页准确率高 可以有效的覆盖热门的主题但它们的缺点是过于主观而且需要高昂的代价来建立和维护更新改进的慢 同时不可能覆盖所有的主题。

第二类是搜索引擎搜索引擎通过程序自动地从网上搜集和分析网页建立索弓I ,为用户提供服务。这类自动更新的搜索引擎优点是涵盖的网页数量巨大 同时拥有基于关键字的全文索引它为所有网上冲浪的用户提供了一个入口 用户可以从搜索引擎出发到达自己想去的网上

任何一个地方。搜索引擎对用户是这样的重要 自然成为了用户上网的常用服务根据《中国互联网络发展状况统计报告》 用户经常使用的网络服务是 电子邮箱(92.6%)、搜索引擎(68.3%)、软件上传或下载服务(45.3%)、信息查询(42.2%)。

1 .2搜索引擎技术现状及发展动向

1.2.1 搜索引擎技术现状

由于搜索引擎巨大的商业价值和学术研究价值 各大公司都在投巨资进行搜索引擎的研制开发 不断地涌现出新的具有不同特色的搜索引

擎产品。同时各大科研机构和大学纷纷展开对搜索引擎技术相关领域的学术研究。

作为IR领域中最重要的会议之一TREC(Text REtrieval Conference)从1999年1 1月的第8届开始增加Web Track竞赛项目考察Web文档与其它类型文档在性质上的不同之处 测试在大规模的Web文档集上进行信息检索的算法性能。在 IEEE主办的国际万维网会议(InternationalWorld Wide Web Conference)和ACM主办的人机交互会议(Computer Huma n Interaction ,CH I等重要学术会议上发表了越来越多的关于搜索引擎技术研究的文

学海无涯苦作舟!

章。 搜索引擎己经成为信息检索领域中最活跃的研究方向。

Stanford大学在其DLI项目中开发了Google搜索引擎在Web高效搜索、大规模索引、文档的相关度评价等方面作了深入的研究提出了一种基于链接的网页排名算法 PageRank算法来计算网页的排名并同时利用锚文本An ch o rs信息进行网页相关度评价。

IBM Almaden研究中心研制了Clever系统提出了类似于PageRank的HITS算法主要不同是将网页分为Authority和Hub两类并就HITS算法在相关度评价、网页分类、主题搜索等方面的作用进行了研究。

NEC美国研究所开发了一个专门用于搜索学术文章的 ResearchI n d ex。其目的是建立一个网上图书馆 只收集科技人员广泛使用的 PDF和Postscript文件用“PDF” “Postscript”等检索项组成查询送往其他著名的搜索引擎对返回的结果进行信息提取 主题、摘要、作者、引用文献等 组成了一个27万篇文献的索引库供科技人员查询。现在 NEC开始致力于下一代元搜索引擎 Inquirus的开发。

国内先后有北京大学、清华大学、华南理工大学、 国家智能研究中心等高校和研究单位对搜索引擎技术进行了研究 开发出了几个实用的系统。

清华大学开发的“网络指南针”利用智能、高效的网络搜索算法收集网页 自动识别和转换常见的中文编码 向用户提供中文、英文、 拼音、英汉翻译、 BIG5码等多种输入查询服务并提供普通分类、学科分类、图书分类查询共计

3900多个分类目录收集的网页超过 20万页。

北大的“天网”中英文搜索引擎在系统规模及系统性能方面达到了国外中型搜索引擎系统的技术水平 目前天网搜索引擎维护的文档数量达到6亿之多并正在以平均每月一千万页文档的数量扩大着规模。天网搜索的中文文档数量超过4亿其中包括html、 txt、 pdf、doc、 ps、 ppt等多种类型的文档和资 源。在功能、性能、查准率、查全率等方面基本达到了实用。

华南理工大学的“木棉”搜索引擎分 Web检索和FTP检索两大部分。Web检索支持中英文混合查询、布尔查询、结构属性查询、模糊

查询等多种查询方式。FTP检索实现基于文件主要属性的结构查询以及模糊匹配等。目前系统收集约 50万网页。

学海无涯苦作舟!

1.2.2 搜索引擎技术发展方向

经过了多年的发展现在的搜索引擎功能越来越强大提供的服务也越来越全面。据研究统计 目前 In ternet上搜索引擎已达数千种之多。然而随着多元化信息的增长统一的用户入口己经不能满足用户的更深入的查询需求搜索引擎将向智能化、个性化、精确化、专业化、交叉语言检索、多媒体检索等适应不同用户需求的方向发展。

(1)智能化搜索

智能化是搜索引擎未来的发展方向。 搜索引擎的智能化体现在两方面一是对搜索请求的理解二是对网页内容的分析。通过智能代理技术对用户的查询计划、意图、兴趣方向进行推理 自动进行信息搜集过滤将用户感兴趣的信息返回给用户。这其中也包含了对服务多项化、个性化结果精确化交叉语言检索等方面的功能。

(2)个性化搜索

个性化搜索引擎的核心是通过跟踪分析用户的搜索行为 充分地利用这些信息来提高用户的搜索效率。 这种搜索行为分析技术是一种正在发展中的很有前途的搜索引擎人机界面技术。

(3)提高检索的有效性

解决查询结果过多的现象目前有以下几种方法 a)构建基于内容的搜索引擎。基于内容的搜索不是根据字形而是试图理解用户的请求 同时根据文档的内容选出符合用户要求的文档。 即通过各种方法获得用户没有在查询语句中表达出来的真正用途 实现自然语言的智能查询功能。中文搜索引擎中当前比较成熟的解决方案是依靠语义网络、汉语分词、句法分析、处理同义词等中文信息处理技术最大程度地了解用户需求。 b)将用户提问转化为系统己知的问题然后对已知问题进行解答 以求降低对自然语言理解技术的依赖性。c)用正文分类技术将结果分类使用可视化技术显示分类结构 用户可以只浏览自己感兴趣的类别。d)进行站点类聚或内容类聚减少信息的总量。 e)让用户对返回结果进行选择进行二次查询是一种非常有效的手段。

(4)实现交叉语言的检索

搜索引擎对多种语言的数据库进行交叉语言信息检索 返回能够回答用户问题的所有语言的文档。若配上机器翻译就可使返回结果以用户熟悉的语言显示。

易探云:买香港/美国/国内云服务器送QQ音乐绿钻豪华版1年,价值180元

易探云产品限时秒杀&QQ音乐典藏活动正在进行中!购买易探云香港/美国云服务器送QQ音乐绿钻豪华版1年,价值180元,性价比超级高。目前,有四大核心福利产品推荐:福利一、香港云服务器1核1G2M,仅218元/年起(香港CN2线路,全球50ms以内);福利二、美国20G高防云服务器1核1G5M,仅336元/年起(美国BGP线路,自带20G防御);福利三、2G虚拟主机低至58.8元/年(更有免费...

EdgeNat 新年开通优惠 - 韩国独立服务器原生IP地址CN2线路七折优惠

EdgeNat 商家在之前也有分享过几次活动,主要提供香港和韩国的VPS主机,分别在沙田和首尔LG机房,服务器均为自营硬件,电信CN2线路,移动联通BGP直连,其中VPS主机基于KVM架构,宿主机采用四路E5处理器、raid10+BBU固态硬盘!最高可以提供500Gbps DDoS防御。这次开年活动中有提供七折优惠的韩国独立服务器,原生IP地址CN2线路。第一、优惠券活动EdgeNat优惠码(限月...

Ceraus24元/月,国庆促销 香港云上新首月五折

Ceraus数据成立于2020年底,基于KVM虚拟架构技术;主营提供香港CN2、美国洛杉矶CN2、日本CN2的相关VPS云主机业务。喜迎国庆香港上新首月五折不限新老用户,cera机房,线路好,机器稳,适合做站五折优惠码:gqceraus 续费七五折官方网站:https://www.ceraus.com香港云内存​CPU硬盘流量宽带优惠价格购买地址香港云2G2核40G不限5Mbps24元/月点击购买...

国际互联网信息中心为你推荐
天府热线为什么四川天府热线区经常进去不到啊??51自学网站网上自学网站有哪些?最好是免费的,我想学习网页设计spgnux怎么安装思普操作系统百度抢票浏览器百度手机浏览器怎么抢票 手机百度浏览器抢票方法网站运营网站运营的工作做什么http与https的区别http和https到底有什么区别啊???arm开发板新手入门应如何选择 ARM 开发板?镜像文件是什么镜像文件是什么意思?安卓应用平台有没有什么安卓游戏都能找到的应用商店或者游戏中心彩信中心移动的短信中心号码是多少
3322动态域名注册 日本vps 息壤主机 mach5 轻博 新站长网 一点优惠网 京东商城0元抢购 稳定免费空间 中国网通测速 河南移动梦网 路由跟踪 cxz 广州虚拟主机 华为云建站 阿里云个人邮箱 服务器防御 googlevoice 开心online xshell5注册码 更多