搜索引擎互联网信息检索的研究与实现毕业论文

国际互联网信息中心  时间:2021-02-18  阅读:()

学海无涯苦作舟!

河北经贸大学毕业论文

互联网信息检索系统的研究与实现

专业名称

_________

班级

_______________

学生姓名

_____________

指导老师 ___________完成时间:

互联网信息检索系统搜索引擎是专门提供信息检索服务的平台 它将互联网上大量的网页数据采集到服务器 经过处理形成的信息数据库和索引数据库实现对用户提出的各种信息检索作出响应。

学海无涯苦作舟!

本系统使用 Microsoft Visual Studio 2005为主要开发工具 以

Windows Server 2003操作系统为运行环境主要实现了网页数据的抓取 网页数据存储数据的索引数据的检索 日志管理等功能。

本文对互联网信息检索统中几个关键技术的设计和实现进行了研究。从理论上对这些关键技术进行了详细的讨论并完成了基于Lucene.net互联网信息检索系统的实现。文章从下面几个方面进行了讨论

首先本文介绍搜索引擎的市场需求和研究状态。这一部分阐述了搜索引擎丰富的历史背景和客观的用户需求 自身的特点 以及人们对搜索引擎的关注程度。

其次本文讨论了搜索引擎中基本结构、实现的理论基础和实现方法。这一部分研究了搜索引擎的关键技术将中文分词技术、数据采集技术和数据索引技术有机的结合起来并对全文检索引擎 Lucene.net进行分析和研究。

最后详细描述了一个基于 Lucene.net的互联网信息检索系统的设计与实现。

关键词搜索引擎 Lucene.net数据存储信息检索

ABSTRACT

In ternet in formatio n retrieval system(search engine) is desig ned toprovide a platform for in formatio n retrieval services. It wi l l col lect a lot ofpages data on the In ternet to the server,a nd processed form of the informationdatabase and index database.Made to achieve the user to respond to thevarious information retrieval .

The system uses Microsoft Visual Studio 2005 as the main developmenttool , to run Windows Server 2003 operating system en vir onment, the mai nachieveme nt of the web crawl data,web data storage,data in dex ing,dataretrieval , loggi ng man ageme nt and otherfun cti ons.

In this paper,several Internet information retrieval system design and

学海无涯苦作舟!

impleme ntati on of key tech no logies were studied.Theory on these key tech nologies are discussed in detai l ,and completed the Internet in formati on retrievalsystem based on Lucene.net real ization.The article discussed the fol low ingaspects:

First of al l , the article describes the search engine market dema nd andresearch status.This part discusses the search engine rich historical background and objective of the user requireme nts, its own characteristics,as wel l aspeople paid more atte nti on to search engine.

Secon dly, the article discusses the basic structure of search engin es, toachieve the theoretical basis and implementation methods.This part of thesearch engin e's key tech no logy,Chin ese word segme ntati on,data acquisition and data in dex ing tech no logy comb ine orga nic,and ful l-text searchengine Luce ne.net on an alysis and research.

Fin al ly,a detai led descripti on of an In ternet-based Luce ne.net Informatio n Retrieval System Desig n and Impleme ntatio n.

Keywords Search Engine;Lucene.net;Data Storage; Information Retrieval

目录

1 绪论. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1

1.1 互联网信息检索系统的市场需求. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1

1.2 搜索引擎技术现状及发展动向. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2

1.2.1 搜索引擎技术现状. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2

1.2.2 搜索引擎技术发展方向. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4

1.3 研究目的和研究内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6

1.4 文章内容安排. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6

2搜索引擎技术. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

2.1 搜索引擎体系结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

2.1.1 Crawler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

2.1.2 In dexer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9

学海无涯苦作舟!

2.1.3 Searcher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10

2.2 搜索引擎的性能指标. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 1

2.3 中文分词算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

2.3.1 基于字符串匹配的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

2.3.2 基于理解的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

2.3.3 基于统计的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

2.4 实际系统研究. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16

2.4.1 Google 的整体结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16

2.4.2 Google 的工作过程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

3 Lucene.net 的分析研究. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19

3.1 Luce ne.net 介绍. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19

3.2 Lucene.net 系统结构分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20

3.2.1 系统结构组织. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20

3.2.2 索引文件分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22

3.2.3 数据流分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24

3.3 基于Lucene.net 的应用开发. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26

4 系统设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.1 系统特点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.2 系统总体结构设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.2.1 配置管理模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.2.2 数据抓取模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.2.3 数据索引模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.2.4 数据检索模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.2.5 日志管理模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.3 系统处理流程设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31

4.3.1 数据抓取处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31

4.3.2 数据索引处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .32

4.3.3 数据检索处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34

5 系统实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

5.1 多线程网页数据抓取. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

5.1.1 数据抓取主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

学海无涯苦作舟!

5.1.2 多线程的实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36

5.1.3 网页文件下载. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38

5.2 HTML文档的扫描与分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .40

5.3 数据的索引. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41

5.3.1 数据索引主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41

5.3.2 索引网页数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42

5.4 数据的检索. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

5.4.1 数据检索主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

5.3.2 检索索引数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

6 系统测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.1 测试基础. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.2 测试内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.2.1 模块测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.2.2 集成测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47

结束语. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49

致谢. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50

参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51

学海无涯苦作舟!

互联网信息检索系统的设计与实现

1绪论

随着互联网Internet的出现和普及人们的信息来源得到了极大的丰富互联网成为了人们获取信息的主要来源之一。在 In ternet信息不断增长的情况下如何快速准确的获取所需信息成为研究热点之一。搜索引擎技术

Search Engine就是在这种需求背景下发展起来的。

传统的信息检索技术是从一定规模的文档库中获取用户需求的信息其核心是重要文本信息的索引和检索。在信息量不大的情况下传统的信息检索能够满足需求。当面对 In ternet上分散存储动态变化的海量数据时传统的信息检索技术就无法让用户快速找到所需要的信息了。

搜索引擎技术作为传统 IR I nformatio n Retrieval技术在In ternet上的扩展涉及到Web数据的采集 中文分词技术倒排索引海量数据存储用户行为分析等关键技术。从功能上讲搜索引擎重要由信息的采集索引和查询三部分组成。 搜索引擎首先通过信息采集器 Crawler又名网络蜘蛛从In ternet中采集网页数据然后通过索引器 In dexer对采集的数据进行分析并创建索引。检索器 Searcher负责接受用户查询的请求一般采用 Web形式通过索引找到相关信息的网页数据

返回给用户。

为了满足系统的稳定性、可靠性及缩短系统开发周期本系统采用MicrosoftStudio Visual 2005作为开发平台以PC机和Windows Server 2003为测试环境借助Lucene.net实现了互联网信息检索的基本功能。

1 .1互联网信息检索系统的市场需求

随着信息技术的快速发展互联网得到了飞速的发展成为人们学习、工作、生活中的最重要的知识和信息来源。关于网页的数目没有具体的统计数据但根据

CNNIC第23次报道 中国当前拥有的网页数己经超过160亿。

In ternet上的信息资源随着In ternet的发展而呈现出以下特点

学海无涯苦作舟!

(1)信息量大而且分散

(2) 自治性强

(3)信息资源多种多样

(4)不一致和不完整性

为了获取所需的信息用户需要借助一定的工具他们通常使用以下两类网站

第一类是目录系统其典型代表是Yahoo! 。它通过有专业知识的网页编辑人员对网上的网页进行精选建立一个索引目录来给用户提供服务。这类通过手工维护得很好的系统的优点是提供的网页准确率高 可以有效的覆盖热门的主题但它们的缺点是过于主观而且需要高昂的代价来建立和维护更新改进的慢 同时不可能覆盖所有的主题。

第二类是搜索引擎搜索引擎通过程序自动地从网上搜集和分析网页建立索弓I ,为用户提供服务。这类自动更新的搜索引擎优点是涵盖的网页数量巨大 同时拥有基于关键字的全文索引它为所有网上冲浪的用户提供了一个入口 用户可以从搜索引擎出发到达自己想去的网上

任何一个地方。搜索引擎对用户是这样的重要 自然成为了用户上网的常用服务根据《中国互联网络发展状况统计报告》 用户经常使用的网络服务是 电子邮箱(92.6%)、搜索引擎(68.3%)、软件上传或下载服务(45.3%)、信息查询(42.2%)。

1 .2搜索引擎技术现状及发展动向

1.2.1 搜索引擎技术现状

由于搜索引擎巨大的商业价值和学术研究价值 各大公司都在投巨资进行搜索引擎的研制开发 不断地涌现出新的具有不同特色的搜索引

擎产品。同时各大科研机构和大学纷纷展开对搜索引擎技术相关领域的学术研究。

作为IR领域中最重要的会议之一TREC(Text REtrieval Conference)从1999年1 1月的第8届开始增加Web Track竞赛项目考察Web文档与其它类型文档在性质上的不同之处 测试在大规模的Web文档集上进行信息检索的算法性能。在 IEEE主办的国际万维网会议(InternationalWorld Wide Web Conference)和ACM主办的人机交互会议(Computer Huma n Interaction ,CH I等重要学术会议上发表了越来越多的关于搜索引擎技术研究的文

学海无涯苦作舟!

章。 搜索引擎己经成为信息检索领域中最活跃的研究方向。

Stanford大学在其DLI项目中开发了Google搜索引擎在Web高效搜索、大规模索引、文档的相关度评价等方面作了深入的研究提出了一种基于链接的网页排名算法 PageRank算法来计算网页的排名并同时利用锚文本An ch o rs信息进行网页相关度评价。

IBM Almaden研究中心研制了Clever系统提出了类似于PageRank的HITS算法主要不同是将网页分为Authority和Hub两类并就HITS算法在相关度评价、网页分类、主题搜索等方面的作用进行了研究。

NEC美国研究所开发了一个专门用于搜索学术文章的 ResearchI n d ex。其目的是建立一个网上图书馆 只收集科技人员广泛使用的 PDF和Postscript文件用“PDF” “Postscript”等检索项组成查询送往其他著名的搜索引擎对返回的结果进行信息提取 主题、摘要、作者、引用文献等 组成了一个27万篇文献的索引库供科技人员查询。现在 NEC开始致力于下一代元搜索引擎 Inquirus的开发。

国内先后有北京大学、清华大学、华南理工大学、 国家智能研究中心等高校和研究单位对搜索引擎技术进行了研究 开发出了几个实用的系统。

清华大学开发的“网络指南针”利用智能、高效的网络搜索算法收集网页 自动识别和转换常见的中文编码 向用户提供中文、英文、 拼音、英汉翻译、 BIG5码等多种输入查询服务并提供普通分类、学科分类、图书分类查询共计

3900多个分类目录收集的网页超过 20万页。

北大的“天网”中英文搜索引擎在系统规模及系统性能方面达到了国外中型搜索引擎系统的技术水平 目前天网搜索引擎维护的文档数量达到6亿之多并正在以平均每月一千万页文档的数量扩大着规模。天网搜索的中文文档数量超过4亿其中包括html、 txt、 pdf、doc、 ps、 ppt等多种类型的文档和资 源。在功能、性能、查准率、查全率等方面基本达到了实用。

华南理工大学的“木棉”搜索引擎分 Web检索和FTP检索两大部分。Web检索支持中英文混合查询、布尔查询、结构属性查询、模糊

查询等多种查询方式。FTP检索实现基于文件主要属性的结构查询以及模糊匹配等。目前系统收集约 50万网页。

学海无涯苦作舟!

1.2.2 搜索引擎技术发展方向

经过了多年的发展现在的搜索引擎功能越来越强大提供的服务也越来越全面。据研究统计 目前 In ternet上搜索引擎已达数千种之多。然而随着多元化信息的增长统一的用户入口己经不能满足用户的更深入的查询需求搜索引擎将向智能化、个性化、精确化、专业化、交叉语言检索、多媒体检索等适应不同用户需求的方向发展。

(1)智能化搜索

智能化是搜索引擎未来的发展方向。 搜索引擎的智能化体现在两方面一是对搜索请求的理解二是对网页内容的分析。通过智能代理技术对用户的查询计划、意图、兴趣方向进行推理 自动进行信息搜集过滤将用户感兴趣的信息返回给用户。这其中也包含了对服务多项化、个性化结果精确化交叉语言检索等方面的功能。

(2)个性化搜索

个性化搜索引擎的核心是通过跟踪分析用户的搜索行为 充分地利用这些信息来提高用户的搜索效率。 这种搜索行为分析技术是一种正在发展中的很有前途的搜索引擎人机界面技术。

(3)提高检索的有效性

解决查询结果过多的现象目前有以下几种方法 a)构建基于内容的搜索引擎。基于内容的搜索不是根据字形而是试图理解用户的请求 同时根据文档的内容选出符合用户要求的文档。 即通过各种方法获得用户没有在查询语句中表达出来的真正用途 实现自然语言的智能查询功能。中文搜索引擎中当前比较成熟的解决方案是依靠语义网络、汉语分词、句法分析、处理同义词等中文信息处理技术最大程度地了解用户需求。 b)将用户提问转化为系统己知的问题然后对已知问题进行解答 以求降低对自然语言理解技术的依赖性。c)用正文分类技术将结果分类使用可视化技术显示分类结构 用户可以只浏览自己感兴趣的类别。d)进行站点类聚或内容类聚减少信息的总量。 e)让用户对返回结果进行选择进行二次查询是一种非常有效的手段。

(4)实现交叉语言的检索

搜索引擎对多种语言的数据库进行交叉语言信息检索 返回能够回答用户问题的所有语言的文档。若配上机器翻译就可使返回结果以用户熟悉的语言显示。

易探云2核2G5M仅330元/年起,国内挂机宝云服务器,独立ip

易探云怎么样?易探云是国内一家云计算服务商家,致力香港服务器、国内外服务器租用及托管等互联网业务,目前主要地区为运作香港BGP、香港CN2、广东、北京、深圳等地区。目前,易探云推出深圳或北京地区的适合挂机和建站的云服务器,国内挂机宝云服务器(可选深圳或北京地区),独立ip;2核2G5M挂机云服务器仅330元/年起!点击进入:易探云官方网站地址易探云国内挂机宝云服务器推荐:1、国内入门型挂机云服务器...

HaBangNet(6.95美元/月)美国vps 5TB流量/德国vps 香港双向CN2 GIA VPS

HaBangNet支持支付宝和微信支付,只是价格偏贵,之前国内用户并不多。这次HaBangNet推出三个特价套餐,其中美国机房和德国机房价格也还可以,但是香港机房虽然是双向CN2 GIA线路,但是还是贵的惊人,需要美国和德国机房的可以参考下。HaBangNet是一家成立于2014年的香港IDC商家,中文译名:哈邦网络公司,主营中国香港、新加坡、澳大利亚、荷兰、美国、德国机房的虚拟主机、vps、专用...

GigsGigsCloud 春节优惠2022 指定云服务器VPS主机85折循环优惠码

GigsGigsCloud商家在之前介绍的还是比较多的,因为之前我一直有几台机器在使用,只是最近几年网站都陆续转型删除掉不少的网站和闲置域名,包括今年也都减少网站开始转型自媒体方向。GigsGigsCloud 商家产品还是比较有特色的,有提供香港、新加坡等亚洲机房的云服务器、VPS和独立服务器等。第一、新春优惠活动优惠码:CNY2022-15OFF截止到正月初二,我们可以使用上述优惠码在购买指定G...

国际互联网信息中心为你推荐
万维读者网《读者》要订购有网站吗?可以发外链的论坛可以发外链的论坛有那些?支付宝查询余额我的支付宝如何查询余额天天酷跑刷积分教程天天酷跑积分怎么获得 天天酷跑刷积分方法吴晓波频道买粉看吴晓波频道的心得bluestacksBlueStacks安卓模拟器官方版怎么用?公章制作如何用photoshop制作公章iphone越狱后怎么恢复苹果手机越狱后怎么恢复bluestack安卓模拟器bluestacks怎么用?微信怎么看聊天记录什么方法可以知道微信的聊天记录
GGC 国外服务器 42u机柜尺寸 gateone godaddy域名证书 工作站服务器 cn3 厦门电信 网通服务器 华为云建站 xuni 贵州电信 cpu使用率过高怎么办 卡巴斯基免费版 内存 vpsaa 大硬盘补丁 ddos攻击教程 电脑主机启动不了 国外bt网站 更多