搜索引擎互联网信息检索的研究与实现毕业论文

国际互联网信息中心  时间:2021-02-18  阅读:()

学海无涯苦作舟!

河北经贸大学毕业论文

互联网信息检索系统的研究与实现

专业名称

_________

班级

_______________

学生姓名

_____________

指导老师 ___________完成时间:

互联网信息检索系统搜索引擎是专门提供信息检索服务的平台 它将互联网上大量的网页数据采集到服务器 经过处理形成的信息数据库和索引数据库实现对用户提出的各种信息检索作出响应。

学海无涯苦作舟!

本系统使用 Microsoft Visual Studio 2005为主要开发工具 以

Windows Server 2003操作系统为运行环境主要实现了网页数据的抓取 网页数据存储数据的索引数据的检索 日志管理等功能。

本文对互联网信息检索统中几个关键技术的设计和实现进行了研究。从理论上对这些关键技术进行了详细的讨论并完成了基于Lucene.net互联网信息检索系统的实现。文章从下面几个方面进行了讨论

首先本文介绍搜索引擎的市场需求和研究状态。这一部分阐述了搜索引擎丰富的历史背景和客观的用户需求 自身的特点 以及人们对搜索引擎的关注程度。

其次本文讨论了搜索引擎中基本结构、实现的理论基础和实现方法。这一部分研究了搜索引擎的关键技术将中文分词技术、数据采集技术和数据索引技术有机的结合起来并对全文检索引擎 Lucene.net进行分析和研究。

最后详细描述了一个基于 Lucene.net的互联网信息检索系统的设计与实现。

关键词搜索引擎 Lucene.net数据存储信息检索

ABSTRACT

In ternet in formatio n retrieval system(search engine) is desig ned toprovide a platform for in formatio n retrieval services. It wi l l col lect a lot ofpages data on the In ternet to the server,a nd processed form of the informationdatabase and index database.Made to achieve the user to respond to thevarious information retrieval .

The system uses Microsoft Visual Studio 2005 as the main developmenttool , to run Windows Server 2003 operating system en vir onment, the mai nachieveme nt of the web crawl data,web data storage,data in dex ing,dataretrieval , loggi ng man ageme nt and otherfun cti ons.

In this paper,several Internet information retrieval system design and

学海无涯苦作舟!

impleme ntati on of key tech no logies were studied.Theory on these key tech nologies are discussed in detai l ,and completed the Internet in formati on retrievalsystem based on Lucene.net real ization.The article discussed the fol low ingaspects:

First of al l , the article describes the search engine market dema nd andresearch status.This part discusses the search engine rich historical background and objective of the user requireme nts, its own characteristics,as wel l aspeople paid more atte nti on to search engine.

Secon dly, the article discusses the basic structure of search engin es, toachieve the theoretical basis and implementation methods.This part of thesearch engin e's key tech no logy,Chin ese word segme ntati on,data acquisition and data in dex ing tech no logy comb ine orga nic,and ful l-text searchengine Luce ne.net on an alysis and research.

Fin al ly,a detai led descripti on of an In ternet-based Luce ne.net Informatio n Retrieval System Desig n and Impleme ntatio n.

Keywords Search Engine;Lucene.net;Data Storage; Information Retrieval

目录

1 绪论. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1

1.1 互联网信息检索系统的市场需求. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1

1.2 搜索引擎技术现状及发展动向. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2

1.2.1 搜索引擎技术现状. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .2

1.2.2 搜索引擎技术发展方向. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .4

1.3 研究目的和研究内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6

1.4 文章内容安排. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .6

2搜索引擎技术. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

2.1 搜索引擎体系结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

2.1.1 Crawler. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .7

2.1.2 In dexer. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .9

学海无涯苦作舟!

2.1.3 Searcher. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .10

2.2 搜索引擎的性能指标. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .1 1

2.3 中文分词算法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

2.3.1 基于字符串匹配的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .12

2.3.2 基于理解的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

2.3.3 基于统计的分词方法. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .15

2.4 实际系统研究. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16

2.4.1 Google 的整体结构. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .16

2.4.2 Google 的工作过程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .17

3 Lucene.net 的分析研究. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19

3.1 Luce ne.net 介绍. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .19

3.2 Lucene.net 系统结构分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20

3.2.1 系统结构组织. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .20

3.2.2 索引文件分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .22

3.2.3 数据流分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .24

3.3 基于Lucene.net 的应用开发. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .26

4 系统设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.1 系统特点. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.2 系统总体结构设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.2.1 配置管理模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .29

4.2.2 数据抓取模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.2.3 数据索引模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.2.4 数据检索模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.2.5 日志管理模块. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .30

4.3 系统处理流程设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31

4.3.1 数据抓取处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .31

4.3.2 数据索引处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .32

4.3.3 数据检索处理流程. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .34

5 系统实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

5.1 多线程网页数据抓取. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

5.1.1 数据抓取主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .35

学海无涯苦作舟!

5.1.2 多线程的实现. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .36

5.1.3 网页文件下载. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .38

5.2 HTML文档的扫描与分析. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .40

5.3 数据的索引. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41

5.3.1 数据索引主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .41

5.3.2 索引网页数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .42

5.4 数据的检索. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

5.4.1 数据检索主界面设计. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

5.3.2 检索索引数据. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .43

6 系统测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.1 测试基础. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.2 测试内容. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.2.1 模块测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .46

6.2.2 集成测试. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .47

结束语. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .49

致谢. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .50

参考文献. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .51

学海无涯苦作舟!

互联网信息检索系统的设计与实现

1绪论

随着互联网Internet的出现和普及人们的信息来源得到了极大的丰富互联网成为了人们获取信息的主要来源之一。在 In ternet信息不断增长的情况下如何快速准确的获取所需信息成为研究热点之一。搜索引擎技术

Search Engine就是在这种需求背景下发展起来的。

传统的信息检索技术是从一定规模的文档库中获取用户需求的信息其核心是重要文本信息的索引和检索。在信息量不大的情况下传统的信息检索能够满足需求。当面对 In ternet上分散存储动态变化的海量数据时传统的信息检索技术就无法让用户快速找到所需要的信息了。

搜索引擎技术作为传统 IR I nformatio n Retrieval技术在In ternet上的扩展涉及到Web数据的采集 中文分词技术倒排索引海量数据存储用户行为分析等关键技术。从功能上讲搜索引擎重要由信息的采集索引和查询三部分组成。 搜索引擎首先通过信息采集器 Crawler又名网络蜘蛛从In ternet中采集网页数据然后通过索引器 In dexer对采集的数据进行分析并创建索引。检索器 Searcher负责接受用户查询的请求一般采用 Web形式通过索引找到相关信息的网页数据

返回给用户。

为了满足系统的稳定性、可靠性及缩短系统开发周期本系统采用MicrosoftStudio Visual 2005作为开发平台以PC机和Windows Server 2003为测试环境借助Lucene.net实现了互联网信息检索的基本功能。

1 .1互联网信息检索系统的市场需求

随着信息技术的快速发展互联网得到了飞速的发展成为人们学习、工作、生活中的最重要的知识和信息来源。关于网页的数目没有具体的统计数据但根据

CNNIC第23次报道 中国当前拥有的网页数己经超过160亿。

In ternet上的信息资源随着In ternet的发展而呈现出以下特点

学海无涯苦作舟!

(1)信息量大而且分散

(2) 自治性强

(3)信息资源多种多样

(4)不一致和不完整性

为了获取所需的信息用户需要借助一定的工具他们通常使用以下两类网站

第一类是目录系统其典型代表是Yahoo! 。它通过有专业知识的网页编辑人员对网上的网页进行精选建立一个索引目录来给用户提供服务。这类通过手工维护得很好的系统的优点是提供的网页准确率高 可以有效的覆盖热门的主题但它们的缺点是过于主观而且需要高昂的代价来建立和维护更新改进的慢 同时不可能覆盖所有的主题。

第二类是搜索引擎搜索引擎通过程序自动地从网上搜集和分析网页建立索弓I ,为用户提供服务。这类自动更新的搜索引擎优点是涵盖的网页数量巨大 同时拥有基于关键字的全文索引它为所有网上冲浪的用户提供了一个入口 用户可以从搜索引擎出发到达自己想去的网上

任何一个地方。搜索引擎对用户是这样的重要 自然成为了用户上网的常用服务根据《中国互联网络发展状况统计报告》 用户经常使用的网络服务是 电子邮箱(92.6%)、搜索引擎(68.3%)、软件上传或下载服务(45.3%)、信息查询(42.2%)。

1 .2搜索引擎技术现状及发展动向

1.2.1 搜索引擎技术现状

由于搜索引擎巨大的商业价值和学术研究价值 各大公司都在投巨资进行搜索引擎的研制开发 不断地涌现出新的具有不同特色的搜索引

擎产品。同时各大科研机构和大学纷纷展开对搜索引擎技术相关领域的学术研究。

作为IR领域中最重要的会议之一TREC(Text REtrieval Conference)从1999年1 1月的第8届开始增加Web Track竞赛项目考察Web文档与其它类型文档在性质上的不同之处 测试在大规模的Web文档集上进行信息检索的算法性能。在 IEEE主办的国际万维网会议(InternationalWorld Wide Web Conference)和ACM主办的人机交互会议(Computer Huma n Interaction ,CH I等重要学术会议上发表了越来越多的关于搜索引擎技术研究的文

学海无涯苦作舟!

章。 搜索引擎己经成为信息检索领域中最活跃的研究方向。

Stanford大学在其DLI项目中开发了Google搜索引擎在Web高效搜索、大规模索引、文档的相关度评价等方面作了深入的研究提出了一种基于链接的网页排名算法 PageRank算法来计算网页的排名并同时利用锚文本An ch o rs信息进行网页相关度评价。

IBM Almaden研究中心研制了Clever系统提出了类似于PageRank的HITS算法主要不同是将网页分为Authority和Hub两类并就HITS算法在相关度评价、网页分类、主题搜索等方面的作用进行了研究。

NEC美国研究所开发了一个专门用于搜索学术文章的 ResearchI n d ex。其目的是建立一个网上图书馆 只收集科技人员广泛使用的 PDF和Postscript文件用“PDF” “Postscript”等检索项组成查询送往其他著名的搜索引擎对返回的结果进行信息提取 主题、摘要、作者、引用文献等 组成了一个27万篇文献的索引库供科技人员查询。现在 NEC开始致力于下一代元搜索引擎 Inquirus的开发。

国内先后有北京大学、清华大学、华南理工大学、 国家智能研究中心等高校和研究单位对搜索引擎技术进行了研究 开发出了几个实用的系统。

清华大学开发的“网络指南针”利用智能、高效的网络搜索算法收集网页 自动识别和转换常见的中文编码 向用户提供中文、英文、 拼音、英汉翻译、 BIG5码等多种输入查询服务并提供普通分类、学科分类、图书分类查询共计

3900多个分类目录收集的网页超过 20万页。

北大的“天网”中英文搜索引擎在系统规模及系统性能方面达到了国外中型搜索引擎系统的技术水平 目前天网搜索引擎维护的文档数量达到6亿之多并正在以平均每月一千万页文档的数量扩大着规模。天网搜索的中文文档数量超过4亿其中包括html、 txt、 pdf、doc、 ps、 ppt等多种类型的文档和资 源。在功能、性能、查准率、查全率等方面基本达到了实用。

华南理工大学的“木棉”搜索引擎分 Web检索和FTP检索两大部分。Web检索支持中英文混合查询、布尔查询、结构属性查询、模糊

查询等多种查询方式。FTP检索实现基于文件主要属性的结构查询以及模糊匹配等。目前系统收集约 50万网页。

学海无涯苦作舟!

1.2.2 搜索引擎技术发展方向

经过了多年的发展现在的搜索引擎功能越来越强大提供的服务也越来越全面。据研究统计 目前 In ternet上搜索引擎已达数千种之多。然而随着多元化信息的增长统一的用户入口己经不能满足用户的更深入的查询需求搜索引擎将向智能化、个性化、精确化、专业化、交叉语言检索、多媒体检索等适应不同用户需求的方向发展。

(1)智能化搜索

智能化是搜索引擎未来的发展方向。 搜索引擎的智能化体现在两方面一是对搜索请求的理解二是对网页内容的分析。通过智能代理技术对用户的查询计划、意图、兴趣方向进行推理 自动进行信息搜集过滤将用户感兴趣的信息返回给用户。这其中也包含了对服务多项化、个性化结果精确化交叉语言检索等方面的功能。

(2)个性化搜索

个性化搜索引擎的核心是通过跟踪分析用户的搜索行为 充分地利用这些信息来提高用户的搜索效率。 这种搜索行为分析技术是一种正在发展中的很有前途的搜索引擎人机界面技术。

(3)提高检索的有效性

解决查询结果过多的现象目前有以下几种方法 a)构建基于内容的搜索引擎。基于内容的搜索不是根据字形而是试图理解用户的请求 同时根据文档的内容选出符合用户要求的文档。 即通过各种方法获得用户没有在查询语句中表达出来的真正用途 实现自然语言的智能查询功能。中文搜索引擎中当前比较成熟的解决方案是依靠语义网络、汉语分词、句法分析、处理同义词等中文信息处理技术最大程度地了解用户需求。 b)将用户提问转化为系统己知的问题然后对已知问题进行解答 以求降低对自然语言理解技术的依赖性。c)用正文分类技术将结果分类使用可视化技术显示分类结构 用户可以只浏览自己感兴趣的类别。d)进行站点类聚或内容类聚减少信息的总量。 e)让用户对返回结果进行选择进行二次查询是一种非常有效的手段。

(4)实现交叉语言的检索

搜索引擎对多种语言的数据库进行交叉语言信息检索 返回能够回答用户问题的所有语言的文档。若配上机器翻译就可使返回结果以用户熟悉的语言显示。

Linode十八周年及未来展望

这两天Linode发布了十八周年的博文和邮件,回顾了过去取得的成绩和对未来的展望。作为一家运营18年的VPS主机商,Linode无疑是有一些可取之处的,商家提供基于KVM架构的VPS主机,支持随时删除(按小时计费),可选包括美国、英国、新加坡、日本、印度、加拿大、德国等全球十多个数据中心,所有机器提供高出入网带宽,最低仅$5/月($0.0075/小时)。This month marks Linod...

hypervmart:英国/荷兰vps,2核/3GB内存/25GB NVMe空间/不限流量/1Gbps端口/Hyper-V,$10.97/季

hypervmart怎么样?hypervmart是一家国外主机商,成立于2011年,提供虚拟主机、VPS等,vps基于Hyper-V 2012 R2,宣称不超售,支持linux和windows,有荷兰和英国2个数据中心,特色是1Gbps带宽、不限流量。现在配置提高,价格不变,性价比提高了很多。(数据中心不太清楚,按以前的记录,应该是欧洲),支持Paypal付款。点击进入:hypervmart官方网...

DiyVM独立服务器:香港沙田服务器,5M带宽CN2线路,L5630*2/16G内存/120G SSD硬盘,499元/月

diyvm怎么样?diyvm商家VPS主机均2GB内存起步,三个地区机房可选,使用优惠码后每月69元起;DiyVM独立服务器开设在香港沙田电信机房,CN2线路,5M带宽,自动化开通上架,最低499元/月,配置是L5630*2/16G内存/120G SSD硬盘。DiyVM是一家成立于2009年的国人主机商,提供的产品包括VPS主机、独立服务器租用等,产品数据中心包括中国香港、日本大阪和美国洛杉矶等,...

国际互联网信息中心为你推荐
iphone360手机卫士iphone需要360安全卫士吗?站长故事科学家的故事200字spgnuxPC操作系统如何描述godaddyGO DADDY服务器空间域名怎么样神雕侠侣礼包大全神雕侠侣手游华山论剑礼包有什么 怎么领取电子商务网站模板电子商务网站模板哪个好?电子商务网站模板免费建站怎么样?网站优化方案网站优化方案如何写?微信电话本怎么用怎么用微信打电话微信电话本怎么用微信电话本在哪里 微信电话本怎么打开微信怎么看聊天记录什么方法可以知道微信的聊天记录
1g虚拟主机 虚拟主机测评 租服务器价格 vir vmsnap3 godaddy域名优惠码 服务器怎么绑定域名 华为4核 柚子舍官网 softbank邮箱 lol台服官网 linux服务器维护 空间合租 gtt 登陆空间 上海电信测速 电信网络测速器 电信宽带测速软件 腾讯网盘 789电视剧网 更多