>第54卷第14期2010年7月信息;而作为引文索引数据库的构建者来说,更多的则是关注如何提高引文索引数据库的质量,从而更加广泛深入地发挥引文索引数据库的作用.
我们可以从多个角度提高引文索引数据库的质量,如来源期刊的选定、入库数据的加工质量和加工速度、系统平台等,新的信息组织技术与方法的引进及应用也是其中一种途径,因此,我们可以充分利用一些新的信息组织技术和方法来提高引文索引数据库的信息组织质量,从而增强引文索引的检索、信息精选与学术评价功能.
有鉴于此,本文选取CSSCI中的部分数据作为样例来源,将主题图技术应用于引文索引数据库的构建之中,探索主题图应用于引文索引数据库的可行性以及将来可能面临的问题.
2主题图应用于引文索引的可行性主题图,又称主题地图(topicmap),作为一种新兴的信息组织方式,起源于20世纪90年代初,在国际标准ISO/IEC:13250中,它被定义为"一套用来组织信息的方法,使用这种方法可以提供最佳的信息导航"[3].
从理论到实践,主题图技术的发展已经相对稳定和成熟.
作为一种信息组织技术,它汲取了传统索引、图书馆科学、知识表示以及多种知识组织方法的的优点,由于它所具有的灵活性和丰富的表现力,目前已经被国外广泛应用于知识管理、Web应用、语义挖掘等领域.
如SchweigerRalf、HoelzerSimon、RudolfDirk等人提出利用主题图技术来管理医疗信息系统[4],通过主题图揭示医疗临床数据资源之间的联系,并将这种关联作为上下文检索的基础,从而获取更为准确的检索结果;由挪威Ontopia公司开发的意大利歌剧主题图、基于主题图技术的柯达数字摄影配件网站[5]等.
主题图的核心概念主要包括主题(topic)、关联(association)、信息资源实体(occurrences)和范围(scope)4个部分[6].
它在信息资源的上层构建了一个结构化的语义网,独立于技术平台,用以描述主题之间以及主题与信息资源实体之间的关联,通过揭示概念之间的关系,将用户指引到相关的信息资源.
引文索引具备三个得天独厚的功能,其中一个重要功能表现在:已发表的文献本身所包含的主题范畴在语义上更准确、更详细;同样,其稳定性和灵活性在语义上也胜过普通的主题索引.
而主题图正是在信息资源的上层构建了一个结构化的语义网,在引文索引的构建中应用主题图技术可以从语义层次组织信息资源,增强引文索引的功能.
3引文索引主题图的构建主题图技术应用于信息组织主要是通过一些主题图工具来实现的,主题图工具包括三大类型:主题图引擎(topicmapsengines)、主题图编辑器(topicmapseditors)和主题图可视化工具(topicmapsvisualisation).
目前国外使用比较广泛的主题图工具有TM4J、OKSSamplers、TheGooseWorksTopicMapTookit、TMview、TM3D等.
在这些主题图工具中,有的是单一性的主题图引擎、主题图编辑器或者主题图可视化工具,有的则是集三者于一体的综合性主题图工具.
本文选取的主题图工具是Ontopia公司开发的OKSSamplers,它同时包含了主题图引擎TheOntopiaTopicMapEngine、主题图编辑器Ontopoly、主题图导航框架Omnigator以及主题图可视化工具Vizigator4部分,能够实现主题图编辑、显示和可视化的一站式构建,并且支持中文主题图的开发和构建.
TheOntopiaTopicMapEngine是OKSSamplers的核心部分,它的主要功能是通过TopicMapsAPI允许应用程序以XTM形式导入和导出主题地图,支持在关系数据库中存储、访问、修改主题地图.
无论主题地图是以内存、数据库还是虚拟视图等形式存放,应用程序都可以透明访问.
主题图编辑器Ontopoly是一个为用户提供手工创建与维护主题地图的工具,为了应用程序开发方便,提供了易于操作的用户接口和本体(Ontology)驱动.
这就意味着用户可以从底层本体(Ontology)和提前定义的规则中生成主题地图.
Ontopoly编辑页面主要包括4个模块:①Description模块,对所构建的主题图的总体描述;②Admin模块,即Export模块,提供主题图的输出功能,用户可以将已经完成的或者正在编制的主题图以XML文档、XTM、TM/XML以及RDF的形式输出并保存到本地系统;③Ontology构建模块,ontopoly的核心部分,主要是对主题类型(topictypes)、资源类型(occurrencetypes)、关联类型(associationtypes)、角色类型(roletypes)以及名称类型(nametypes)5个部分的定义;④Instances模块,定义每个主题类型所对应的实例.
从主题图的基本构成要素我们可以看出,引文索引主题图的构建主要包括主题、关联、信息资源实体以及实例的定义.
具体构建步骤如下:3.
1主题类型的分析与定义在主题图中,主题从属于特定的主题类型,因此首先必须定义主题类型.
基于CSSCI向用户提供了来源12>第54卷第14期2010年7月4引文索引主题图的浏览与检索4.
1引文索引主题图的浏览引文索引主题图的浏览主要通过OKSSamplers中的主题图导航框架Omnigator来实现,Omnigator使用简单的基于HTTP协议的客户机/服务器模式,以Tomcat作为Web服务器.
使用Omnigator不仅可以对主题地图进行浏览,还具有管理、合并主题地图功能,可以对插件全文索引进行管理.
它还利用主题查询语言Tolog对主题地图进行查询、验证主题地图的有效性,更换Omnigator显示模式、视图等.
图2所示的是来源文献《外文电子期刊收集策略再探》的主题图浏览界面:图2《外文电子期刊收集策略再探》主题图浏览界面该浏览界面显示了《外文电子期刊收集策略再探》所具备的关联类型和信息资源实体.
其中,关联类型主要是与被引文献《美国的图书馆自动化和文献资源共享网络———现状与趋势》之间的的"引用关系";信息资源实体主要包括它的内部信息资源实体和外部信息资源实体,如分类号、作者、作者机构、关键词、参考文献、全文等.
需要指出的是,每一种信息资源实体都是一个主题,均可以点击进入其对应的主题图浏览界面.
4.
2引文索引主题图的可视化显示与检索引文索引主题图的可视化主要通过OKSSamplers中的主题图可视化工具Vizigator来实现的.
在可视化界面中,我们可以选择关于某一主题的一级、二级、三级等几个不同级别层次的可视化显示.
《外文电子期刊收集策略再探》的一级可视化界面(见图3),层次越小,可视化所显示的信息就越简单.
引文索引主题图的检索也是在可视化界面中来实现的.
在可视化显示上方的检索框中,我们可以输入图3《外文电子期刊收集策略再探》"一级"可视化界面检索主题,如来源文献的篇名,检索结果会以亮色突显的方式来呈现给用户,从而实现引文索引主题图的可视化检索.
5结语本文以CSSCI中的部分数据作为样例来源,利用主题图工具OKSSamplers实现了引文索引主题图的构建,验证了主题图技术应用于引文索引数据库中的可行性.
本实验系统所构建的引文索引主题图具有以下特点:①给用户提供了基于语义的导航,当用户浏览某个主题时,系统就将和该主题有关联的其他所有主题都展示出来,并提供了它们之间存在的语义关联,这种语义关联能够揭示主题之间的引证关系,为科学评价提供依据;②在所构建的主题图浏览界面中,每个主题都具备"超级链接"功能,这个"超级链接"功能是在构建主题之间的语义关联后,由系统自动生成的;③通过利用主题图系统的可视化插件,实现了所构建的所有主题的可视化浏览.
关于主题图应用于引文索引数据库,笔者认为首先需要在不影响整体引文索引数据库使用的前提下,先进行小规模的实验研究,分析引文索引数据库使用主题图技术的可行性;其次,需要判定所构建的引文索引数据库适合使用哪种主题图工具,即进行主题图工具的调研和选定,因为目前国外大部分主题图工具都是付费使用,小部分主题图工具提供一段时间的免费试用期,所以如何选择适合的主题图工具是至关重要的.
本文中的实验系统只选择了CSSCI中的部分来源文献和被引文献作为实验对象,还有待于进一步的拓展.
同时,主题图技术的其他功能在引文索引中的应用,如合并功能、语义挖掘等,也有待于进一步的研究和开发.
(下转第120页)32<<知识组织LIBRARYANDINFORMATIONSERVICE在专业领域知识环境中建立研究组、研究项目、实验室、研究室的个性化子环境,实施专业领域知识环境的应用.
专业领域知识环境的部署应结合中国科学院重点发展领域和学科布局,在科研人员直接参与下,按照重大研究领域和研究方向,有计划地逐步开展专业领域知识环境的部署.
作为试点应用,先期可以从信息科技、空间科技、能源科技、纳米、先进制造与新材料、生物医药、现代农业科技、生物多样性、海洋科技、生态与资源环境等领域有选择地进行试点应用部署.
通过几年的努力,逐步将专业领域知识环境覆盖到中国科学院的所有研究领域.
在已部署的领域专业领域知识环境中的应用可以从重点研究方向、重大研究项目、重要的研究小组,甚至是TOP科学家入手.
以典型的成功应用案例和累积的知识资源来吸引更多科研团队和用户加入到知识环境应用中.
为用户打造集成化、智能化、个性化的专业领域知识环境,并将知识环境融入中国科学院数字知识基础环境架构中,为中国科学院的科研创新和信息能力提升作出不懈努力,是专业领域知识环境建设团队的共同目标和理想.
参考文献:[1]孙恒志.
从已有知识定义的缺陷看知识定义的科学整合.
山东科技大学学报(社会科学版),2002,4(3):14-17.
[2]宋文,孙坦.
综合科技信息组织的理念与实现方法研究.
中国图书馆学报,2009,35(2):9-14.
[3]中国科学院.
年报2009.
[2009-08-14].
http://www.
cas.
cn/.
[4]中国科学院.
科技革命与中国的现代化.
北京:科学出版社,2009年.
[5]eResearch:JISC.
[2009-09-09].
http://www.
jisc.
ac.
uk/whatwedo/themes/eresearch.
aspx.
[6]BordaA.
ReportoftheworkinggrouponvirtualresearchcommunitiesfortheOSTeInfrastructuresteeringgroup.
[2009-08-15].
http://eprints.
soton.
ac.
uk/42074/.
[7]中国互联网协会交流与发展中心.
中国Web2.
0发展趋势与现状调研报告.
[2009-08-15].
http://www.
internetdigital.
org/report/web20_report_intro.
pdf.
[8]W3CSemanticWebActivity.
[2009-08-15].
http://www.
w3.
org/2001/sw/.
[9]Berners-LeeT,HendlerJ,LassilaO.
TheSemanticWeb.
ScientificAmerican.
[2009-10-09].
http://www.
scientificamerican.
com/article.
cfmid=the-semantic-web.
[10]罗家佳,宋文.
OntoWeb:基于本体的知识管理和电子商务.
现代图书情报技术,2006(2):26-29.
[11]KnowledgeWebPortal.
[2009-09-09].
http://knowledgeweb.
semanticweb.
org/semanticportal/sewView/frames.
html.
[12]SemIPort.
[2009-09-09].
http://km.
aifb.
uni-karlsruhe.
de/projects/semiport.
[13]InstitutAIFB.
[2009-09-09].
http://www.
aifb.
uni-karlsruhe.
de/english.
[14]VIVO:CornellResearch&Scholarship.
[2009-09-09].
http://vivo.
cornell.
edu/.
[15]HarvardScience.
[2009-09-09].
http://www.
harvardscience.
harvard.
edu/.
[16]SWED.
[2006-12-10].
http://www.
swed.
org.
uk/swed/.
[17]WOKE.
[2006-12-10].
http://www.
workforceoke.
org/.
〔作者简介〕宋文,女,1961年生,研究馆员,部副主任,发表论文30余篇;刘毅,男,1974年生,副研究馆员,发表论文数篇;黄金霞,女,1972年生,副研究馆员,发表论文10篇;刘峥,女,1979年生,馆员,发表论文数篇.
(上接第23页)参考文献:[1]加菲尔德.
引文索引法的理论及应用.
侯汉清,陆宝树,等译.
北京:北京图书馆出版社,2004.
[2]叶继元,袁曦临.
信息化条件下引文索引的信息精选与学术评价功能探析.
图书馆论坛,2009(4):6-9.
[3]BiezunskiM,BryanM,StevenR.
Newcomb.
ISO/IECStandard13250.
(1998-09-21).
[2007-09-06].
http://www.
infoloom.
com/tnm/draft27.
htm.
[4]RaifS,SimonH,DirkR.
etal.
LinkingclinicaldatausingXMLtopicmaps.
ArtificialIntelligenceinMedicine,2003,28(1):105-115.
[5]OgievetskyN,BadgerT.
TopicmapsolutionsforKodakdigitalcameraaccessories.
[2009-07-30].
http://www.
idealliance.
org/papers/dx_xmle03/papers/020302/020302.
html#Extreme2000.
[6]PepperS.
TheTAOoftopicmaps.
[2009-06-30].
http://www.
ontopia.
net/topicmaps/materials/tao.
html#d0e140.
〔作者简介〕刘丹,女,1985年生,博士研究生,发表论文3篇.
叶继元,男,1955年生,教授,博士生导师,发表论文100余篇.
021
香港站群多ip服务器多少钱?想做好站群的SEO优化,最好给每个网站都分配一个独立IP,这样每个网站之间才不会受到影响。对做站群的站长来说,租用一家性价比高且提供多IP的香港多ip站群服务器很有必要。零途云推出的香港多ip站群云服务器多达256个IP,可以满足站群的优化需求,而且性价比非常高。那么,香港多ip站群云服务器价格多少钱一个月?选择什么样的香港多IP站群云服务器比较好呢?今天,小编带大家一...
georgedatacenter这次其实是两个促销,一是促销一款特价洛杉矶E3-1220 V5独服,性价比其实最高;另外还促销三款特价vps,georgedatacenter是一家成立于2019年的美国VPS商家,主营美国洛杉矶、芝加哥、达拉斯、新泽西、西雅图机房的VPS、邮件服务器和托管独立服务器业务。georgedatacenter的VPS采用KVM和VMware虚拟化,可以选择windows...
继阿里云服务商推出轻量服务器后,腾讯云这两年对于轻量服务器的推广力度还是比较大的。实际上对于我们大部分网友用户来说,轻量服务器对于我们网站和一般的业务来说是绝对够用的。反而有些时候轻量服务器的带宽比CVM云服务器够大,配置也够好,更有是价格也便宜,所以对于初期的网站业务来说轻量服务器是够用的。这几天UCLOUD优刻得香港服务器稳定性不佳,于是有网友也在考虑搬迁到腾讯云服务器商家,对于轻量服务器官方...
wordpress中文主题为你推荐
美国vps服务器美国VPS和美国服务器速度快吗电信主机租用电信服务器租用哪家有实力?虚拟主机代理哪家虚拟主机商的代理比较好免费网站空间申请需要一个免费的网站空间申请地址。网站空间免备案哪里能找到免费、免备案的空间?重庆网站空间重庆建网站的公司 我司准备建一个好点的网站,求推荐合肥虚拟主机虚拟主机哪里买好一些?合肥虚拟主机虚拟主机怎么弄!郑州虚拟主机什么是双线虚拟主机?淘宝虚拟主机我想在淘宝买虚拟主机不知道哪家好?想找长期合作稳定的
花生壳动态域名 国外vps 美国vps推荐 GGC 青果网 dux 我爱水煮鱼 日本bb瘦 老左来了 静态空间 免费吧 可外链相册 qq云端 hdd 支付宝扫码领红包 linux使用教程 优酷黄金会员账号共享 云营销系统 英国伦敦 德隆中文网 更多