关键词检索的得与失--甄繁就简学科馆员:吕俊生主要内容关键词及其特征关键词的规范处理关键词的检索关键词检索效率的影响因素参考文献一、关键词及其特征1、关键词及其构成原理关键词是那些出现在文献的标题(篇名、章节名)以致摘要、正文中,对描述文献主题内容具有实质意义的语词(可以作为检索"入口"的)(张琪玉,1997).
例如Wood一词出现在了题名、摘要及非控制词中:Title:Wood-polymercompositespreparedbytheinsitupolymerizationofmonomerswithinwoodAbstract:Wood-polymercomposites(WPCs)werepreparedfrompoplarwood(P.
ussuriensisKomarov)inatwo-stepprocedure.
Maleicanhydride(MAN)wasfirstdissolvedinacetoneandimpregnatedintowood;Uncontrolledterms:WoodcellwallWoodsubstrates有一文献,题名是《农用化学物质的利用与污染控制》,其中"农用"、"化学物质"、"污染控制"三个词可作为关键词;而"的"、"利用"、"与"在文中不起重要作用,属于次要词,不作为关键词;而"化学"、"物质"、"污染"和"控制"不宜拆分,因为这些词太"泛指"了,不能较准确地描述文献的意义.
;"与""利用"、"的"非关键词"农业""污染控制""化学物质"关键词"化学""污染""物质""控制"不宜拆分的词组:≠≠"化学物质""污染控制"一、关键词及其特征以《农用化学物质的利用与污染控制》为例:若干关键词的组合可以构成一条检索式,组合描述文献的关键内容,但每个关键词在检索系统中却都是彼此孤立的,在组合检索之前,它们没有任何关系.
"农业"+"化学物质"+"污染控制"数个关键词可组成一个检索式一、关键词及其特征二、关键词的规范处理1、关键词的确定与范围在数据库中,关键词不是逐个选定的,多数数据库也没有一个关键词词表.
相反,是用"排除法"来控制关键词的范围,这个方法就是建立一个"非关键词表":在用计算机自动选词的情况下,凡是"非关键词表"中未列的词,都可作为关键词.
哪些词被列入到"非关键词表"呢如,冠词、介词、连词、感叹词、代词、某些副词、某些形容词、某些名词(如"理论"、"报告"、"试验"、"学习"等)、某些动词(联系动词、情态动词、助动词).
"非关键词"表的收词数量可随各专业用词的情况及数据库构建的特定要求而定.
注:"非关键词"无法检索视不同数据库,有所不同.
二、关键词的规范处理INSPEC数据库规定,"非关键词"在"主题"和"标题"中检索无效.
二、关键词的规范处理2、关键词的规范关键词虽是直接利用自然语言的语词而不予规范的,但由于语词本身的复杂性,在实际操作中为了提高检索系统的检索效率,也要作一些规范化处理.
词和符号:β改写成beta;用"β"检索无效用"beta"检索才有结果二、关键词的规范处理如:EI数据库中提示出一些常见的缩写形式,告诉用户在检索时要兼顾全称和缩写:一些常用的缩写为:AcademyAcadAssociationAssocBureauBurCenter/reCentCollegeCollCompanyCoCorporationCorpDepartmentDepDivisionDivIncorporatedIncInstituteInstInstitutionInstInternationalIntLaboratoryLabLimitedLtdNationalNatlPublishedPubPublisherPubSchoolSchSocietySocUniversityUniv文章用全称标引时,用简称是无法检索到该文献;反之,亦然.
简称和全称二、关键词的规范处理三、关键词的检索1、随意性带来的方便与风险我们随意地想到一个词"wood",就可以检索到一定量的结果!
惊喜之时,可能落入"陷阱"!
三、关键词的检索当我们继续探究后,发现检索结果其实数量远不止于此!
三、关键词的检索我们用同义词"Pulpmaterials—Wood"检索到768条;用相关词"Lumber"检索到2536条;、、、、、、就是说,在当初的检索结果中,我们可能已经漏掉了许多相关的文献!
三、关键词的检索2、随意性带来的繁琐性词的全称与缩写:Uranium-238、Uranium238、U238、U-238、如果考虑不周,就会蒙受损失!
我必须复杂地考虑如何才能查得全找到同义词!
三、关键词的检索3、数据库简便直观的甄别功能在52864条检索结果中,与受控词"Wood"相关的记录有14562条三、关键词的检索4、从一个随意的"关键词"找到相关的控制词及分类"就简":从随意的检索词出发,就能获得可观的检索结果——轻松;"甄繁":从随意性到规范性;从模糊到清晰;从"大量"到"精量"——从容;三、关键词的检索5、"繁"与"简"的提示关键词检索是简捷的,但是,往往从直接的结果中难以找到理想的答案;数据库为我们构建了一个进一步筛选的通道,它为我们带来了方便!
在关键词检索中,还有数据库没有解决的"繁琐"问题,我们需要靠自己去甄别,付出得多,得到得亦多!
四、关键词检索效率的影响因素1、作为关键词载体的文本类型的影响文本作为关键词的载体可分为题名、小标题、章节名、摘要和正文等.
查准率考虑:由于题名最具有概括性,从针对文献整体的检准率来看,文献题名中的词最为有效,其次为小标题、章节名、摘要、正文.
查全率考虑:由于题名对文献整体描述的针对性与概括性的要求较高,文献中有意义的内容不可能被题名包揽无遗,造成查全率低.
当对查全率有较高的要求时,需要将检索扩展到摘要、正文.
BGP.TO目前针对日本和新加坡服务器进行促销,其中日本东京服务器6.5折,而新加坡服务器7.5折起。这是一家专门的独立服务器租售网站,提供包括中国香港、日本、新加坡和洛杉矶的服务器租用业务,基本上都是自有硬件、IP资源等,国内优化直连线路,机器自动化部署上架,并提供产品的基本管理功能(自助开关机重启重装等)。新加坡服务器 $93.75/月CPU:E3-1230v3内存:16GB硬盘:480GB ...
官方网站:点击访问王小玉网络官网活动方案:买美国云服务器就选MF.0220.CN 实力 强 强 强!!!杭州王小玉网络 旗下 魔方资源池 “我亏本你引流活动 ” mf.0220.CNCPU型号内存硬盘美国CERA机房 E5 2696v2 2核心8G30G总硬盘1个独立IP19.9元/月 续费同价mf.0220.CN 购买湖北100G防御 E5 2690v2 4核心4G...
华纳云怎么样?华纳云是香港老牌的IDC服务商,成立于2015年,主要提供中国香港/美国节点的服务器及网络安全产品、比如,香港服务器、香港云服务器、香港高防服务器、香港高防IP、美国云服务器、机柜出租以及云虚拟主机等。以极速 BGP 冗余网络、CN2 GIA 回国专线以及多年技能经验,帮助全球数十万家企业实现业务转型攀升。华纳云针对618返场活动,华纳云推出一系列热销产品活动,香港云服务器低至3折,...