关键词检索的得与失--甄繁就简学科馆员:吕俊生主要内容关键词及其特征关键词的规范处理关键词的检索关键词检索效率的影响因素参考文献一、关键词及其特征1、关键词及其构成原理关键词是那些出现在文献的标题(篇名、章节名)以致摘要、正文中,对描述文献主题内容具有实质意义的语词(可以作为检索"入口"的)(张琪玉,1997).
例如Wood一词出现在了题名、摘要及非控制词中:Title:Wood-polymercompositespreparedbytheinsitupolymerizationofmonomerswithinwoodAbstract:Wood-polymercomposites(WPCs)werepreparedfrompoplarwood(P.
ussuriensisKomarov)inatwo-stepprocedure.
Maleicanhydride(MAN)wasfirstdissolvedinacetoneandimpregnatedintowood;Uncontrolledterms:WoodcellwallWoodsubstrates有一文献,题名是《农用化学物质的利用与污染控制》,其中"农用"、"化学物质"、"污染控制"三个词可作为关键词;而"的"、"利用"、"与"在文中不起重要作用,属于次要词,不作为关键词;而"化学"、"物质"、"污染"和"控制"不宜拆分,因为这些词太"泛指"了,不能较准确地描述文献的意义.
;"与""利用"、"的"非关键词"农业""污染控制""化学物质"关键词"化学""污染""物质""控制"不宜拆分的词组:≠≠"化学物质""污染控制"一、关键词及其特征以《农用化学物质的利用与污染控制》为例:若干关键词的组合可以构成一条检索式,组合描述文献的关键内容,但每个关键词在检索系统中却都是彼此孤立的,在组合检索之前,它们没有任何关系.
"农业"+"化学物质"+"污染控制"数个关键词可组成一个检索式一、关键词及其特征二、关键词的规范处理1、关键词的确定与范围在数据库中,关键词不是逐个选定的,多数数据库也没有一个关键词词表.
相反,是用"排除法"来控制关键词的范围,这个方法就是建立一个"非关键词表":在用计算机自动选词的情况下,凡是"非关键词表"中未列的词,都可作为关键词.
哪些词被列入到"非关键词表"呢如,冠词、介词、连词、感叹词、代词、某些副词、某些形容词、某些名词(如"理论"、"报告"、"试验"、"学习"等)、某些动词(联系动词、情态动词、助动词).
"非关键词"表的收词数量可随各专业用词的情况及数据库构建的特定要求而定.
注:"非关键词"无法检索视不同数据库,有所不同.
二、关键词的规范处理INSPEC数据库规定,"非关键词"在"主题"和"标题"中检索无效.
二、关键词的规范处理2、关键词的规范关键词虽是直接利用自然语言的语词而不予规范的,但由于语词本身的复杂性,在实际操作中为了提高检索系统的检索效率,也要作一些规范化处理.
词和符号:β改写成beta;用"β"检索无效用"beta"检索才有结果二、关键词的规范处理如:EI数据库中提示出一些常见的缩写形式,告诉用户在检索时要兼顾全称和缩写:一些常用的缩写为:AcademyAcadAssociationAssocBureauBurCenter/reCentCollegeCollCompanyCoCorporationCorpDepartmentDepDivisionDivIncorporatedIncInstituteInstInstitutionInstInternationalIntLaboratoryLabLimitedLtdNationalNatlPublishedPubPublisherPubSchoolSchSocietySocUniversityUniv文章用全称标引时,用简称是无法检索到该文献;反之,亦然.
简称和全称二、关键词的规范处理三、关键词的检索1、随意性带来的方便与风险我们随意地想到一个词"wood",就可以检索到一定量的结果!
惊喜之时,可能落入"陷阱"!
三、关键词的检索当我们继续探究后,发现检索结果其实数量远不止于此!
三、关键词的检索我们用同义词"Pulpmaterials—Wood"检索到768条;用相关词"Lumber"检索到2536条;、、、、、、就是说,在当初的检索结果中,我们可能已经漏掉了许多相关的文献!
三、关键词的检索2、随意性带来的繁琐性词的全称与缩写:Uranium-238、Uranium238、U238、U-238、如果考虑不周,就会蒙受损失!
我必须复杂地考虑如何才能查得全找到同义词!
三、关键词的检索3、数据库简便直观的甄别功能在52864条检索结果中,与受控词"Wood"相关的记录有14562条三、关键词的检索4、从一个随意的"关键词"找到相关的控制词及分类"就简":从随意的检索词出发,就能获得可观的检索结果——轻松;"甄繁":从随意性到规范性;从模糊到清晰;从"大量"到"精量"——从容;三、关键词的检索5、"繁"与"简"的提示关键词检索是简捷的,但是,往往从直接的结果中难以找到理想的答案;数据库为我们构建了一个进一步筛选的通道,它为我们带来了方便!
在关键词检索中,还有数据库没有解决的"繁琐"问题,我们需要靠自己去甄别,付出得多,得到得亦多!
四、关键词检索效率的影响因素1、作为关键词载体的文本类型的影响文本作为关键词的载体可分为题名、小标题、章节名、摘要和正文等.
查准率考虑:由于题名最具有概括性,从针对文献整体的检准率来看,文献题名中的词最为有效,其次为小标题、章节名、摘要、正文.
查全率考虑:由于题名对文献整体描述的针对性与概括性的要求较高,文献中有意义的内容不可能被题名包揽无遗,造成查全率低.
当对查全率有较高的要求时,需要将检索扩展到摘要、正文.
digital-vm,这家注册在罗马尼亚的公司在国内应该有不少人比较熟悉了,主要提供VPS业务,最高10Gbps带宽,还不限制流量,而且还有日本、新加坡、美国洛杉矶、英国、西班牙、荷兰、挪威、丹麦这些可选数据中心。2020年,digital-vm新增了“独立服务器”业务,暂时只限“日本”、“新加坡”机房,最高也是支持10Gbps带宽... 官方网站:https://digital-vm.co...
青云互联怎么样?青云互联美国洛杉矶cn2GIA云服务器低至19元/月起;香港安畅cn2云服务器低至19元/月起;日本cn2云主机低至35元/月起!青云互联是一家成立于2020年的主机服务商,致力于为用户提供高性价比稳定快速的主机托管服务。青云互联本站之前已经更新过很多相关文章介绍了,青云互联的机房有香港和洛杉矶,都有CN2 GIA线路、洛杉矶带高防,商家承诺试用7天,打死全额退款点击进入:青云互联...
vollcloud怎么样?vollcloud LLC创立于2020年,是一家以互联网基础业务服务为主的 技术型企业,运营全球数据中心业务。VoLLcloud LLC针对新老用户推出全场年付产品7折促销优惠,共30个,机会难得,所有产品支持3日内无条件退款,同时提供产品免费体验。目前所有产品中,“镇店之宝”产品性价比高,适用大部分用户基础应用,卖的也是最好,同时,在这里感谢新老用户的支持和信任,我们...