关键词检索的得与失--甄繁就简学科馆员:吕俊生主要内容关键词及其特征关键词的规范处理关键词的检索关键词检索效率的影响因素参考文献一、关键词及其特征1、关键词及其构成原理关键词是那些出现在文献的标题(篇名、章节名)以致摘要、正文中,对描述文献主题内容具有实质意义的语词(可以作为检索"入口"的)(张琪玉,1997).
例如Wood一词出现在了题名、摘要及非控制词中:Title:Wood-polymercompositespreparedbytheinsitupolymerizationofmonomerswithinwoodAbstract:Wood-polymercomposites(WPCs)werepreparedfrompoplarwood(P.
ussuriensisKomarov)inatwo-stepprocedure.
Maleicanhydride(MAN)wasfirstdissolvedinacetoneandimpregnatedintowood;Uncontrolledterms:WoodcellwallWoodsubstrates有一文献,题名是《农用化学物质的利用与污染控制》,其中"农用"、"化学物质"、"污染控制"三个词可作为关键词;而"的"、"利用"、"与"在文中不起重要作用,属于次要词,不作为关键词;而"化学"、"物质"、"污染"和"控制"不宜拆分,因为这些词太"泛指"了,不能较准确地描述文献的意义.
;"与""利用"、"的"非关键词"农业""污染控制""化学物质"关键词"化学""污染""物质""控制"不宜拆分的词组:≠≠"化学物质""污染控制"一、关键词及其特征以《农用化学物质的利用与污染控制》为例:若干关键词的组合可以构成一条检索式,组合描述文献的关键内容,但每个关键词在检索系统中却都是彼此孤立的,在组合检索之前,它们没有任何关系.
"农业"+"化学物质"+"污染控制"数个关键词可组成一个检索式一、关键词及其特征二、关键词的规范处理1、关键词的确定与范围在数据库中,关键词不是逐个选定的,多数数据库也没有一个关键词词表.
相反,是用"排除法"来控制关键词的范围,这个方法就是建立一个"非关键词表":在用计算机自动选词的情况下,凡是"非关键词表"中未列的词,都可作为关键词.
哪些词被列入到"非关键词表"呢如,冠词、介词、连词、感叹词、代词、某些副词、某些形容词、某些名词(如"理论"、"报告"、"试验"、"学习"等)、某些动词(联系动词、情态动词、助动词).
"非关键词"表的收词数量可随各专业用词的情况及数据库构建的特定要求而定.
注:"非关键词"无法检索视不同数据库,有所不同.
二、关键词的规范处理INSPEC数据库规定,"非关键词"在"主题"和"标题"中检索无效.
二、关键词的规范处理2、关键词的规范关键词虽是直接利用自然语言的语词而不予规范的,但由于语词本身的复杂性,在实际操作中为了提高检索系统的检索效率,也要作一些规范化处理.
词和符号:β改写成beta;用"β"检索无效用"beta"检索才有结果二、关键词的规范处理如:EI数据库中提示出一些常见的缩写形式,告诉用户在检索时要兼顾全称和缩写:一些常用的缩写为:AcademyAcadAssociationAssocBureauBurCenter/reCentCollegeCollCompanyCoCorporationCorpDepartmentDepDivisionDivIncorporatedIncInstituteInstInstitutionInstInternationalIntLaboratoryLabLimitedLtdNationalNatlPublishedPubPublisherPubSchoolSchSocietySocUniversityUniv文章用全称标引时,用简称是无法检索到该文献;反之,亦然.
简称和全称二、关键词的规范处理三、关键词的检索1、随意性带来的方便与风险我们随意地想到一个词"wood",就可以检索到一定量的结果!
惊喜之时,可能落入"陷阱"!
三、关键词的检索当我们继续探究后,发现检索结果其实数量远不止于此!
三、关键词的检索我们用同义词"Pulpmaterials—Wood"检索到768条;用相关词"Lumber"检索到2536条;、、、、、、就是说,在当初的检索结果中,我们可能已经漏掉了许多相关的文献!
三、关键词的检索2、随意性带来的繁琐性词的全称与缩写:Uranium-238、Uranium238、U238、U-238、如果考虑不周,就会蒙受损失!
我必须复杂地考虑如何才能查得全找到同义词!
三、关键词的检索3、数据库简便直观的甄别功能在52864条检索结果中,与受控词"Wood"相关的记录有14562条三、关键词的检索4、从一个随意的"关键词"找到相关的控制词及分类"就简":从随意的检索词出发,就能获得可观的检索结果——轻松;"甄繁":从随意性到规范性;从模糊到清晰;从"大量"到"精量"——从容;三、关键词的检索5、"繁"与"简"的提示关键词检索是简捷的,但是,往往从直接的结果中难以找到理想的答案;数据库为我们构建了一个进一步筛选的通道,它为我们带来了方便!
在关键词检索中,还有数据库没有解决的"繁琐"问题,我们需要靠自己去甄别,付出得多,得到得亦多!
四、关键词检索效率的影响因素1、作为关键词载体的文本类型的影响文本作为关键词的载体可分为题名、小标题、章节名、摘要和正文等.
查准率考虑:由于题名最具有概括性,从针对文献整体的检准率来看,文献题名中的词最为有效,其次为小标题、章节名、摘要、正文.
查全率考虑:由于题名对文献整体描述的针对性与概括性的要求较高,文献中有意义的内容不可能被题名包揽无遗,造成查全率低.
当对查全率有较高的要求时,需要将检索扩展到摘要、正文.
A2Hosting主机,A2Hosting怎么样?A2Hosting是UK2集团下属公司,成立于2003年的老牌国外主机商,产品包括虚拟主机、VPS和独立服务器等,数据中心提供包括美国、新加坡softlayer和荷兰三个地区机房。A2Hosting在国外是一家非常大非常有名气的终合型主机商,拥有几百万的客户,非常值得信赖,国外主机论坛对它家的虚拟主机评价非常不错,当前,A2Hosting主机庆祝1...
Hostigger 主机商在前面的文章中也有介绍过几次,这个商家运营时间是有一些年份,只不过在我们圈内好像之前出现的次数不多。最近这段时间商家有提供不限流量的VPS主机,逐渐的慢慢被人认识到。在前面的介绍到他们提供的机房还是比较多的,比如土耳其、美国等。今天看到Hostigger 商家居然改动挺大的,原来蛮好的域名居然这次连带官方域名都更换掉去掉一个G(Hostiger )。估摸着这个域名也是之前...
imidc对日本独立服务器在搞特别促销,原价159美元的机器现在只需要88美元,而且给13个独立IPv4,30Mbps直连带宽,不限制流量。注意,本次促销只有一个链接,有2个不同的优惠码,你用不同的优惠码就对应着不同的配置,价格也不一样。88美元的机器,下单后默认不管就给512G SSD,要指定用HDD那就发工单,如果需要多加一个/28(13个)IPv4,每个月32美元...官方网站:https:...