方数据库的介绍与检索
作者:。。。
摘要:本文详细介绍了万方数据库的特点和内容,同时还介绍了在计算机上检索万方数据库中的文献
的方法和技巧,另外还给出了一些计算机检索的技巧和建议。
关键词:万方数据库;检索方法;技巧;建议
引言
20世纪80年代以来,电子期刊数据库在我国发展迅速。经过近30年的建设,基本形
成了CKI、万方、维普三大综合型数据库(也称“三大数据库”)三足鼎立,其他各类小
型数据库百花齐放的格局。随着社会的发展,数据库的价值逐渐被社会认识并形成独立的数
据库产业,与此同时,对数据库的检索效率也有更高要求,其中万方数据库深受广大师生青
睐。本文通过分析万方数据库检索平台的特点,对其进行总结并提出相应的参考建议,使用
户更好地了解这个数据库的检索平台,从而在能提高用户的使用效率的同时,使数据库的资
源能更好地发挥作用,更好地满足用户的需求,服务用户。
一、万方数据库的介绍
简介
万方数据库是由中国科技信息所暨万方数据公司所属万方数据库中心专业组开发的一
综合性数据库。1988年以来,该中心已相继推出了四大类13个系列的科技和工商类数据库,
总记录达600万条以上。涵盖期刊、会议纪要、论文、学术成果、学术会议论文的大型网
络数据库;也是和中国知网齐名的中国专业的学术数据库。其开发公司——万方数据股份有
限公司是国内第一家以信息服务为核心的股份制高新技术企业,是在互联网领域,集信息资
源产品、信息增值服务和信息处理方案为一体的综合信息服务商。
万方期刊:集纳了理、工、农、医、人文五大类70多个类目共7600种科技类期刊全文。
万方会议论文:《中国学术会议论文全文数据库》是国内唯一的学术会议文献全文数据库,
主要收录1998年以来国家级学会、协会、研究会组织召开的全国性学术会议论文,数据范
围覆盖自然科学、工程技术、农林、医学等领域,是了解国内学术动态必不可少的帮手。《中
国企业、公司及产品数据库》的信息全年100%更新,提供多种形式的载体和版本。
[1]
版本
《中国学术会议论文全文数据库》分为两个版本:中文版、英文版。“英文版”主要收
录在中国召开的国际会议的论文,论文内容多为西文。
内容
万方科技信息数据库包含内容:
成果专利:内容为国内的科技成果、专利技术以及国家级科技计划项目。
中外标准:内容为国家技术监督局、建设部情报所提供的中国国家标准、建设标准、建
材标准、行业标准、国际标准、国际电工标准、欧洲标准以及美、英、德、法国国家标准和
日本工业标准等。
科技文献:包括会议文献、专业文献、综合文献和英文文献,涵盖面广,具有较高的权
威性。
机构:包括我国著名科研机构、高等院校、信息机构的信息。
台湾系列:内容为台湾地区的科技、经济、法规等相关信息。
万方学位论文:万方学位论文库(中国学位论文全文数据库),是万方数据股份有限公司
受中国科技信息研究所(简称中信)委托加工的“中国学位论文文摘数据库”,该数据库收
录我国各学科领域的学位论文。我馆已经签约购买300万篇学位论文全文,目前已经完成
近210万篇本地镜像全文数据的安装。
万方商务信息数据库:《中国企业、公司及产品数据库》始建于1988年,由万方数据
联合国内近百家信息机构共同开发。十几年来,CECDB历经不断的更新和扩充,现已收录
96个行业的近20万家企业详尽信息,是国内外工商界了解中国市场的一条捷径。目前,
CECDB的用户已经遍及北美、西欧、东南亚等50多个国家与地区,主要客户类型包括:
公司企业、信息机构、驻华商社、大学图书馆等。国际著名的美国DIALOG联机系统更将
CECDB定为中国首选的经济信息数据库,而收进其系统向全球数百万用户提供联机检索服
务。
特
(1)多元化发展,产品具有类型优势。万方的产品类型优势很明显,中外专利、中外
标准、科技成果、新方志、法律法规、机构、科技名人等都是其重要的延伸产品,种类繁多。
这种将信息资源进行分类,单独成库的做法符合未来数据库专业化发展方向,方便查阅和分
类订购,节省用户搜索时间和购买费用。目前,万方的数据库类型还在进一步扩充,相信未
来将会有更丰富、更系统的资源提供给用户。
(2)自有特数据库。万方自建的方志、科技视频、中国医学会期刊等数据库特非
常明显,这是其他数据库公司基本没有涉猎的,因此有一定的竞争力。
(3)服务企业的商务信息数据库。与其他数据库比起来,万方一个很明显的特就是
有众多的服务企业的数据产品,如商务信息数据库,包括《中国企业、公司和产品数据库》、
《国家新产品数据库》、《百万商务通讯》、《中国高新技术企业》、《建材企业库》、《香
港公司企业库》、《东南亚公司企业库》、《南韩公司企业库》、《综合经贸信息库》等。
这也是万方最早提供的产品服务之一。未来,万方如果能保持这种服务企业的能力和意识,
相信可以成为其区别CKI等数据库的最大特点,竞争不同的目标客户,形成差异化优势。
二、万方数据库的检索方法
万方数据库有Dos和windows两种检索界面,新的windows版本是基于windows操作系
统的视窗检索软件,与以前的Dos版本相比,在功能上有较大的改进,是一个较好的功能较强
大的检索系统。
万方数据库的数据覆盖面广、涉及的学科专业多,是一个较为全面的系列数据库。其检
索系统的基本配置为386或以上的各类兼容机,4M以上的内存。对于CD光盘用户而言,硬盘
空间要求在30M以上,一个3寸软驱,4倍速及以上的CD一ROM驱动器Dos3.30及以上版
本,各类汉字系统如Ucdos、天汇、联想等,如要运行Windows版本,则需windows3.12或
Windows95系统。万方数据库每年将更新数据1一2次,且扩充率在30%以上;其检索软件提
供了多人口组合检索,查询速度快,输出方式灵活,主要有以下3种检索途径。
1、浏览格式检索从指定的记录号开始顺序显示每一条记录,在信息检索菜单(S一检索)
中选择B-浏览文件,系统提示:
如果您直接按回车键,则从第一个记录顺序浏览,否则,从您输入的记录号开始顺序浏览。
例如您输人18(回车),即从第18个记录顺序浏览主文件。
2、专项信息检索在信息检索菜单(S一检索)中选择T便进人数据库的专项信息检索菜
单(以中国科学技术成果数据库为例):¹在整个检索词典中选词检索。所谓词典检索,就是从词
库中选择检索词进行检索,词库是按拼音顺序排列的,例如,键人“科技”,系统将给出所有从“科
技”开头的条目供选择检索。º检索湖南医科大学各二级机构和附属医院所取得的成果数量,
按“成果持有者所在单位”进行检索,输人“C=湖南医$($表示右截词检索)”,检出湖南医科
从哪一个记录(MF)开始浏览
大学成果54项。»检索中科院院士姚开泰教授的成果,选择“成果持有者姓名”进行检索,输
人“B=姚开泰”,检出“姚开泰”教授成果3项。¼可根据分类号检索。如输人“G=R730.2”,
检出血管肿瘤方面成果3篇。
3、自由检索用户直接编写检索式,对数据库进行检索。数据库不同,可供检索字段亦不
同。词与词之间可用布尔逻辑符“*”(和)“十”(与)、“八”(非)以及“$”(截词符)和“()”
(括号)进行组配。
举例:¹检索营养与食品或热量的成果。输人营养二(热量+食品),命中记录5篇。º检索糖
尿病的诊断与,输人糖尿病*(诊断十)命中记录6篇。[2]
三、万方《中国学位论文全文数据库-镜像版》检索平台的检索方法
1、检索平台的主要特点
万方《中国学位论文全文数据库-镜像版》(以下简称CDDBFT)检索平台是万方数据资
源镜像系统,为签约用户在Internet上或本地局域网上提供万方数据资源系统的全部或部分
本地化快速服务。万方数据资源镜像系统的检索方法科学先进,检索界面友好,具有人性化
特点,提供的检索途径和检索模式灵活多样、可以满足专业检索人员和普通用户的需求。
2、检索方法
2.1、个性化组合检索
个性化组合检索是CDDBFT提供的主要检索方式,可以根据用户个性化需要任意组合检
索条件和检索入口的检索方式,能够满足不同用户的特定检索需求。个性化组合检索集限制
检索、布尔检索、多条件组合检索于一体的同时,提供检索词匹配方式的选择。匹配方式用
于确定输入的检索词与数据库索引词的匹配关系。“模糊匹配”是指:无论词的位置怎样,只
要检索项中出现该词即可;即只要一记录的指定字段中含有此检索词,便认为该记录符合检索
要求。如限定在“关键词”字段检索“基因组”、匹配方式为“模糊匹配”,则所有“关键
词”中含“基因组”一词的记录为检索命中记录,不论关键词是“基因组片段”还是“比较
基因组学”。如果匹配方式选择为“/精确匹配”,则只有“关键词”是“基因组”的记录为检
索命中记录,因为“精确匹配”要求字段值与检索词完全相同。如果匹配方式选择为“前方
一致匹配”,则只有“关键词”是以基因组开始的记录为命中记录。“前方一致匹配”是指:
整个字段取值的前半部分(从第一个字符开始)与检索词完全相同。因检索字段的性质不同,
并非所有可检索字段均支持“精确匹配”检索。CDD-BFT中支持“精确匹配”检索的字段
有:作者、作者专业、导师姓名、授予学位、授予单位、分类号、关键词。
个性化组合检索提供的限制检索有年代限制和论文范围限制。年代限制有两种选择:不
限制年代和按用户需要进行年代限定。论文范围限制提供三种选择:系统收录的全部论文、
博士论文和硕士论文,用户按照需要进行选择
2.2、关联检索
关联检索是利用聚类技术的一种检索方式,与同义词检索相似。系统提供的关联检索入
口并不在主检索界面上,而是在检索结果界面。具有关联检索功能的字段有:专业名称、导姓
名、授予单位、分类号、关键词。点击符合检索要求的记录的题名(学位论文名),系统显示本
条记录的书目信息,包括[论文题名]、[论文作者]、[作者专业]、[导师姓名]、[授予学位]、[授
予单位]、[授予时间]、[分类号]、[关键词]、[摘要]、[文摘语种]、[论文页数]和查看全文。
点击作者专业名称,可检索出数据库中收录的该专业的所有论文。点击导师姓名,可检索出数
据库中收录的该导师指导的所有论文。点击授予单位,可检索出数据库中收录的该授予单位
授予的所有论文。点击分类号,可检索数据库中收录的该类目的所有论文。点击关键词,可检
索出数据库中收录的/关键词0中有这个词的所有论文。
2.3、二次检索
一次检索后,很可能查到的信息过于稀少或冗杂,此时可进行二次检索。二次检索就是将
检索范围限定在一次检索结果的记录内,重新选择检索入口和检索词,进行又一次检索。二次
检索并非仅限进行两次,三次、四次乃至多次进行都无妨。二次检索须在前一次检索的检索
结果界面进行,有10种检索入口可供选择:论文题名、作者、作者专业、导师姓名、授予学位、
授予单位、授予年份、分类号、关键词、摘要。进行个性化组合检索、分类检索、关联检索、
浏览全库、高级检索后,都可根据需要进行二次检索。
2.4、分类检索
分类检索是以中图法类目体系为基础,将各级类目划分成6大类,即人文、理学、医药卫
生、农业科学、工业技术、交通运输航空航天和环境与安全科学。每一类又分成若干二级类,
点击二级类类名,系统显示的检索结果是此类目下的所有记录。
2.5、其他检索方法
高级检索是运用逻辑运算符、按照系统规定的语法编写检索表达式并直接输入检索表达
式的检索方法,是一种专业的检索方法。为便于用户了解数据库收录情况,系统在检索主界面
提供浏览全库功能。点击浏览全库按钮,检索结果显示的是数据库所收录的所有学位论文。
CDDBFT不仅在检索方法上有自身的特点,在显示检索结果方面,也有独到之处,即显示检结
果同时,显示其对应的检索表达式。检索表达式和检索结果同时显示,便于对照检索结果,调检
索表达式或选择二次检索字段进行二次检索。[3]
四、万方数据库检索技巧
1、掌握检索语言是提高检索效率的重要环节
中文数据库文献检索模型是“匹配”模型。由文献特征构成的文献检索标识被认为完全
反映了文献内容,而由提问特征构成的检索提问则反映了情报用户的需求,因此二者的匹配
程度就是文献的相关程度,我们通常所说的相关文献也就是在某种程度上检索提问与检索识
匹配的文献。
在实际工作中,图情工作者通过对所收集到的文献信息的分析,提取检索标识,编制检
索工具或检索系统,对原文进行储存。而用户在机检中,是依据自身的查目的,建立检索
提问,借助相应的检索工具或检索系统,对原文进行查。检索提问提问能否与相应的检索
标识相近是保证检索质量的重要环节。
但在实际计算机检索中,这二者不易匹配,分析其原因主要在于图书情报工作者在编制
中文数据库过程中,为使标引人员和检索者之间能准确地交流思想,取得共同的理解,运用
了特定的检索语言。这些约定俗成的符号系统———检索语言,由于与用户熟悉的自然语
言(任意词、自由词)存在差异,不易被用户所掌握,致使在实际检索中,中文全文数据库
中借助各类检索语言建立起来的检索标识很难被用户所接受。这就造成用户根据查目的而
形成的检索提问与相应文献的检索标识不易吻合的客观现象,而这种现象极易造成部分相关
文献(尤其是密切相关文献)在检索中的遗漏。因此,在实际检索中研究较为便捷、易于用
户掌握的检索技巧与方法,引导用户对中文数据库进行正确的使用,是普及计算机
检索知识的重要环节。
2、族性与特性交叉查方法的研究和应用
在中文全文数据库的检索过程中,我们通常使用主题和分类途径查文献。利用这两个
途径检索文献,关键是要明确表征课题内容特征的学科属性、分类等级以及获得相应的主题
词、分类号。主题途径具有直观、专指、方便等特点;按分类途径检索文献则便于从学科体
系的角度获得较为系统的文献线索。这两种检索方法虽各有优点,但均具有族性检索和特性
检索的功能,因此在实际检索中常常综合使用,交叉进行。
主题词的确定需要借助相应的词表,而分类号的确定也需要借助相应的类表,这对用户
来说无疑又会遇到障碍,但笔者发现用户在检索过程中,如果注意利用检索到的相关文献中
所包含的信息,不断优选检索词和分类号,也能达到提高文献查全率和查准率的目的。
2.1、通过分析研究课题确定检索词
用户在检索时,可根据研究目的、内容、方法、途径、用途、原料、产品名称等特征确
定相应的检索词。检索时既可选用主题词的同义词、相关词、上位词、下位词进行查;也
可选用相关分类号、上位类、下位类进行查;同时亦可采用主题词、分类号交叉使用的查
方法,使检索的系统性与检索的专指性相结合,以满足多主题课题和交叉边缘学科检索的
需要。
但在实际检索中不易一步到位,所以我们可通过设立试验检索的环节,从初步确定的检
索范围和检索词,以及对利用这些初步确定的检索范围和检索词所得到的检索结果的分析研
究中,逐步加深对研究问题的认识,不断从已检索到的文献中寻符合检索要求与检索范围
的检索词。
2.2、通过不断调整检索策略寻密切相关文献
在第二轮的计算机检索中,又可不断重复上述检索思路和方法,并通过对检索结果的分
析,根据检索目的进一步调整检索策略,依次类推,不断深入。
3、万方数据库的检索建议
先分析检索目标和检索词,用户需要知道如何在“检索结果中”进行二次检索、万方检
索的排序方式,万方的“高级检索”不同于清华同方和维普的“高级检索”,后两者的检索
项是可从下拉菜单中选择并可增加可减少,检索词间的逻辑关系(*、+、—)也可更改,而
万方数据库中的“高级检索”的检索项是$标题中包含“作者中包含、来自(期刊1会议名
称)、关键词中包含、摘要中包含、时间、被引次数、核心期刊、排序”,用户只需在“标
题中包含”中输入相关“检索词”就可检索出相关度较高的文献。万方的“经典检索”几乎
和清华同方、维普的“高级检索“相同,“专业检索”的使用方式与其他两个数据库几乎一
样,除了各个库各自的表达形式不同。
[4]
五、结语
万方数据库检索系统为我们提供了比较清晰的图型界面,易于理解,利用鼠标点击菜单即
可进行检索,操作灵活方便,数据库类别品种多,适用的行业广,检索人口较多。但它收录的年
限较短,没有规范化的主题词、副主题词、特征词等,使用起来存在一定的漏检率。打印、套
录也存在一些不足之处。除可直接打印全部检出的文献外,如需选择打印,每次打印最多只能
标记50条记录,并需要退出检索系统后利用Windows写字板调出记录才能打印;输出格式需
要通过编程、修改才能打印,用户使用起来较麻烦。但随着万方数据库的广泛使用,我们相信
有关部门将开发出更方便、快捷的途径,提供更详尽的全文数据库,为广大用户服务。[5]
参考文献
[1]葛驰,朱雷.对万方数据库的浅析[J].医学图书馆通讯.1998,7(4):24-26.
[2]葛驰.对万方数据库的浅析[J].医学图书馆通讯.1998,7(4):24-26.
[3]房.万方《中国学位论文全文数据库——镜像版》检索方法和技巧[J].图书馆工作与研究.
2007(03):72-75.
[4]中文全文数据库检索技巧_族性与特性交叉查方法的研究_滕颖[J].
[5]万方_清华同方_维普三个数据库检索平台的比较_王永敏[J].
校对报告
当前使用的样式是[华中科技大学学报.自然科学版]
当前文档包含的题录共6条
有0条题录存在必填字段内容缺失的问题
所有题录的数据正常
本文发布于:2022-08-02 13:33:20,感谢您对本站的认可!
本文链接:http://www.wtabcd.cn/falv/fa/78/51968.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |