新疆畜牧科技信息资源库信息采集与保存规范研究

更新时间:2024-11-07 11:20:41 阅读: 评论:0


2022年8月6日发
(作者:中国刑侦大案)

新疆畜牧科技信息资源库信息采集与保存规范研究

王琼;陈新文;温希军;李天斗;合斯菜提;王田田;龙伊

【摘要】新疆畜牧科技信息资源库主要依托新疆畜牧科技信息网络服务平台构建,

旨在通过提高信息资源挖掘和规范管理水平,完善和充实网络服务平台内容.本研究

针对该信息资源库的特点,说明了前期数据库结构和后台环境设计中对信息采集与

保存方式的考虑,系统阐述了信息采集与保存规范的主要内容.信息采集与保存规范

的建立,将对该资源库及相关网络平台稳定发展具有重要作用.

【期刊名称】《农业网络信息》

【年(卷),期】2013(000)003

【总页数】3页(P49-51)

【关键词】新疆;畜牧;信息采集;规范

【作者】王琼;陈新文;温希军;李天斗;合斯菜提;王田田;龙伊

【作者单位】新疆畜牧科学院信息研究所,新疆乌鲁木齐830000;新疆畜牧科学院

信息研究所,新疆乌鲁木齐830000;新疆畜牧科学院信息研究所,新疆乌鲁木齐

830000;新疆畜牧科学院信息研究所,新疆乌鲁木齐830000;新疆畜牧科学院信息

研究所,新疆乌鲁木齐830000;新疆畜牧科学院信息研究所,新疆乌鲁木齐830000;

新疆畜牧科学院信息研究所,新疆乌鲁木齐830000

【正文语种】中文

【中图分类】TP315

规范、标准的信息采集和保存是网络信息平台正常运行的关键,也是网络信息资源

有效利用的基础。新疆畜牧科技信息资源库主要依托新疆金牧网、新疆畜牧科学院

网、新疆肉牛网、草原牧养网等十余个新疆畜牧科技信息网络服务平台搭建。建库

的目的是在充分挖掘新疆乃至全国畜牧行业科技、生产技术和人力资源等信息基础

上,形成具有区域特,可供多个网站共享的新疆畜牧业专业资源数据库,以进一

步推动新疆畜牧科技信息服务方式创新和服务体系健全,平衡目前畜牧业信息的供

需矛盾,促进畜牧科技成果转化,最大化地为畜牧业发展服务。围绕这个目的并依

据信息存贮和应用方式实际需求,研究、建立科学、合理的信息采集与保存规范,

将对该资源库及相关网络平台稳定发展有重要作用。

1信息采集与保存规范的重要性

网络信息采集是将非结构化的信息从大量的网页中抽取出来保存到结构化的数据库

中的过程。在信息采集过程中,为了保障信息的可靠性、共享性、及时性,标准和

规范的制订是非常必要的,合理的标准和规范能够保障信息的可利用率,以使数据

库得到最大资源拥有。其重要性主要体现在以下几点。

(1)共享性。新疆畜牧科技信息资源库拥有多个资源数据库。只有前期制定一套

合理有效的信息采集与保存规范,并对不同资源库信息采集、加工标准尽量保持一

致,才有可能实现各个库之间的资源共享性。

(2)及时性。针对不同资源数据库的信息来源特性,制定不同的信息采集时间标

准,保证资源库数据的及时有效性。

(3)安全性。明确信息采集员、审核员的分工职责,制定一套可行的信息采集流

程,保证资源库的安全性,做到及时发现、及时跟踪、及时纠正。

(4)规范性。针对文本、报表、图片、视频等不同信息制定不同的标准规范,保

障整体资源库页面的统一规范性。

信息采集与保存规范是整个新疆畜牧科技信息资源库运行畅通的基础,信息采集与

保存规范的建立是实现资源库中信息的及时性、安全性以及规范性,最终达到体系

的信息共享性的保障。

2信息采集与保存规范的前期基础

2.1资源数据库结构的统一

新疆畜牧科技信息资源库主要包括疫病防治、养殖技术、食品安全、专家库、视频

库、成果库、远程教育库等十几个数据库。为保证信息资源的最大利用率,避免冗

余,同时减轻信息员的数据维护量,在数据库搭建初期就考虑将元数据应用框架尽

量统一规范,同时保证数据元的一致性,最终达到信息在整个站体系中的共享性。

其中数据信息共享方式主要有三种:①通过后台直接对某一条或多条记录的复制,

将信息直接粘贴至所需要的数据库内;②通过后台进行数据库之间的引用关系设置,

可将不同站点中的数据库之间进行互相引用设置,使数据库之间形成某种关联关系;

当被引用的数据库信息增加时,引用的数据库同时增加了该条信息,在后台设置中

可以选择是否需要管理员审核,需要时则需经后台管理员审核,不需要时则直接引

用至该数据库中;③当被引用信息修改时,引用资源库中的对应信息也随之修改,

保证了信息的准确性。其关系图如附图所示。

2.2资源数据库后台环境的统一

由于不同的环境背景所造成的数据源(关系数据库、面向对象数据库、XML等)异

构问题已经成为信息共享的主要障碍。新疆畜牧科技信息资源库后台统一采用博达

VSB9网站管理平台,和SQLServer2005数据库,保障了数据库的环境统一,

为新疆畜牧科技信息资源库中的信息共享提供了环境支持。

3信息采集与保存规范的内容

3.1信息采集规范的主要内容

信息采集应遵循五个原则,即保证信息的可靠性、完整性、实时性、准确性和易用

性。遵循以上原则,信息采集规范的内容主要包括以下几点:

(1)信息采集途径。信息采集途径主要分两个渠道:①畜牧业信息网站相关信息;

②信息采集员采集的畜牧业科技、生产等原创信息。针对网络上已经公开的信息,

仅需信息员和管理员审核即可上传,但是对于原创信息,则需经过审核员以及上级

主管领导同时审核通过才可以上传,以保证信息的准确性以及安全性。

(2)信息采集周期。针对不同的资源库,要制定不同的采集周期,才能满足用户

对信息的及时性的需求。

(3)信息采集类别。网络信息存在多种分类,主要包括文本、报表、图片和视频,

针对不同分类又存在不同的文件格式,为了保证信息的格式的统一性,需针对每一

类文件类型都要制定出规范的格式样式,以保证整体资源库的统一展示及应用效果。

(4)信息采集要求。信息采集需要注意以下四点:①合法性,遵守党和国家的各

项方针政策和法律法规,遵守信息安全规范要求;②准确性,信息内容真实可靠;

③时效性,提高信息采集效率,缩短编辑时间,及时发布;④适用性,把握信息服

务于畜牧业的宗旨,增强信息采集的针对性。

附图新疆畜牧科技信息资源库之间引用关系例图

(5)信息审核。信息审核是对信息管理地最后一关,也是最为重要的一步,不能

流于形式。信息审核规范要从信息安全、畜牧行业专业,以及审核人员的专业知识

能力等方面来制定,最终才能确保信息的安全性、准确性及可用性。

(6)信息员和审核人员。因新疆畜牧科技信息资源库属于专业知识资源数据库,

其中大部分的数据库都围绕着畜牧业科技与生产,所以信息来源必须由具有一定的

畜牧业知识的信息员负责,有一定专业知识的管理员进行审核。

3.2信息保存规范的主要内容

网络信息资源保存(WebArchiving,简称WA)所解决的问题就是如何来选择、

采集、标引、保存和访问生命短暂的网络信息。网络资源是一类比较特殊的数字资

源,因此WA属于数字资源长期保存范畴。通过对数字资源的长期保存以确保那

些具有长久价值的数字信息可以被永久访问和持续利用的过程。

新疆畜牧科技信息资源库根据数据按数据的重要性来制定不同的信息保存规范要求。

新疆畜牧科技信息资源库信息分为以下三类:

(1)关键数据。主要包括:应用程序代码(源代码、可执行代码);系统的数据

库结构;系统的数据库原始数据;系统密钥;系统开工数据(如各种运行配置信息

等)。该数据是整个新疆畜牧科技信息资源库能否正常运行使用的关键,所以其保

存要求定为最高,需要多份备份的同时还需由两人同时管理。备份应采用离线方式,

均存储在不易损坏的介质(光盘、硬盘)当中,并对介质半年进行检查,如有损坏,

应立即更换。数据还原应由部门主管负责批准才可进行操作。

(2)重要数据。主要包括系统的数据库增量数据;用户身份鉴别相关数据(帐号、

口令等);系统参数(IP、端口等配置参数)。此类数据的损坏虽不会影响到整个

资源库的运行但会使资源库的部分数据丢失,以及造成资源库使用的不方便。所以

重要数据的备份与保存也是极其重要的。一般应采用定时自动在线备份方式,但需

由专人进行管理,并及时清除重复备份部分,避免大量备份数据占用服务空间,影

响资源库正常运行。数据应备份两份,一份在服务器,一份在不易损坏的介质中。

(3)一般数据。操作系统与平台的日志及其它。此类数据主要方便管理员对整个

资源库上的管理。该数据的损坏并不会直接影响到资源数据库的正常运行。但为查

方便也应定期进行在线备份。

对于保存的数据需进行档案化管理,按时间分类,并建有管理档案,记录每次备份

及还原时期、事由,以保证数据的准确性,避免发生数据丢失等严重事故。

4结束语

随着数字化信息技术的不断进步,一方面带来了数字化信息技术利用方式的不断变

革,另一方面也给网络信息资源的采集、保存带来了挑战。网络信息标准的多样性

使得网络信息资源没有一个统一的标准可以使用。因此,人们在利用不同标准保存

网络信息资源的时候必须要进行必要的转换,才能保证所保存的网络信息资源可以

得到长期的存取。新疆畜牧科技信息资源库数据库涉及面广、内容多,后期延续的

信息采集和保存是一个长期和繁琐的过程。制定出一个易操作,又符合新疆畜牧科

技信息资源库要求的信息采集与保存规范,是该资源库建设的一个重要组成部分,

也是保证该资源库稳定发展的关键。

参考文献

[1]曲云鹏,王志庚,李春明,周晨,李成文.网络信息采集与保存标准规范研究[J].数字图

书馆论坛,2009,(7):22-27.

[2]吴胜兵,刘爱喜.基于领域知识的数据库模式匹配技术研究[D].硕士学位论文,哈尔

滨工程大学,2009,(3).

[3]龙宇翔.数字化校园中信息采集标准的建立与规划[J].中国校外教

育,2009,(12):353.


本文发布于:2022-08-06 17:01:43,感谢您对本站的认可!

本文链接:http://www.wtabcd.cn/falv/fa/78/59742.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

留言与评论(共有 0 条评论)
   
验证码:
推荐文章
排行榜
Copyright ©2019-2022 Comsenz Inc.Powered by © 站长QQ:55-9-10-26