01300001151257132635178407015.jpg

如何保障科研工作的生命线

香山会议热议数字科技文献资源长期保存困境

科技日报 2016-11-05 作者:游雪晴

  前不久,国际著名情报数据提供商汤森路透公司宣布,将其知识产权业务和科学信息业务,包括中国学者熟知的 SCI(科学引用指数)和IF(影响因子),以 35.5 亿美元的价格出售给 Onex Corp 和霸菱亚洲投资。这两家都是商业投资公司,而不是与知识产权管理相关的公司。

  这一消息在中国科研领域引起不小反响。然而与大多数人关注这一变化对今后科研评价体系的影响不同,中科院文献情报中心的张晓林研究员更关注这笔大买卖,对科技文献资源长期保存和管理所带来的潜在影响和由此引发的风险。“数字科技文献的查询和保存不仅影响科研工作的评估,更是目前科研工作的生命线,其重要性不言而喻。”

  11月3—4日,50多位专家学者在第576次香山科学会议上,围绕“数字科技文献资源长期保存的前沿及重大问题”这个主题进行研讨。

  科研工作对数字文献资源高度依赖

  本次会议执行主席、中科院物理所研究员杨国桢指出,文献资源的数字化已成为科技领域以及许多人文社科研究学术信息的主流形态,是科研机构和研究型大学每天依赖的主流信息资源,也是国家科研、教育和创新体系不可或缺的战略物资。

  张晓林在主题报告中指出,由于技术发展和科研行为习惯的变化,学术文献记录本身已经发生了重大变化,除了文字,图片、音视频、数据库等等逐渐成为了数字文献资源的主体。在科研领域,以科研论文为代表的科研出版物从印本为主逐步发展到印本+电子版,直至以电子版为主。“目前社会再也回不到纸质书本时代了,已经对数字资源产生了高度依赖,这在科研领域尤甚。”

  多重风险威胁数字科技资源存留

  1992年毕业于档案保护专业的中国人民大学信息资源管理学院的钱毅老师告诉科技日报记者:“现在数字文献资源的管理和保存,所面临的问题可大大超过了纸质文献。由于存贮介质及保存格式更新换代非常快,很多不久前还在使用的资料已经无法读取了,比如那些保存在3英寸软盘、5英寸软盘上的资料。”

  杨国桢认为,与传统非数字载体的信息相比,数字信息面临更高的风险。一方面,随着信息技术飞速发展,换代升级快,相应的数字媒质、格式、软件或系统版本改变,导致了数字信息的不可用。另一方面,当前的数字文献资源的利用机制,基本上采用出版社网络数据库方式来远程提供服务,那么由于技术故障、自然灾害、经营失败、市场并购、战争冲突等,也让资料信息获取随时处于危险之中。

  大科学数据的保存有特殊需求

  对于科研来说,还有一类特殊的数字文献资源需要长期保存,这就是科学数据。

  科学数据不仅包括原始实验/观测数据、相关的元数据以及衍生的数据产品等,还包括相关的源代码、文档、模型、算法及研究结果等。科学数据已成为科学发现和科技创新的新型战略资源。

  中科院计算机网络信息中心的黎建辉研究员认为,随着越来越多的大科学装置的建设和重大科学实验的开展,以及无所不在的科学传感器和传感器网络广泛应用于天空、陆地和海洋,对自然环境进行全方位的探测、监测,源源不断产生的科学数据在体量、变化的速度与复杂性等方面均快速发展,比较典型的有高能物理大数据、生物基因检测大数据、天文观测大数据、气候变化监测大数据等等,其中很多还是图像数据,这些科学数据的长期保存面临着一系列新的问题与挑战。

  建立国家级数字文献资源保存体系时不我待

  中科院规划局黄晨光发言称,之前对数字文献资源长期保存这个问题认识不足,以为找几个大机器存储就可以了,参加会议之后才发现这是一个系统工程问题,涉及文献的定义、保存时长的规定、相关格式规范、相应法律安排,多元资源投入等等。他认为应该提升到我国科技安全的高度来重视这个问题,需要政府主导,整体考虑,顶层设计。“而且这个问题随着时间的推移,将会越来越紧迫,时不我待啊!”

  与会专家认为,由于数字文献资源的战略重要性和数字文献资源长期保存的复杂性,需要在国家层面有整体部署,统筹考虑技术条件、权益管理、运行机制和可持续保障等问题,加快数字文献资源长期保存体系的建设,尽快、尽多、高效、可靠和可持续地实现重要科技文献资源中国本土长期保存。为保障科研生命线的安全稳定打下坚实基础。

  (科技日报北京11月4日电)

责任编辑:lijia

科普中国APP 科普中国微信 科普中国微博
科技日报
是中国科协为深入推进科普信息化建设而塑造的全新品牌,旨在以科普内容建设为重点,充分依托现有的传播渠道和平台,使科普信息化建设与传统科普深度融合,以公众关注度作为项目精准评估的标准,提升国家科普公共服务水平。

猜你喜欢