首页 > 在线阅读 > 详情
探索科技资源共享的大数据路径
《华东科技》     发布时间:2019-04-18 13:36:15.0    

科技资源大数据除了具有数据和大数据的特征外,还具有其自身的特性。当前社会经济的发展对科技资源共享提出了更多的现实需求,大数据为科技资源管理的内在发展、科技资源服务水平提升和科技资源共享的技术突破提供了技术支持。大数据在我国科技资源共享中能够发挥重要作用,可以通过完善科技资源大数据平台建设、加快科技资源的大数据管理、共享机制和评估机制等途径实现,同时还需通过与之相协调的政策保障来支撑,主要包括共享法规制度、共享新模式和试点工作等提供保障。

 

大数据的本质是解决问题的一种方法,基本含义是收集和整理社会各项数据,通过分析、预测、挖掘、处理,获取数据中更为全面、更深层次的有价值信息,进而解决传统数据技术无法解决的问题。大数据具有数据量规模性、数据生成及传播快速性、数据类型多样性、价值性等特点。科技资源大数据是指无法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。除具有一般数据的特征(客观性、分离性、长效性、不对称性、非排他性、可传递性、增值性)和大数据的特征(4V:Volume—体量浩大、Variety—模态繁多、Velocity—生成快速和Value—价值巨大但密度很低)外,科技资源大数据还具有高维(具有多重数据属性)、高度计算复杂性(大多为非线性复杂系统)和高度不确定性(具有一定的误差和不完备性)等特征。


科技资源共享领域应用大数据的现实需求

科技资源具有海量、分散、异构等特点,近30年来在科技计划支持下科技领域产生了大量科技成果和科技资源,并形成了较大规模的科技资源体系和从事科技资源服务的专业化人员队伍。基于科技资源领域所积累数据的应用需求也将更加强烈需要对科技资源领域的数据进行快速高效和准确的处理,从而满足基于大数据的科技资源管理要求。

未来国家层面的科技竞争力将部分体现为一国拥有科技资源的规模活性及解释和运用的能力,科技资源大数据将成为大国博弈的另一个领域,科技资源大数据领域的落后意味着国家安全将在数字空间出现漏洞。我国科技资源是无数科技工作者经过长时间积累形成的重要战略性、基础性资源,是国家总体科技实力和科技创新能力的重要体现,加强在科技资源领域的大数据技术研究和应用,不论对于促进科技资源领域发展,还是科技资源所涉及的相关产业调整和行业发展乃至国家战略和国家安全都至关重要。当前在科技资源领域,大数据技术水平尚无法满足社会的实际需求。这是一个国家综合实力的重要表现,对于技术的创新与研究能够推动社会需求结构的改变,而新的社会需求结构又对技术水平提出了更高层次的要求。在大数据时代的影响下,科技资源的数量大幅度上升,每种科技资源的来源、标准、形式都各不相同,要想对庞大的科技资源进行准确的收集、筛选和整合是非常困难的。目前,我国的科技资源管理技术水平无法满足社会的实际需求,对科技资源大数据管理的手段也比较落后,必须对这种传统的技术模式进行改造。

目前我国科技资源建设正处于转型阶段,科技资源领域的发展不仅要重视大规模数据的整合和共享,更应在此基础上提高资源共享和服务能力,即实现从一手抓资源建设,一手抓资源服务,向以服务带动资源建设、以服务促进技术创新、以服务提升支撑队伍能力转变。我国科技资源类型多、涉及面广,资源处理技术要求高,如何在复杂的资源数据基础上提炼业务流,加工成便捷高效的科技资源服务型产品,是较难处理且尚处在探索阶段的工作。以大数据技术的研究应用为切入点,实现对科技资源数据的快速高效和准确处理,从而满足基于科技信息数据的业务流程优化和决策要求,是科技资源领域不断提高科技资源质量和服务水平的重要路径。

随着大数据理念的推广应用,挖掘科技资源这类核心资产的核心价值,将科技信息资源转化为知识甚至智慧,是未来对于科技资源管理和服务的必然趋势。科技资源涵盖了我国经济社会发展的各个方面,跨学科、跨专业、跨领域业务需求越来越多,寻找科技资源之间关联性,挖掘科技资源价值,要较某些特定行业例如银行、电信等困难得多。挖掘科技资源关联价值以形成知识产品,不仅要对某一类科技资源进行垂直业务整合,还需对横向相关领域进行水平业务整合,这就需要采集和学习大量科技资源采集上使用的规律,形成普适性的分析经验,这对科技资源大数据相关技术要求非常高,因此以数据分析为核心,加强人工智能与机器学习等领域的理论研究和技术研发,加快非结构化数据处理、非关系型数据库管理和可视化技术等基础技术研发,推动与云计算、物联网、移动互联网等技术的融合都是科技资源技术领域急需突破的关键问题。


科技资源大数据共享与管理的路径

我国科技资源领域的数据积累和整合工作起步较晚,对大数据技术的理论研究和技术应用也比较薄弱,这为未来科技资源领域的发展提供了良好发展契机和广阔发展空间。当前国家科技基础条件平台和各地的科技平台已开展了非结构化数据资源保存挖掘和共享服务的共性技术研究,以及面向海量非结构化数据管理的软件产品研发工作,以期为科技资源管理部门与资源建设单位、资源服务机构提供资源加工处理服务,降低资源管理和应用单位的资源处理成本,进一步推动科技资源的共享利用,促进科技资源数据的传播和交流。

1.完善科技资源大数据共享服务平台构建

应先构建与完善科技资源大数据共享服务平台。一方面,应选用大型服务器,为数据存储、运算提供硬件设备支持。另一方面,应充分应用云计算技术,为数据处理、预测等各项工作提供技术支撑。其主要技术还包括:(1)科技资源大数据共享平台的架构主要基于开源分布式系统基础架构的Hadoop技术。(2)实现科技资源数据流的计算,流计算面对的是存贮在硬盘、内存或者其他地方的已存数据。(3)构建科技资源数据仓库。数据仓库是一个集成的、面向主题的、随时间变化、非易失的数据集合。数据仓库区别于数据库,数据仓库相当于一个环境,为用户提供用于决策支持的非结构化和半结构化的当前或历史数据即管理平台。(4)科技资源信息整合。信息整合包含三种方式,分别是数据整合、过程整合及内容整合。(5)科技资源大数据搜索引擎。大数据搜索引擎基于大数据库,将数据聚合并采取并行处理、供给用户并构建搜索引擎服务。(6)科技资源大数据可视化。主要是将收集、存储的海量数据信息通过图形化等数据视觉表现形式进行清晰、有效的信息传递,可视化分三层,分别是操作系统层﹑可视化软件工具开发层及行业性可视化软件应用层。

2.实现科技资源的大数据管理

首先,对于科技资源大数据管理机构来讲,应确保其专业性以及分工明确性,可参照图书馆大数据管理机构设置,构建国家级及地区级科技资源大数据管理结构,通过层级与职能划分,实现科技资源大数据共享的有序管理。这就需要数据部门完成数据生产、加工及存储,才能通过分析、挖掘、预测等一系列处理手段,实现资源价值的充分利用。所以,便需要根据大数据管理机构的指令提供统一标准的接口,提供数据访问通道,进而实现资源进一步共享。科技资源大数据共享管理系统是共享系统的关键系统。它可以方便管理者实现对共享资源的管理、共享关系的管理及共享行为的管理。同时还要做好与科技资源数据各部门的沟通与协同,要求其提供统一的数据接口来实现数据利用。另外,为了保证数据利用的规范性,避免侵害数据提供者的合法权益,应颁布实施对应政策,发挥约束作用。其次,由于不同部门之间的技术差异、利益分配等问题,会对科技资源共享造成阻碍,这是大数据管理与利用工作中的一大难题。所以,在科技资源大数据管理中,应加大对信息资源共享实现模式的研究力度,确保共享渠道的通畅性。

3.推进科技资源大数据式的共享共用

科学资源大数据能够为科技资源有效共享奠定良好基础,而大数据利用是科技资源管理的最终目的,也是科技资源共享价值的具体体现。从管理者层面来讲,数据分析与推广是科技资源大数据共享的具体体现,对科技资源大数据的共享共用分三步实现,包括提供数据、分析数据和推广数据。第一步,提供数据,便于不同用户结合自身实际情况获取所需数据。数据有效性是指数据能够满足用户需求,并且可以到达用户手中供其所用。这就要求在存储和管理数据时,建立完善的标准以及规范,对大数据进行清晰的划分,确定数据的格式,实现数据跨平台检索和利用。第二步,分析数据。管理机构的资源越丰富,越能扩大共享范围。数据管理机构需要通过分析,根据用户请求内容及主题,在数据库中确定、缩小与之相关的信息资源范围,再进行细化筛选,结合用户使用权限大小,向其提供对应的信息资源。第三步,开展数据推广工作。正如图书馆会定期推荐一些热门图书、新上架图书等,科技资源大数据共享平台也需要实时更新资源信息,确保其时效性。阻碍大数据环境下数据存储和共享的主要原因,是各个数据部门之间存在的技术壁垒,也可能是因为利益分配而有意为之的,数据因为壁垒的阻挡无法共享。大数据共享平台的建设和运行由政府主导,同时必须重视吸引社会资源以多种形式加入。通过逐步开放数据,可以率先在高层次人才等重要领域实现数据资源开放共享。

4.探索科技资源大数据的共享机制

(1)数据汇交机制。科技资源数据汇交属于自上而下的共享机制,主要的实施对象是国家支持的研究机构和科研项目产生和管理的科技资源。数据出版机制。(2)数据出版是指在互联网上积极公开科技资源数据,并且支持除数据提供者之外的研究人员或者组织机构下载、分析、再利用以及引用数据。(3)数据联盟机制。数据联盟机制是国际数据共享常用的机制,数据或平台中心之间通常遵循共同协商的原则或声明,利用统一的标准或接口,进行元数据或数据的互操作。(4)服务激励机制。对于共享数据,可以采用积分和在线计算服务等形式,激励和吸引科研人员个人或企业提供和使用数据。其中包括积分机制。科技服务人员提供数据时可以设置一定的使用积分,当其他用户共享该数据时,需要支付相应的积分给数据发布者。积分越多,可以共享的数据就越多。采用积分激励机制的成功案例,如百度文库和数据堂等。(5)在线计算服务机制。复杂环境保护数据处理和模拟分析往往需要在高性能计算环境下,通过专用的处理工具和模拟模型来实现。

5.利用大数据技术推进科技资源分布的均衡化

在大数据时代的影响下,人们获取科技资源的途径得到了扩张,对于科技资源的争夺也进入了一个新的层次,给国家安全、经济发展、人民生活都带来了一定的影响。大数据时代中的科技资源与自然资源、人力资源一样,都是国家建设、社会发展的重要战略资源,能够直观地体现出一个国家的综合实力。目前,一个国家在信息空间的数据主权将成为继海、陆、空之后与另一个国家博弈的空间。由此可见,科技资源在国家建设中的重要性日益显著。如果一个国家在科技资源争夺的过程中占据下风,就意味着国家安全出现了漏洞,给国家建设带来了诸多的安全隐患。通过大数据技术的应用,可以推动科技资源效益的进一步实现。大数据时代背景下的物联网技术,能够实现科技资源数据高效传递以及共享,西部科技资源缺乏的省份可以快速使用东部地区的科技资源,进一步实现科技资源分布的均衡化。

6.构建科技资源大数据评估体系与开放指数

对科技资源数据共享、开放的利用结果进行价值评估是持续推进大数据有效共享、开放的依据,是建立政府数据共享、开放长效管理机制的基础,是实现政府数据和社会数据融合的保障。价值评估从数据共享开放效果和共享开放指数两方面建立评估机制,通过效果评估,期望形成数据共享开放的良性互动的闭环。对共享开放的数据产生的政治、经济和社会价值三方面进行评估和度量。通过建立科技资源数据共享开放的价值评估机制,对科技资源数据共享、开放度进行有效评估是更科学合理地推动科技资源数据共享、开放的前提。建设科技资源大数据评估体系,由目标能力、现有能力、成熟度、能力提升等构成。通过评估先行,衡量目前的科技资源数据开放共享的程度,帮助顺利实施预期的大数据开放共享方案。同时,还要建立数据共享开放指数评估指标体系,构建指标体系中各指标的权重和指数计算规则,形成综合的共享开放指数。


政策建议

1.逐步完善国家层面的科技资源大数据管理

要想提升科技资源大数据管理的效果,必须加强国家在政策上的支持,利用国家宏观调控政策的改革与创新来提升对科技资源大数据的处理能力,最大限度地发挥出国家政策的重要作用,对于国家宏观调控能力的提升有很大的帮助。而且,还应该重新规划和布局国家的科技资源共享政策,通过完善大数据,对科技资源利用效率进行提升,进一步完善科技资源政策、规划、布局等方面的调整。建立科技资源大数据供给的组织保障体系,可在现有的科技基础条件平台体系的基础上,进一步协调各级地方政府科技资源数据的互联互通,打破各地方政府之间在科技资源数据共享方面的割裂状态。

2.加强科技资源大数据共享法律和相关规章制度的建设

建立健全法律法规体系,能够为大数据管理与利用提供法律保障,确保科技资源共享的规范性与合法性,所以必须加强大数据共享法治化建设。首先,应针对科技资源数据建设和保存作出法律规定,从科技资源数据建设角度出发,应统一数据格式、明确数据建设分工、提供建设资金;从数据保存角度出发,应确保数据的完整性和安全性,每个相关部门都应切实担负起自身责任,保护好各方数据和资源,加快科技资源的大数据共享。其次,对数据的规范使用作出法律规定,包括清楚地了解公开和传递数据的义务,划分数据有偿使用的标准,划分数据使用权限,在充分发挥数据共享利用价值的同时,确保数据的合法使用。最后,保护用户隐私,在法律规定中明确用户隐私数据区分标准,划分隐私度,并严厉惩处侵犯隐私的行为。还要完善相关规章制度的建设,对于大数据管理水平的提升也有很大的帮助。第一,不管是政府部门还是企业用户,都要严格按照信息管理相关制度的要求来进行大数据管理,为信息安全提供基本保障。第二,要加强人力资源管理制度的建设。

3.提倡信息资源共享的新模式

科技资源的开放共享已经成为大数据时代的一种潮流趋势,科技资源的开放共享效率越高,其社会价值和经济价值就越大。政府和大企业在大数据方面本来就具有先天的竞争优势,大数据资源能够给其带来丰厚的回报。要强力推进科技资源共享。只有高度的共享才能保证最大范围、最大程度的聚集资源,并使资源为全社会所用。一是持续推进科技资源大数据平台的建设和运行,涉及大量的技术、基础设施和人才等资源,需要统筹规划,加速推进科技资源共享,有效利用社会上的存量科技资源共同为平台发展提供资源和能力,同时也能够很好地规避重复建设和资源浪费。二是要加快推进大学和科研机构将其所掌握的丰富的数据向社会开放。三是要激励和引导企业开放科技资源数据,尤其是那些掌握了大量社会科技资源的高科技企业。

4.遴选科技资源平台开展大数据试点工作

抓住大数据时代的发展契机,既应高度重视大数据发展的战略意义,抢位发展,又要正视大数据发展所面临的巨大困难和挑战,确定科学现实的发展目标和任务内容,把握核心环节和关键领域。应坚持有所为有所不为和适时而动的科学态度,推进科技资源相关的大数据研究和联合攻关,建议重点选择部分已具有一定科技资源规模和技术开发实力的优秀科技资源,鼓励其参与国际共享,同时共同研发在大数据处理方面的应用技术和对接标准,建立有效机制推广相应的技术和服务产品,服务于国家重大科技需求以及全球科技创新中心建设。当前可以重点围绕高层次科技人才平台和大型科学仪器两个方面开展试点工作。

5.探索市场化运作机制,建立数据中心长效运行机制

在数据中心建设的初期,由政府通过政策引导、项目资助等方式,对承担资源数据整合、技术开发和公益服务的部分给予稳定支持。后期通过市场化运作机制,吸引社会投资,完善增值服务体系,逐渐形成自我造血功能。以数据汇聚、共享作为数据中心建设发展的核心价值,强化数据中心建设主体的公益服务功能,同时加强数据中心孵化培育“互联网+科技服务”的共享经济模式。此外,建立全面统筹存量资源,不搞重复建设,加强与现有高校、院所、企业、中介机构和电商平台的合作和协调,通过政策推动、技术驱动和市场调动,建立数据集成共享的数据标准和统一规范,形成连通各方、高效便捷的科技资源数据采集和应用的平台体系与网络。从政策、资源、人才等多角度共同推进数据中心建设,形成以科技创新资源数据中心为基础,“互联网+科技服务”为重点的科技研发服务产业集群,推动上海科技服务产业的发展。


未来大数据必定与科技资源更加融合

综上分析可知,随着大数据时代的到来,科技资源正成为一种大数据,科技资源大数据的管理作为一项全新的科技资源管理,正逐渐受到高度的重视。虽然现阶段社会制度的构建距离推动科技资源大数据共享管理的发展还存在一定的距离,科技资源大数据管理的发展空间还没有充分显示出来,但是我们已经开始看到,在未来大数据肯定会与科技资源更加融合。不断提升科技资源大数据管理的实时性与高效性,并逐渐建立完善的共享模式、平台结构、管理机制和市场化运作的探索,对于进一步提升科技资源的利用效率,加快科技创新驱动战略的实施,服务社会经济发展有着积极的意义。

 

(本文作者均为上海市研发公共服务平台管理中心工程师,研究方向为科技资源管理;本文原标题为《科技资源大数据共享的路径与对策分析》)


联系我们
欢迎洽谈内容、广告等各项合作业务
投稿邮箱:hdkj_sh@163.com
投稿热线:021-53080015
服务热线:021-53082351

2021年11月刊

电子刊物订阅渠道

请扫描上方二维码

上海《华东科技》杂志社有限公司 版权所有 沪ICP备12026464号-1 沪公网安备 31010402008474号 电子营业执照