版权归原作者所有,如有侵权,请联系我们

[科普中国]-大数据知多少?

科普中国-绿色双碳
原创
聚焦绿色低碳技术理念 科普助力“双碳”目标实现
收藏

随着时代进步和科技发展,大数据逐步为人类创造出更多的价值。你知道大数据的概念是什么吗?它又有怎样的特点呢?

大数据又称巨量数据、海量数据,是由数量巨大、结构复杂、类型众多的数据构成的数据集合,基于云计算的数据处理与应用模式,通过数据的集成共享,交叉复用形成的智力资源和知识服务能力。也有相关机构对其有所定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。换言之,大数据就是在浩如烟海的信息中,利用数据分析的技术,对冗杂无序的数据进行分析和整理,并迅速筛选出有价值的信息。

2010年10月,麦肯锡在《大数据:创新竞争和提高生产率的下一个新领域》的研究报告里正式使用“大数据”一词,并最早提出“大数据”时代已经到来。简单地说,“大数据”即“海量数据”+复杂类型的数据,麦肯锡认为大数据就是指无法在一定时间内用传统数据库软件工具对其内容进行抓取、管理和处理的数据集合。大数据有4个方面的典型特征:数据体量巨大、数据类型繁多、价值密度低、处理速度快。

大数据可以将数据分析和整合的结果应用于为企业提供决策支持,也可以将分析与建模的成果转化为具体的应用集成到业务流程中,为业务直接提供数据的支持。大数据的应用一般分为两类。一类是嵌入业务流程的数据辅助功能,如我们在网络购物时,经常会有“相关推荐”“猜你喜欢”等购物推荐,这就是通过数据分析与建模,分析我们的购物喜好,进行数据整合和筛选,最终得出推荐给我们的内容。另一类则是以数据为驱动的业务场景,如我们在出行前进行相关准备时,经常会在网络上对住宿,门票,车票等进行比价,这就是在采集各电商网站报价的基础上,利用大数据对同一产品进行识别和排序,从而得到最优方案。

提到大数据的发展,我们不得不提到一个概念——大数据的生命周期。事实上,它指的是某个集合的大数据从产生和获取到销毁的过程。也就是企业在实际运用大数据的过程中,在大数据战略的基础上,定义大数据范围,确定大数据采集、存储、整合、呈现与使用、分析与应用、归档与销毁的流程,并根据数据和应用的状况,对该流程进行持续优化。

随着移动互联网、物联网、云计算技术的迅速发展,大数据技术也越来越受人们关注。

本作品为“科普中国-科学原理一点通”原创,转载时务请注明出处。

内容资源由项目单位提供