什么是大数据?

大数据的概念

关于大数据,很多机构给出的标准答案都不一样。
维基百科(Wikipedia)中,这样描述大数据:

大数据是规模庞大,结构复杂,难以通过现有商业工具和技术在可容忍的时间内获取、管理和处理的数据集。

研究机构Gartner给出了这样的定义:

“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

国际商业机器公司(IBM)强调了大数据的“5V特性”,也就是:

数量(Volume)、多样性(Variety)、速度(Volocity)、真实性(Veracity)以及价值(Value)。

bigdata 5v

总的来说,无论各个机构如何看待大数据,归根结底,大数据真正的价值不在于庞大的数据信息本身,而在于通过分析处理从其中提炼出有价值的信息。这一点是所有企业家与大数据科学家的共识。

大数据的特征

大数据经过近几年来的发展,大数据的特征愈发清晰,大体分为以下几种:

数据量大(Volume)

这一点是大数据最明显的特征。数据的大小决定所考虑的数据的价值和潜在的信息。这一切就好像大浪淘金一样,数据量小那么其潜在的价值就小。

种类繁多(Variety)

种类繁多、复杂多变也是大数据的重要特性。从互联网诞生以来,每天新产生的数据都以指数级增长。这些数据不仅量大,而且种类繁多,结构复杂。其中结构化数据只占10%左右,剩下的都是繁杂的非结构化的数据。

速度快(Velocity)

速度快其实包含了两方面的含义。其一指的是产生新数据的速度快,二是要求处理现有的数据速度快。现如今爆发式增长的数据量产生了无限供应的大数据,如果没有快速的而处理分析能力,那么数据量再大,种类再高也无济于事。

价值密度低(Value)

爆发式增长的数据量保证了大数据能够挖掘高价值的基础。但往往事与愿违,数据呈指数增长的同时,隐藏在海量数据的有用信息却没有相应比例增长。价值密度的高低与数据总量的大小成反比,这一点确实让人灰心,如何通过强大的机器算法更迅速地完成数据的价值“提纯”也成为目前大数据背景下亟待解决的难题。

此文章发布者为:Python技术站作者[metahuber],转载请注明出处:https://pythonjishu.com/what-is-bigdata/

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023年 1月 8日 下午6:03
下一篇 2022年 11月 14日 下午10:06

相关推荐

  • 大数据教程:关于大数据您需要知道的一切!

    无论您是不是业内人士,对于大数据这个词一定不陌生。在过去的 4 到 5 年里,每个人都在谈论大数据。但是您真的知道大数据到底是什么吗?它如何影响我们的生活?大量企业寻找具有大数据技能的专业人士的目的是什么?在本大数据教程中,将带您全面了解大数据。 大数据的来源 由于多种原因,近些年地球上的数据量呈指数级增长。各种来源和我们的日常活动会产生大量数据。随着互联网…

    2023年 1月 8日
    00
  • 大数据分析是什么?——如何将理论转化为行动

    就像据说整个宇宙和我们的银河系是由于大爆炸形成的一样,同样,由于如此多的技术进步,数据也呈指数级增长,导致大数据爆炸。在此博客中,您将深入了解大数据分析及其应用。此数据来自各种来源,具有不同的格式,以可变速率生成,并且还可能包含不一致之处。因此,我们可以简单地将此类数据的爆炸称为大数据。 我将在本博客中解释以下主题,让您深入了解大数据分析: 为什么要进行大数…

    2023年 1月 8日
    00
  • 大数据技术都有哪些?

    大数据技术是什么? 大数据技术指的是一种结合了数据挖掘、数据存储、数据共享和数据可视化的应用软件,这个应用软件包括数据、数据框架,以及用于调查和转换数据的工具和技术。 现如今,大数据技术已与机器学习、深度学习、人工智能和物联网等大规模增强的其他技术紧密联系在一起。 大数据技术种类 大数据技术可以分为两大类: 1.运营大数据技术: 它表示每天互联网生成的大量数…

    2022年 11月 14日
    00
  • 什么是大数据?– 大数据初学者指南

    大数据无处不在!互联网上的d数据量数据量一直在飙升。福布斯报告称,用户平均每分钟观看415 万个 YouTube 视频,在 Twitter 上发送456,000 条推文,在 Instagram 上发布46,740 张照片,在 Facebook 上发布510,000 条评论和293,000 条状态! 大数据的演变 让我们首先深入了解为什么大数据技术变得如此重要…

    2023年 1月 7日
    00

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

评论列表(1条)