什么是大数据?

大数据的概念

关于大数据,很多机构给出的标准答案都不一样。
维基百科(Wikipedia)中,这样描述大数据:

大数据是规模庞大,结构复杂,难以通过现有商业工具和技术在可容忍的时间内获取、管理和处理的数据集。

研究机构Gartner给出了这样的定义:

“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。

国际商业机器公司(IBM)强调了大数据的“5V特性”,也就是:

数量(Volume)、多样性(Variety)、速度(Volocity)、真实性(Veracity)以及价值(Value)。

什么是大数据?

总的来说,无论各个机构如何看待大数据,归根结底,大数据真正的价值不在于庞大的数据信息本身,而在于通过分析处理从其中提炼出有价值的信息。这一点是所有企业家与大数据科学家的共识。

大数据的特征

大数据经过近几年来的发展,大数据的特征愈发清晰,大体分为以下几种:

数据量大(Volume)

这一点是大数据最明显的特征。数据的大小决定所考虑的数据的价值和潜在的信息。这一切就好像大浪淘金一样,数据量小那么其潜在的价值就小。

种类繁多(Variety)

种类繁多、复杂多变也是大数据的重要特性。从互联网诞生以来,每天新产生的数据都以指数级增长。这些数据不仅量大,而且种类繁多,结构复杂。其中结构化数据只占10%左右,剩下的都是繁杂的非结构化的数据。

速度快(Velocity)

速度快其实包含了两方面的含义。其一指的是产生新数据的速度快,二是要求处理现有的数据速度快。现如今爆发式增长的数据量产生了无限供应的大数据,如果没有快速的而处理分析能力,那么数据量再大,种类再高也无济于事。

价值密度低(Value)

爆发式增长的数据量保证了大数据能够挖掘高价值的基础。但往往事与愿违,数据呈指数增长的同时,隐藏在海量数据的有用信息却没有相应比例增长。价值密度的高低与数据总量的大小成反比,这一点确实让人灰心,如何通过强大的机器算法更迅速地完成数据的价值“提纯”也成为目前大数据背景下亟待解决的难题。

本站文章如无特殊说明,均为本站原创,如若转载,请注明出处:什么是大数据? - Python技术站

(0)
上一篇 2023年1月8日 下午6:03
下一篇 2022年11月14日 下午10:06

相关文章

  • 什么是数据清洗?

    数据清洗是指从原始数据中去除不合理、不完整、不准确和不一致等“脏数据”,并对数据进行处理和加工,以保证数据质量达到特定要求的一系列操作。数据清洗是数据预处理的一部分,是数据挖掘、机器学习等应用中的重要步骤,可以对数据进行有效的分析、建模和应用。 完成数据清洗的攻略可以如下: 数据识别:查看数据,识别数据中存在的问题。可以通过可视化工具、数值计量统计等方法确定…

    大数据 2023年4月19日
    00
  • 利用大数据做增长

    利用大数据实现增长,是一种针对数据所做出的最优决策,以及通过探索和整合数据发现新机会的过程。下面是利用大数据做增长的完整攻略,包含以下步骤: 1. 确定增长目标 首先需要明确需要实现的增长目标,例如增加转化率、提高用户留存率、增加收入等。 2. 收集数据 收集用户数据是大数据做增长的重要一步。我们可以使用各种工具来收集用户数据,例如Google Analyt…

    bigdata 2023年3月27日
    00
  • 2023年最热门的10大数据分析工具

    过去几年中得益于技术的发展,每分钟生成的数据量呈指数级增加,我们在网上所做的一切行为都会产生某类数据。 DOMO的报告系列“数据永不眠”统计了每分钟生成的数据量。在第八版报告中,它显示单独的互联网分钟在 Netflix 上有超过400,000小时的视频流,用户在 Youtube 上流式传输 500 小时的视频,以及通过 WhatsApp 共享的近 4200 …

    2023年2月7日
    00
  • 数据可视化中常用的工具有哪些?

    数据可视化是展现数据信息的一种方式,它可以更直观地呈现数据,并能够更快速地发现数据背后的规律和趋势。以下是数据可视化中常用的工具及其特点: Tableau Tableau是一款用户友好的数据可视化软件,可以帮助用户从各种不同的数据源中创建交互式的可视化图表。其主要特点包括: 可视化维度:支持整理和查看不同维度的数据,包括文本、数字、日期等数据类型。 交互式:…

    大数据 2023年4月19日
    00
  • 大数据教程:关于大数据您需要知道的一切!

    无论您是不是业内人士,对于大数据这个词一定不陌生。在过去的 4 到 5 年里,每个人都在谈论大数据。但是您真的知道大数据到底是什么吗?它如何影响我们的生活?大量企业寻找具有大数据技能的专业人士的目的是什么?在本大数据教程中,将带您全面了解大数据。 大数据的来源 由于多种原因,近些年地球上的数据量呈指数级增长。各种来源和我们的日常活动会产生大量数据。随着互联网…

    2023年1月8日
    00
  • 数据挖掘和机器学习的区别

    数据挖掘与机器学习是两个密切相关的领域,它们都是从数据中提取有价值的信息和知识。尽管二者定义相似,但在实际应用中,二者却存在一些明显的不同之处。在下面的文章中,我们将详细介绍数据挖掘和机器学习的区别,并举例说明。 1. 定义 数据挖掘是基于大数据的自动化分析过程,它利用统计学和机器学习技术,从海量数据中获取有用信息,并将这些信息转化为易于理解的结构化形式,以…

    bigdata 2023年3月27日
    00
  • 大技术技术框架使用场景

    大型技术框架是为了简化大型应用程序开发而开发的一系列工具和库。它们大多集成了多种技术,使得开发人员可以更快速地构建和部署应用程序。以下是几个常用的大型技术框架及其使用场景的详细介绍: 1. Spring框架 Spring框架是Java语言最著名的技术框架之一。它由多个库组成,提供了众多特性,包括面向切面编程、依赖注入、Web应用程序开发、事务管理等等。 Sp…

    bigdata 2023年3月27日
    00
  • 人工智能的应用范围有哪些?

    人工智能(Artificial Intelligence, AI)是一门研究如何制造智能机器的学科,已经在许多领域得到广泛应用。下面详细讲解人工智能的应用范围。 一、语音识别 语音识别是人工智能应用的一个重要领域之一,其用途是把人类的语音转换为计算机可以识别的文本信息。语音识别技术已经在智能音箱、智能手机等设备中广泛应用,在未来,语音识别技术将进一步地应用到…

    大数据 2023年4月19日
    00

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

评论列表(1条)

合作推广
合作推广
分享本页
返回顶部