新闻资讯  快讯  焦点  财经  政策  社会
互 联 网   电商  金融  数据  计算  技巧
生活百科  科技  职场  健康  法律  汽车
手机百科  知识  软件  修理  测评  微信
软件技术  应用  系统  图像  视频  经验
硬件技术  知识  技术  测评  选购  维修
网络技术  硬件  软件  设置  安全  技术
程序开发  语言  移动  数据  开源  百科
安全防护  资讯  黑客  木马  病毒  移动
站长技术  搜索  SEO  推广  媒体  移动
财经百科  股票  知识  理财  财务  金融
教育考试  育儿  小学  高考  考研  留学
您当前的位置:首页 > 互联网百科 > 大数据

每天都说大数据,构成大数据的4V你知道是什么吗?

时间:2019-08-05 13:11:35  来源:  作者:

过去的十年,我们经常听说的是互联网时代,而我们现在更经常听到的是大数据时代。大数据这个词,听起来高大上。但到底什么是大数据呢,优就业专业讲师给大家详细解读一番。

大数据首先是一个非常大的数据集,可以达到TB(万亿字节)甚至ZB(十万亿亿字节)。这里面的数据可能既有结构化的数据,也有半结构化和非结构化的数据,而且来自于不同的数据源。

结构化的数据是什么呢?对于接触过关系型数据库的小伙伴来说,应该一点都不陌生。对了,就是我们关系型数据库中的一张表,每行都具有相同的属性。如下面的一张表:
 

每天都说大数据,构成大数据的4V你知道是什么吗?

 

每行数据都有相同的属性,这就是结构化的数据。

我们再来看半结构化数据。XML或JSON格式的数据就是我们所常见的半结构的数据。如,下面所示的XML数据:

<book>

<name>大数据时代</name>

<author>赵牟</author>

<price>¥60.5</price>

</book>

子标签的次序和个数不一定完全一致。

那什么又是非结构化数据呢?这类数据没有预定义完整的数据结构,在我们日常工作生活中可能更多接触的就是这类数据,比如,图片、图像、音频、视频、办公文档等等。

知道了这三类结构的数据,我们再来看看大数据的数据源有哪些呢?归纳起来大致有五种数据源。

一是社交媒体平台,如有名气的Facebook、Twitter、YouTube和Instagram等。媒体是最受欢迎的大数据来源之一,因为它提供了关于消费者偏好和变化趋势的宝贵依据。并且因为媒体是自我传播的,可以跨越所有的物理和人口障碍,因此它是企业深入了解目标受众、得出模式和结论、增强决策能力的最快方式。

二是云平台,公有的、私有的和第三方的云平台。如今,越来越多的企业将数据转移到云上,超越了传统的数据源。云存储支持结构化和非结构化数据,并为业务提供实时信息和随需应变的依据。云计算的主要特性是灵活性和可伸缩性。由于大数据可以通过网络和服务器在公共或私有云上存储和获取,因此云是一种高效、经济的数据源。

三是Web资源。公共网络构成了广泛且易于访问的大数据,个人和公司都可以从网上或“互联网”上获得数据。此外,国内的大型购物网站淘宝、京东、阿里巴巴,更是云集了海量的用户数据。

四是IoT(Internet of Things)物联网数据源。物联网目前正处于迅猛发展势头。有了物联网,我们不仅可以从电脑和智能手机获取数据,还可以从医疗设备、车辆流程、视频游戏、仪表、相机、家用电器等方面获取数据。这些都构成了大数据宝贵的数据来源。

五是来自于数据库的数据源。现今的企业都喜欢融合使用传统和现代数据库来获取相关的大数据。这些数据都是企业驱动业务利润的宝贵资源。常见的数据库有MS Access、DB2、Oracle、MySQL以及大数据的数据库Hbase、MongoDB等。

我们再来总结一下,什么样的数据就属于大数据呢?通常来大数据有4个特点,这就是业内人士常说的4V,volume容量、 variety多样性、velocity速度和veracity准确性。



Tags:大数据   点击:()  评论:()
声明:本站部分内容来自互联网,内容观点仅代表作者本人,如有任何版权侵犯请与我们联系,我们将立即删除。
▌相关评论
发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表
▌相关推荐
二者区别Hive:Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能。 Hive本身不存储和计算数据,它完全依赖于HDFS和MapR...【详细内容】
2019-12-26   大数据  点击:(1)  评论:(0)  加入收藏
22%美国坦普尔大学研究人员发现,30岁~49岁研究对象中,常使用社交媒体的人感到“精神接近崩溃”的概率比其他人高22%。遭遇中年危机的人会对生活感到惶恐,并且爱思考人生意义和...【详细内容】
2019-12-24   大数据  点击:(3)  评论:(0)  加入收藏
一、大数据分析的五个基本方面1、可视化分析大数据分析的使用者有大数据分析专家,同时还有普通用户,但是他们二者对于大数据分析最基本的要求就是可视化分析,因为可视化分析能...【详细内容】
2019-11-06   大数据  点击:(3)  评论:(0)  加入收藏
玩转大数据首先要明确自己将要学习的方向,没有人能一下子吃透大数据里面所有的东西。在大数据的世界里面主要有三个学习方向,大数据开发师、大数据运维师、大数据架构师。哪个...【详细内容】
2019-12-12   大数据  点击:(8)  评论:(0)  加入收藏
1. Spark是什么?Spark,是一种通用的大数据计算框架,正如传统大数据技术Hadoop的MapReduce、Hive引擎,以及Storm流式实时计算引擎等。Spark包含了大数据领域常见的各种计算框架:比...【详细内容】
2019-12-11   大数据  点击:(10)  评论:(0)  加入收藏
人们在面对非结构性的数据时,常常是没有控制权的,能做的就是接收它们。像是文本数据、视频数据、音频数据等等都是这样。图像是独立像素用特定的方式组合起来的,只不过组合的方...【详细内容】
2019-12-03   大数据  点击:(21)  评论:(0)  加入收藏
flume hdfs 大数据 数据采集以下是关于一个agent的exec-hdfs.properties采集配置文件 # 定义这个agent中各组件的名字a1.sources = r1a1.sinks = k1a1.channels = c1#【Sou...【详细内容】
2019-12-02   大数据  点击:(28)  评论:(0)  加入收藏
Hadoop向用户提供了三种能力:分布式文件系统HDFS、分布式计算模式MapReduce和资源调度框架YARN。由于Hadoop的影响力较大,在大数据圈里一直把“应用 on YARN”作为一个门槛条...【详细内容】
2019-12-02   大数据  点击:(21)  评论:(0)  加入收藏
流量时代下,越来越多的人涌现到“新媒体”这个巨大的流量池;它不仅是个人观念的表达,也是群体的集合,可以说,新媒体是最大的社群运营体系,做新媒体,内容运营是王道,但除了内容运营外...【详细内容】
2019-12-02   大数据  点击:(20)  评论:(0)  加入收藏
什么是大数据?大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海...【详细内容】
2019-11-28   大数据  点击:(23)  评论:(0)  加入收藏
市场上有许多可用的框架。其中一些更受欢迎,例如Spark,Hadoop,Hive和Storm。Presto在效用指数上得分很高,而Flink具有巨大的潜力。另外还有一些需要提及的其他内容,例如Samza,Impa...【详细内容】
2019-11-27   大数据  点击:(18)  评论:(0)  加入收藏
来源|活动盒子-APP活动运营工具(huodonghezi.com)互联网寒冬之下,流量红利逐渐消失,获客成本水涨船高,遍地是流量的时代一去不返。如何才能突出重围,实现用户和收入增长?这个过...【详细内容】
2019-09-24   大数据  点击:(8)  评论:(0)  加入收藏
任何完整的大数据平台,一般包括以下的几个过程: 数据采集 数据存储 数据处理 数据展现(可视化,报表和监控) 其中,数据采集是所有数据系统必不可少的,随着大数据越来越被重视,数据采...【详细内容】
2019-11-18   大数据  点击:(36)  评论:(0)  加入收藏
国际权威的学术组织the IEEE International Conference on Data Mining (ICDM) 评选出了数据挖掘领域的十大经典算法:C4.5, k-Means, SVM, Apriori, EM, PageRank, AdaBoost,...【详细内容】
2019-11-14   大数据  点击:(17)  评论:(0)  加入收藏
数据分析工作虽然隐藏在业务系统背后,但是具有非常重要的作用,数据分析的结果对决策、业务发展有着举足轻重的作用。随着大数据技术的发展,数据挖掘、数据探索等专有名词曝光度...【详细内容】
2019-11-01   大数据  点击:(24)  评论:(0)  加入收藏
“看的懂的叫套路,看不懂的叫谋略”,顶尖高手,把它们叫谋略,研究它们,使用它们;普通的人,把它们叫套路,讨厌它们,排斥它们。亲爱的读者你好,阅读本文前请点击上方关注我,及时获取最新的...【详细内容】
2019-10-22   大数据  点击:(22)  评论:(0)  加入收藏
Python有个处理大数据的库,结合xlrd库,在做一些大数据的处理统计工作的时候很好用,譬如做性能测试,你的结果数据如何统计,python有个库pandas,这个就很擅长做这个工作,这里就讲2个p...【详细内容】
2019-10-16   大数据  点击:(30)  评论:(0)  加入收藏
典型互联网大数据平台架构首先我们来看一个典型的互联网大数据平台的架构,如下图所示: 在这张架构图中,大数据平台里面向用户的在线业务处理组件用褐色标示出来,这部分是属于互...【详细内容】
2019-10-10   大数据  点击:(147)  评论:(0)  加入收藏
大数据背景对于业务数据数据量的暴增,用户智能化需求提升。在这个DT的时代,大数据的开发也就应运而生了,大数据开发必须解决两个问题,大数据量如何统一存储,大数据量如何统一计算...【详细内容】
2019-10-08   大数据  点击:(39)  评论:(0)  加入收藏
2019年“十一”黄金周结束,电商、旅行、电影等消费领域全面呈现向好趋势。商务部最新数据显示,今年“十一”黄金周,购物、餐饮等传统消费亮点纷呈,旅游、文化、体育等新兴消费蓬...【详细内容】
2019-10-08   大数据  点击:(22)  评论:(0)  加入收藏
最新更新
栏目热门
栏目头条