一:什么是大数据
大数据本身指的是海量的数据
数据存储单位:bit Byte KB MB GB TB PB EB ZB YB BB NB DB
工作所说的大数据是解决海量数据的存储和海量数据的分析计算的一种处理模式
二:大数据特点
1:Volume(大量)
当前,典型个人计算机硬盘的容量为TB级别,而一些大企业的数据量已经接近EB量级
2:Velocity(高速)
在海量的数据面前,数据的效率就是企业的生命
3:Variety (多样)
类型的多样性让数据分为结构化数据和非结构数据。相对以往便于存储的数据库/文本为主的结构化数据,现在非结构化数据越来越多,包括网络日志、音频、视频、图片、
地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。
4:Value (低价值密度)
价值密度的高低与数据总量的大小成反比,如何快速对有价值数据提存成为目前大数据背景下待解决的难题。