以容量大、类型多、存取速度快、应用价排伯婷值高为主要特征的数据集皇达合,最早应用于IT行业,目前正快速发展为对数量巨大头这文要州下、来源分散、格式多样空灯左茶直的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一答五县静代信息技术和服务业态。大数据必须采用分布式架构,对海量数据进行分布式数据挖掘,因此必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。