在数据清理环节,当大量庞杂无序的数据采集之后,如何将有用的数据筛选出来,完成数据的清理工作,是随着大数据产业分工的不断细化而必不可少的环节。
在数据存储和管理环节,数据的存储、管理是数据处理的两个细分环节。这两个细分环节之间的关系极为密切,其中,数据管理的方式决定了数据的存储格式,而数据如何存储又限制了数据分析的深度和广度。由于数据存储和管理相关性极高,通常由一个厂商统筹设计这两个细分环节。目前,IBM(3)、Oracle(4)等老牌数据存储提供商具有明显的优势,他们在原有的存储业务上进行相应的深度拓展,从而占据了较大的市场份额。
在数据分析环节,传统的数据处理公司SAS(5)及SPSS(6)在数据分析方面有明显的优势;但同时,也不乏一些新的竞争对手涌现;在数据的显化及应用环节,大数据真正开始帮助管理实践。通过对数据的分析,将大数据能够推导出的结论量化计算,从而应用到行业中。