最近对大数据感兴趣,hadoop是不是过时了,应该深入学习spark

2024-12-25 18:50:41
推荐回答(1个)
回答1:

第一、数据量巨大。从TB级别,跃升到PB级别;
第二、数据类型繁多。包括网络fl志、视频、图片、地理位置信息等;
第三,价值密度低。商业价值高,以视频为例.在连续不间断的监控过程中,可能有用的数据仅仅只有一两秒;
第四、处理速度快。最后这一点也和传统的数据挖掘技术有着本质的不同。业界将其归纳为4V —— Volume、Variety、Value 和Velocity。