大数据
概念
略。
大数据主要解决,海量数据的采集、存储和分析计算问题。
提点
1.大量(Volume):数据量大;
2.高速(Velocity):数据产生快,计算速度快;
3.多样(Variety):数据烈性多样,结构化和非结构化;
4.低价值密度(Value):海量数据里真正有价值的不多。
应用场景
抖音推荐,电商推荐,零售,物流,保险,人工智能+5G+物联网+虚拟与现实……
发展前景
好。人才紧缺。
大数据部门间业务流程
产品经理+程序员+前端。
大数据内部:还有好多。
大数据生态圈与Hadoop
Hadoop
Hadoop是什么
发展历史
三大发行版本
优势
1.高可靠性:不容易错,错了有备份;
2.高扩展性:任意临时加服务器;
3.高效性:并行计算;
4.高容错性:自动讲错了的任务重新分配。
==Hadoop组成==
Hadoop 1.X 组成
- Commin辅助工具
- HDFS 数据存储
- MapReduce 计算+资源调度
Hadoop 2.X 组成
- Commin辅助工具
- HDFS 数据存储
- Yarn 资源调度
- MapReduce 计算
Hadoop 3.X
Hadoop 3.X 在组成上没有变化。
HDFS架构
Hadoop Distributed FIle System 分布式文件系统。