0%

Hadoop-相关知识

大数据

概念

略。
大数据主要解决,海量数据的采集存储分析计算问题。

提点

1.大量(Volume):数据量大;
2.高速(Velocity):数据产生快,计算速度快;
3.多样(Variety):数据烈性多样,结构化和非结构化;
4.低价值密度(Value):海量数据里真正有价值的不多。

应用场景

抖音推荐,电商推荐,零售,物流,保险,人工智能+5G+物联网+虚拟与现实……

发展前景

好。人才紧缺。

大数据部门间业务流程

产品经理+程序员+前端。
大数据内部:还有好多。

大数据生态圈与Hadoop

Hadoop

Hadoop是什么

发展历史

三大发行版本

优势

1.高可靠性:不容易错,错了有备份;
2.高扩展性:任意临时加服务器;
3.高效性:并行计算;
4.高容错性:自动讲错了的任务重新分配。

==Hadoop组成==

Hadoop 1.X 组成
  • Commin辅助工具
  • HDFS 数据存储
  • MapReduce 计算+资源调度
    Hadoop 2.X 组成
  • Commin辅助工具
  • HDFS 数据存储
  • Yarn 资源调度
  • MapReduce 计算
    Hadoop 3.X
    Hadoop 3.X 在组成上没有变化。
    Hadoop不同版本呢组成

HDFS架构

Hadoop Distributed FIle System 分布式文件系统。

Yarn

MapReduce

HDFS/Yarn/Mapduce三者来联系