大数据实训

发布时间:2022-06-27 发布网站:脚本宝典
脚本宝典收集整理的这篇文章主要介绍了大数据实训脚本宝典觉得挺不错的,现在分享给大家,也给大家做个参考。

Frist day

  • 工具
    • 架构
    • 数仓架构
    • Linux-简单使用部署

工具

vmware15 Linux centos7.5 HadhooP3.2.1 Hive3.1.2 SPRingBoot Echart zk3.4.5

架构

  1. 编码[内存]
  2. 磁盘(textfile XMl json)
  3. RDBMS(MySQL oracle)
  4. 分布式、集群 (noSQL
  5. Hadhoop

    大数据实训

数仓架构

离线:批计算——攒了一批数据、计算一次

  1. 数据来 (1)业务数据【RDBMS】 (2)行为数据【行为日志】 (3)爬虫数据【api】 (4)第三方交易【api】
  2. 数据采集 (1);mr (2)spark (3)flink 3.数仓搭建 (1)Hive 4.业务流程

    大数据实训

实时:流计算——来一次计算一次 1.数据来源 (1)业务数据【RDBMS】 (2)行为数据【行为日志】 (3)爬虫数据【api】 (4)第三方交易【api】 2.缓冲 (1)kafla 3.存储 (1)redis (2)hbase (3)sprakstreaming (4)flink (5)blink 4.分析 (1)olap分析引擎 (2)Kylin (3)clickhouse 5.展示 Springboot Echarts

Linux-简单使用部署

大数据实训

大数据实训

脚本宝典总结

以上是脚本宝典为你收集整理的大数据实训全部内容,希望文章能够帮你解决大数据实训所遇到的问题。

如果觉得脚本宝典网站内容还不错,欢迎将脚本宝典推荐好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。