GitHub - liyinchao/hadoop_study: 一起学习hadoop生态圈下常用大数据组件已有 Flink Kafka Hbase Scala Solr (项目包含hadoop思维导图印象笔记 Scala版本简单demo 工具类持续更新!!!)

hadoop

How Study

hadoop 导图笔记

hive

阅读官方文档
导图笔记
hive必会50道sql
hive在离线计算用的比较多,工作好找,有sql基础入门比较快

Scala

阅读官方文档
导图笔记
scala 工作中spark代码一般都是使用 Scala 实现优先学!

Flink

阅读官方文档
流计算利器,但是资料比较少,建议直接看官方文档我会将自己的翻译的文档不定期上传到Flink的目录下
Flink 阿里直播(每周四晚20:00-21:00))
QA

Spark

SparkStreaming

Spark Structured Streaming

HBase(phoenix)

文档笔记
见HBase目录,不定期更新

kafka

阅读官方文档
导图笔记
开源的消息队列,流计算架构一定要有的一个组件

Eleasticsearch

占坑,可以直接使用dbms+es实现几千万数据可视化展示汇总,底层跟solr一样,都是基于lucene

solr

阅读官方文档
导图笔记
全文检索 solr+kerberos验证(巨坑,文档稍后上传)

redis

kerberos

这个真恶心人机/机机
2019-5-5 更新 Fusioninsigh下的所有组件互通已经调试好

springboot

用空还是要学一下最近做了个springboot实现solr rest服务套的公司应用层模板

持续更新..

会不定期的将在工作中接触大数据组件时做的去敏测试代码上传到对应的文件夹下供初学者参考,少走弯路包括自己每天更新的大数据印象笔记更新的进度和规划在issues 中
由于精力有限今年计划重心是在实时计算上 flink 和 sparkStreaming spark结构化流公司不用有空再去搞
开更..

Name		Name	Last commit message	Last commit date
Latest commit History 323 Commits
Flink		Flink
HBase		HBase
IDEA		IDEA
Kafka		Kafka
Scala		Scala
Solr		Solr
Spark1.5		Spark1.5
SyncDemo		SyncDemo
hadoop思维导图		hadoop思维导图
README.md		README.md
大数据组件统计2018.png		大数据组件统计2018.png

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

hadoop

How Study

hadoop 导图笔记

hive

Scala

Flink

Spark

SparkStreaming

Spark Structured Streaming

HBase(phoenix)

kafka

Eleasticsearch

solr

redis

kerberos

springboot

持续更新..

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

hadoop

How Study

hadoop 导图笔记

hive

Scala

Flink

Spark

SparkStreaming

Spark Structured Streaming

HBase(phoenix)

kafka

Eleasticsearch

solr

redis

kerberos

springboot

持续更新..

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages