람다 아키텍처
- new data, batch layer와 speed layer로 데이터가 들어온다.
- batch layer, batch layer는 2가지가 존재를 한다. 데이터를 저장하는 저장소 (append-only, immutable)와 view를 위해 미리 처리된(pre-complete)로 구별이 된다.
- serving layer, low latency와 adhoc 쿼리에 대한 뷰를 제공을 한다.
- speed layer, 최근 데이터와 대한 high latency의 update를 제공을 한다.
- query, batch view, realtime view를 통해 결과를 얻을수가 있다.
Speed Components
- Apache Storm
- Apache Spark Streamming
- Apache Samaza
- Apache S4
- Spring XD
- AWS Kinesis
- Google Cloud Dataflow
Real-time view
- redis
- mysql
Serving Components
- HBase
- ElephantDB
- SploutSQL
- ElephantDB
- Druid
- S3
- HDFS
Batch view
- cassandra
- hbase
- hive
- presto
- AWS Athena
Batch Components
- Hadoop
- mapReduce
- Spark
- Hive
- Spark SQl
- Pig
- Spork
- Cascading/Scalding
- Cascalog
- Crunch/SCrunch
- Pangool
Reference
- http://lambda-architecture.net/
'아키텍처' 카테고리의 다른 글
CQRS (Command Query Read Segregation) (0) | 2018.08.20 |
---|---|
Index, Document를 분리하는 방법을 이용한 대용량 데이터 저장소 설계 (0) | 2018.08.18 |
Log 성격을 가진 데이터의 수집 / 분석 아키텍처 (0) | 2018.07.27 |