빅데이터 처리/Spark

Spark SQL join, group by and functions

BUST 2019. 1. 8. 20:51

Spark SQL Join

Dataset<Row> people = spark.read().parquet("...");

Dataset<Row> department = spark.read().parquet("...");

people.filter(people.col("age").gt(30))

.join(department, people.col("deptId").equalTo(department.col("id")))

.groupBy(department.col("name"), people.col("gender"))

.agg(avg(people.col("salary")), max(people.col("age")));

https://spark.apache.org/docs/2.4.0/api/java/org/apache/spark/sql/functions.html

Spark SQL - Join 방식 (0)	2019.01.09
Spark 간단하게 하나의 파일로 Write하는 법 (1)	2019.01.07
Spark AWS S3 접근시 400 에러 처리 방법 (0)	2019.01.07
Spark SQL, DataFrames, Datasets (0)	2019.01.05
Spark Word Count Example (0)	2017.08.07

인호의 IT 잡동사니

Request, Spring Framwork, Prototype, Session, Bean Scope, singleton, Di, IOC, Spring Framework,