Database/Redshift

Redshift COPY 명령어

BUST 2018. 5. 20. 21:19

Redshift COPY 명령어

S3에 있는 CSV, JSON 데이터를 이용하여 Redshift에 데이터를 올린후 데이터를 분석을 하고자 할때 COPY 명령어를 사용을 하면 된다.

활용 방법

- 엑셀에 저장이 되어 있는 데이터를 CSV 파일로 저장을 한뒤 Redshift로 테이블을 생성 및 데이터를 입력 받아 다른 데이터와 함께 데이터를 분석을 할수가 있다.

참고자료

- https://docs.aws.amazon.com/ko_kr/redshift/latest/dg/r_COPY.html

- https://docs.aws.amazon.com/ko_kr/redshift/latest/dg/copy-parameters-data-source-s3.html

필요한 데이터

- Table Name : 테이블 이름
- Data source : 데이터의 원천 주소
- Authorization : 인가, IAM Role

지원가능한 데이터 형태

- JSON
- CSV
- AVRO

자세한 내용은 데이터 형식 파리미터 문서 확인
https://docs.aws.amazon.com/ko_kr/redshift/latest/dg/copy-parameters-data-format.html#copy-data-format-parameters

테이블 생성

create table catdemo(catid smallint, catgroup varchar(10), catname varchar(10), catdesc varchar(50));

COPY 명령어를 이용하여 테이블에 데이터 입력

copy catdemo
from 's3://awssampledbuswest2/tickit/category_pipe.txt'
iam_role 'arn:aws:iam::<aws-account-id>:role/<role-name>'
region 'us-west-2';