AWS Athena
아테나는 S3의 데이터는 SQL로 간편하게 분석하기 위해 만들어진 서비스입니다. 그리고 아테나는 만들어진 이후로 계속 발전되어 이제 커넥터를 통해 여러 데이터 소스로에 SQL을 통해 쿼리를 시작할 수 있습니다. S3에서 아테나를 사용하기 위해서는 아래와 같은 순서를 거치면 됩니다.
- S3의 데이터를 아테나에 정의한다
- 스키마를 정의한다
이러한 순서로 작동하는 아테나는 AWS Glue 데이터 카탈로그와 연결되어 테이블이나 스키마를 관리할 수 있습니다.
아테나의 장점
아테나는 서버리스 서비스로 사용한 쿼리만큼 비용이 나갑니다. 여기서 복잡한 ETL과정 없이 SQL만으로 이러한 데이터들을 활용할 수 있습니다.
페이스북에서 개발한 데이터 쿼리 시스템은 Presto를 기반으로 제작되어 csv 등 다양한 데이터 포맷을 활용할 수 있습니다. 또한 대규모 조인, 구조체, 배열등 복잡한 쿼리 또한 처리할 수 있고. 아마존에서 내세우는 아주 빠른 성능이 있습니다.