클라우드

[SeSac] AWS DataZone 실습 - 1. DataZone 관리페이지 열기 / 도메인 생성

dusqo7951 2024. 10. 28. 17:40

실습 목적

Amazon DataZone을 사용하여 조직 경계를 넘어 데이터를 공유, 검색 및 발견하는 방법을 경험하고,

Amazon DataZone를 사용하여 보다 안전하게 대ㅔ이터를 공유하는방법 과

비지니스 컨텍스트에서 데이터 카탈로그를 검색하고 활용하는 방법을 이해하는것이 목적이다.

사용되는 AWS 서비스

  • Amazon DataZone
  • AWS Glue
  • Amazon Athena
  • Amazon Simple Storage Service(S3)
  • AWS Lake Formation

진행순서

Amazone DataZone 도메인과 데이터포털 생성 > 생산자 프로젝트 생성 > 프로젝트 환경생성 > DataZone 에서 게시할 데이터 생성 > 메타데이터 설정 > Amazone DataZone 에서 데이터 게시 > 소비자 프로젝트 생성 > 게시된 데이터 자산을 소비자로 구독 > 게시한데이터에 대한 생산자가 소비자 엑세스 승인 > 데이터 생산자가 게시한 데이터 세트를 데이터 소비자가 Amazon Athena에서 분석

1. DataZone 관리 페이지 열기 / 도메인 생성

1-2. 도메인 생성 마법사에서 도메인 생성(예상 사용자:DataZone 관리자)

빠른설정

- 모든사용자가 데이터를 사용하고 게시할 수 있도록 해당 계정을 설정하여 더 빠르게 DataZone 구성을 시작 할 수 있는 기능.

- 활성화시 데이터 레이크 및데이터 웨어하우스 청사진이 활성화되며, 데이터 레이크 및 데이터웨어하우스 기본 청사진을 위한 프로필을 생성.

- AWS Glue 및 Amazon Redshift 리소스에 대한 액세스를 프로비저닝, 수집 및 관리하기 위한 IAM 역할들을 생성하고, 새로운 S3 버킷을 생성하며, Administrative DataZone 프로젝트 생성

살짝 시간이 걸린다.

* 도메인 생성(예상 사용자: DataZone 관리자)

  • 상태가 생성중에서 사용가능으로 바뀌면 도메인 생성이 완료된것
  • 데이터포털열기전에 밑에 청사진 확인하여 DataLake편집 후 데이터 포털을 연다.

* 앞서 빠른설정을 통해 활성화 권하을 부여하였기때문에, 청사진탭에보면 기본데이터 레이크와 기본 데이터 웨어하우스 청시진이 활성화되어있다

단, 빠른설정을 하였기때문에 하이브리드 액세스 모드가 활성화 되어있지 않다.

하이브리드모드 활성화 청사진에서 '기본 데이터 레이크' 선택

Amazon DataZone 활성화 하여 AWS Lake Formation 하이브리드 액세스 모드에서 자산의 S3 위치 등록 버튼 클릭 후 저장