เนื่องจาก Glue จำเป็นที่ต้องเข้าถึง data ภายใน S3 ได้ และในการคุยกันระหว่าง service ใน AWS เราจะใช้ IAM Role เป็นตัวระบุ perrmision ในการคุยกัน
Step 1: เข้าไปที่ AWS IAM
Step 2: ตรง Access management เลือกที่ Role
Step 3: เลือก Create role เพื่อสร้าง Role ใหม่ขึ้นมา
Step 4: Trusted entity type เลือก AWS service
Step 5 Use case ให้เลือกเป็น Glue โดยเลือกจาก Drop down list
Step 6: กด Next เพื่อเข้าหน้าเลือก policies
Step 7: ค้นหา policies ที่ชื่ว่า AdministratorAccess ( filter หาในช่อง filter ได้เลย)
Step 8: เลือกที่ AdministratorAccess
Step 9: กด Next
Step 11: ตั้งชื่อ Role ในช่อง Role name โดยใช้ชื่อว่า glue_full_access
Step 12: เลือกมาด้านล่างเลือก Create Role เพื่อสร้าง role เป็นอันเสร็จ
Step 13: ลองค้นหา Role ที่เราสร้างขึ้นมา
เพียงเท่านี้เราจะได้ Role ที่พร้อม Assign ให้ Glue ใช้งานแล้ว
-------- Data Engineer Course ----------
DataSet -> Customer.csv
เริ่มต้นโปรเจค -> https://www.vultureprime.com/how-to/start-first-project-with-aws-glue
สร้าง bucket และ folder สำหรับจัดเก็บไฟล์ -> https://www.vultureprime.com/how-to/how-to-create-s3-folder-and-structure
สร้าง IAM Role -> https://www.vultureprime.com/how-to/how-to-create-iam-role
สร้าง Database ใน Data Catalog -> https://www.vultureprime.com/how-to/how-to-create-database-in-glue-catalog
สร้าง Table ใน Database โดยใช้ Crawler -> https://www.vultureprime.com/how-to/how-to-create-table-with-glue-crawler
Transform data ด้วย Glue Job -> https://www.vultureprime.com/how-to/how-to-etl-with-glue
สร้าง Table จาก ETL result -> https://www.vultureprime.com/how-to/how-to-create-table-with-glue-crawler-2