AWS Quicksight เป็น BI Tools ที่ให้บริการโดย AWS ในแบบที่เป็น serverless service ช่วยให้เรานำ data ที่มีอยู่มาทำ Visualization และแสดงผลออกมาในรูปแบบที่เป็น Dashboard ที่สามารถนำไปส่งต่อให้ทีมอื่นใช้งาน หรือนำไปสร้าง Presentation สำหรับนำเสนอผู้บริหารก็ได้
Quicksight ในปัจจุบันมี 2 Plan ให้เลือกใช้งานคือ Enterprise และ Enterprise + Q
Enterprise เป็น Plan พื้นฐานที่สามารถใช้งาน function ทั่วไปได้อย่างครบถ้วนและครอบคลุมทุกการใช้งาน
Enterprise + Q อีกระดับของการใช้งาน Quicksight โดยเป็นการนำ AI เข้ามาช่วยในการทำ Visualization เพียงแค่เราใส่สิ่งที่เราต้องการลงไป AI ก็จะช่วยค้นหาข้อมูล และนำมาสร้างเป็น Visual ให้เลยทันที
และถ้าพูดถึงแหล่งที่มาของข้อมูลที่เราจะเอามาใช้งานใน Quicksight แล้วหล่ะก็ เราสามารถเชื่อมต่อไปยัง Datasource ต่างๆได้มากมาย ไม่ว่าจะเป็น Athena, RDS, S3, 3rd party อื่นๆเช่น Saleforce, Databricks หรือแม้แต่การ Upload file เข้ามาก็สามารถทำได้เช่นกัน
ในการใช้งานครั้งแรก เราจำเป็นต้องสร้าง quicksight account เพื่อเลือก Plan ที่ต้องการใช้งานและ Configuration เบื้องต้น
Step 1: ใน AWS Console ให้เราค้นหา Service QuickSight
Step 2: เราจะเข้าสู่หน้าเริ่มต้นการสร้าง Quicksight account
Step 3: เลือก Sign up for Quicksight
Step 4: เลือก Plan ที่ต้องการใช้งาน
Step 5: กด Continue
Step 6: เป็นการเลือก Add-on ให้เลือก No, Maybe later เพื่อเลือกภายหลัง
Step 7: Authentication method เลือก Use IAM federated identities & QuickSight-managed users
Step 8: QuickSight region เลือก Asia Pacific (Singapore)
Step 9: QuickSight account name ระบุชื่อของ quicksight account นี้
Step 10: Notification email address ระบุ email ของผู้รับผิดชอบ account
Step 11: IAM Role เลือก Use QuickSight-managed role (default)
Step 12: Allow access and autodiscovery for these resources ใช้ตามที่ตั้งค่ามาได้เลย
Step 13: กด Finish
Step 14: กด Go to Amazon Quicksight เพื่อเข้าไปยัง Quicksight console
เพียงเท่านี้ Amazon Quicksight ก็พร้อมใช้งานเรียบร้อยแล้ว
เมื่อ Account พร้อมแล้ว เราจะมาเริ่มสร้าง Dataset ที่เราจะนำใช้วิเคราะห์ข้อมูลกัน
ก่อนจะเริ่มต้นหัวข้อนี้ มีสิ่งที่ควรรู้เพื่อเพิ่มความเข้าใจในการใช้งานมากขึ้น
ข้อแรก Dataset ที่สร้างจาก Athena และเป็นการถึงข้อมูลผ่าน DataCatalog เราต้องเพิ่ม permission ให้ quicksight เข้าถึง S3 bucket ที่เป็นต้นทางขอข้อมูลนั้น
ข้อสอง ก่อนการใช้งานให้ตั้งค่า Region ให้เป็น region ที่ต้องการใช้งาน
วิธี Setting permission
Step 1: Setting regions เป็น N.Virginia
Step 2: เข้าไปที่ Manage Quicksight
Step 3: เข้าไปที่ Security and Permissions
Step 4: เลือก Manage ภายใต้หัวข้อ QuickSight access to AWS services
Step 5: ติ๊กที่ช่อง S3
Step 6: เลือก Bucket ที่เก็บ Data
Step 7: กด Finish
Step 8: กด Save เพื่อบันทึก
เริ่มต้นการสร้าง Dataset
Step 0: จาก Quicksight console เลือก Region ที่เราจะใช้งาน ในที่นี้จะเลือกเป็น Singapore
Step 1: เลือกที่ Datasets
Step 2: กด New Dataset
Step 3: เลือก Datasource เป็น Athena
Step 4: Data source name ใส่ชื่อให้ Data source
Step 5: กด Create data source
Step 6: Catalog เลือก AwsDataCatalog
Step 7: Database เลือก customer_database
Step 8: Tables เลือก customer_parquet
Step 9: กด Select
Step 10: เลือก Import to SPICE for quicker analytics เพื่อเป็นการ dump ข้อมูลมาเก็บไว้ที่ quicksight
Step 11: เลือก Edit/Preview data เพื่อเข้าไปตรวจสอบข้อมูลที่ได้ และปรับแต่งได้ตามต้องการ
Step 12: เลือก SAVE & PUBLISH
Step 13: กลับไปยังหน้ารวม Dataset เราจะพบ “customer_parquet“ ถูกสร้างขึ้นมา
เมื่อเรามี Dataset แล้ว ก็ถึงเวลาที่จะทำการวิเคราะห์ dataset นั้น
Step 1: เข้าไปที่ Analyses
Step 2: เลือก New analysis จะเข้าสู่หน้าเลือก Dataset
Step 3: เลือก Dataset ที่ต้องการ
Step 4: เลือก USE IN ANALYSIS เพื่อเข้าสู่หน้าเตรียมสร้าง Analysis
Step 5: เลือก Interactive Sheet จากนั้นกด Create
Step 6: เข้าสู่หน้าพร้อมทำการสร้าง Visualize
Step 7: เลือก Visual type เป็น Donut Chart
Step 8: Fields list ให้เลือก profession เพื่อใส่ข้อมูลให้กับ Visual ก็จะได้ Donut Chart ที่แสดงสัดส่วนอาชีพของแต่ละคนออกมา
Step 9: ถ้าต้องการเพิ่ม Visual อื่นๆ ให้เลือกที่ ADD
Step 10: เลือก Add visual
Step 11: เลือก Visual ใหม่ที่สร้างขึ้นมา และเลือก Visual Type ที่ต้องการสร้างเพิ่มเติมได้
Step 12: ตั้งชื่อให้กับ Analysis โดยไปที่ File > Rename และใส่ชื่อที่ต้องการ
Step 13: ระบบจะ Auto save ให้อัตโนมัติ
ขึ้นตอนในการทำ Analysis เบื้องต้นก็มีเพียงเท่านี้เองครับ ทั้งง่ายและรวดเร็ว ช่วยให้ข้อมูลที่เป็นตารางธรรมดาดูดีขึ้นมาได้เยอะเลยทีเดียว ต่อไปเตรียมตัวเข้าสู่ขั้นตอนต่อในการสร้าง Dashboard กันเลย
Analysis ที่สร้างขึ้นมาแล้ว สามารถ publish ออกไปเป็น interactive dashboard ให้คนอื่นได้ใช้งานต่อได้ด้วย
Step 1: เข้าไปยัง Analyses แล้วเลือก Analysis ที่ต้องการ
Step 2: เลือก Icon share ด้านบนขวา แล้วเลือก Publish Dashboard
Step 3: กำหนดชื่อให้ Dashboard
Step 4: เลือก Publish dashboard
Step 5: กลับไปที่หน้า Dashboard ก็จะพบ Dashboard ที่เราสร้างขึ้นมา
สำหรับใครที่ใช้งาน AWS เป็นหลัก แล้วต้องการมี BI Tools เอาใช้งาน Quicksight นับว่าเป็น service ที่น่าจะตอบโจทย์มากๆ ทั้งการ Setup ที่ไม่ยาก ตัว Tools เองที่เป็น serverless สามารถเชื่อมต่อกับ service อื่นๆได้ง่าย และราคาไม่แพง ใครที่อยากเริ่มต้นใช้งาน data visualize อันนี้เป็น Tools ที่ไม่ควรพลาด และสำหรับมือใหม่หรือผู้ที่ยังไม่เคยใช้งาน AWS ถ้าสนใจจะเริ่มใช้งานก็เริ่มได้ไม่ยากเช่นกัน
-------- Data Engineer Course ----------
เริ่มต้นใช้งาน AWS Athena -> https://www.vultureprime.com/how-to/what-is-aws-athena
เริ่มต้นใช้งาน AWS Quicksight -> https://www.vultureprime.com/how-to/what-is-aws-quicksight
การคำนวนค่าใช้จ่ายของ Data Pipeline - Basic Level -> https://www.vultureprime.com/how-to/how-to-calcualte-etl-cost-basic-level