การออกแบบ Data pipeline นั้นสามารถออกแบบโดยอ้างอิงจาก Framework หรือ Best practice ตัวใดตัวหนึ่งเพื่อเป็นจุดเริ่มต้นในการออกแบบ
โดยทั่วไปแล้วการออกแบบ Data Pipeline มีเรื่องที่ต้องคำนึงทั้งหมด 7 ข้อ ได้แก่
Data source หรือ แหล่งข้อมูล คือข้อมูลซึ่งอยู่ในแหล่งข้อมูลที่แตกต่างกัน เช่น ข้อมูลที่มาจาก Database, ข้อมูลที่มาจาก Data lake, ข้อมูลที่มาจาก Data warehouse หรือ ข้อมูลจาก Streaming ต่าง ๆ (Sensor) เป็นต้น
Data format หรือ รูปแบบข้อมูล คือข้อมูลซึ่งถูกจัดเก็บด้วยเทคโนโลยีและ Algorithm ที่แตกต่างกัน เช่น CSV, JSON, Parquet, AVRO และ ORC เป็นต้น
Data cleansing หรือ การทำความสะอาดข้อมูลคือการทำให้ข้อมูลที่ได้มานั้นมีความสมบูรณ์มากที่สุดและพร้อมใช้งานต่อในกระบวนการถัดไป
Data transformation หรือ การเปลี่ยนแปลงข้อมูลคือการทำให้ได้มาซึ่งข้อมูลใหม่ซึ่งอาจจะเป็นการเปลี่ยนแปลงข้อมูลเดิมหรืออาจจะเป็นการสร้างข้อมูลขึ้นมาเพื่อเพิ่มลงไปในชุดข้อมูลเดิม
Data security หรือ ความปลอดภัยของข้อมูลคือ วิธีป้องกันการเข้าถึงข้อมูลจากบุคคลที่ไม่ได้รับอนุญาต, วิธีการใช้งานข้อมูล หรือ การควบคุมข้อมูลที่สามารถเปิดเผยได้
Data governance หรือ การกำกับข้อมูลคือ นโยบายในการบริหารข้อมูล เช่น ใครเป็นเจ้าของข้อมูล, ใครเป็นผู้อนุญาตให้สามารถเข้าถึงข้อมูลได้ หรือ ระยะเวลาในการจัดเก็บข้อมูล
Monitoring หรือ การเฝ้าติดตามคือ การเฝ้าติดตามประสิทธิภาพและความราบรื่นในส่วนของ Data pipeline เพื่อที่จะให้มั่นใจได้ว่า Data pipeline ที่ใช้งานอยู่นั้น มีประสิทธิภาพอยู่ในระดับที่น่าพอใจ