ศึกษาและฝึกปฏิบัติเกี่ยวกับแนวคิดเบื้องต้นเกี่ยวกับการวิเคราะห์ข้อมูลขนาดใหญ่ ระบบจัดการฐานข้อมูลเชิงสัมพันธ์และภาษาเอสคิวแอลสำหรับสอบถามในสภาพแวดล้อมของข้อมูลขนาดใหญ่ เช่น ในระบบแฟ้มข้อมูลแบบกระจายแบบ Hadoop (Hadoop distributed file system - HDFS) การใช้เครื่องมือ เช่น Sqoop, Pig และ Hive เป็นต้น เพื่อย้ายข้อมูลระหว่างฐานข้อมูลเชิงสัมพันธ์ และ Hadoop โดยใช้ Sqoop จัดการข้อมูลใน HDFS และใช้ Pig และ Hive เพื่อดำเนินการสอบถามข้อมูลแบบกระจาย การประยุกต์ใช้เทคนิคเหมืองข้อมูลเพื่อวิเคราะห์ข้อมูลขนาดใหญ่ เช่น การกรองรายการข้อมูล การแนะนำรายการที่ไม่กระจาย การขุดค้นชุดรายการที่พบบ่อย การจัดกลุ่ม (Cluster) ขั้นตอนวิธีของการทำเหมืองข้อความ และการจำแนกกลุ่มด้วย Naive Bayesian เป็นต้น