Data Mining

การทำ Clustering Data ใน RapidMiner 7

การทำ Clustering Data ใน RapidMiner 7

โดยที่ จะนำข้อมูลตัวอย่างซึ่งอยู่ในรูปแบบของไฟล์ Excel ซึ่งเป็นข้อมูลการเข้ารับการบริการ โดยจะทำการจัดกลุ่ม Clustering ใช้ วิธีการ k-means clustering แบ่งออกเป็น 3 Cluster

ขั้นตอนที่ 1 : การจัดเตรียมข้อมูล (Data Preparation)

จากข้อมูลทำการเลือกฟิลด์ของข้อมูลที่สามารถนำเข้าสู่ Process ได้ เช่น ข้อมูลต้องไม่เป็นข้อมูลที่เป็น unique เช่น ID ต่าง ๆ ซึ่งเป็นข้อมูลที่ไม่ซ้ำกันในแต่ละรายการ และข้อมูลควรเป็นตัวเลข แต่ถ้าข้อมูลใดที่เป็นแบบ Norminal ควรแปลงให้เป็นแบบ Numberic

 

ขั้นตอนที่ 2 :  เปิดโปรแกรม RapidMiner และเลือกเครื่องมือ เชื่อมต่อ Component ดังรูป

ประกอบด้วย 3 Component คือ

1. Read Excel  ทำหน้าที่อ่านข้อมูลจากไฟล์ Excel นำเข้าสู่ Process

 

2. K-Means Clustering โมเดลสำหรับการจัดกลุ่มของข้อมูล

3. Write Excel  ทำหน้าที่บันทึกข้อมูลต่าง ๆ ที่ได้จากการ Process เขียนเป็นไฟล์ Excel

4. ผลลัพธ์ที่ได้ จะถูกเขียนเป็นไฟล์ Excel ดังนี้  Column ที่เป็น label จะเป็นตัวที่ระบุกลุ่มของข้อมูลที่ถูกแบ่งจาก Process แล้ว

ส่วนผลลัพธ์อื่น ๆ สามารถดูได้จากโปรแกรม Rapidminer

Data

ข้อมูลทางสถิติ

การแสดงผลแบบกราฟต่าง ๆ