Data Mining

Text mining กับการประยุกต์ใช้ในทางธุรกิจ

Posted On ธันวาคม 3, 2017 at 6:00 am by / ปิดความเห็น บน Text mining กับการประยุกต์ใช้ในทางธุรกิจ

ปัจจุบัน data ที่เป็น text ถูกผลิตขึ้นมาในแต่ละวันจำนวนมหาศาล จาก social network ,facebook twiiter ฯลฯ ซึ่งหาเราสามารถสกัดเพื่อหาข้อมูลที่เป็นประโยชน์ของเราได้ จากข้อมูลมหาศาล ย่อมมีประโยชน์ต่อการดำเนินการทางธุรกิจ

การทำ text mining เป็นอีกกระบวนการหนึ่งซึ่งสามารถมาช่วยหาคำตอบเพื่อสนับสนุนการตัดสินใจ ในทางธุรกิจ

ขั้นตอนการสกัด

1.   Text (นำมาจากแหล่งข้อมูลต่าง ๆ ที่เกี่ยวข้องกับธุรกิจ,กลุ่มเป้าหมาย)

2.   NPL (Natural Language Processing) การแปลงข้อมูลที่เป็น text เป็นภาษาที่คอมพิวเตอร์เข้าใจ และเข้าใจความหมายของข้อความนั้น ๆ )

3.   Mining (clustering,classification,prediction,Trending,Association)
กระบวนการสกัดเลือกเทคนิคที่เหมาะสม ว่าเราต้องการอยากจะหาอะไรจากข้อมูลนั้น อยากจะจัดกลุ่ม อยากจำแนก พยากรณ์ หรือ หาความสัมพันธ์ของข้อมูล)

4.   Bussiness UI  >>  Bussiness User
ในส่วนที่จะทำการแปลงข้อมูลที่ได้จากการ mining มาอยู่ในรูปของ user interface ในลักษณะของ dashboard เพื่อให้ผู้บริหารหรือผู้ที่มีหน้าที่ในการตัดสินใจพิจารณาได้ง่าย และ สามารถตัดสินใจได้อย่างถูกต้องและแม่นยำ (BI : Bussiness Intelligence)

ซึ่งการที่จะทำให้คอมพิวเคอร์เข้าใจในไวยากรณ์ของภาษา หรือ บริบท ความหมายต่าง ๆ ของประโยค เราต้องเก็บข้อมูลจำนวนมหาศาลเพื่อให้ครอบคลุมทั้งหมด ซึ่งจำเป็นต้องมีความรู้เรื่องภาษา (Theory Driven) หรือเป็นลักษณะของ Rule-base

แต่มีอีกแนวทางที่เรียกว่า Corbus-base (Data Driven) ซึ่งจะอาศัยหลักการทางสถิติเข้ามาช่วย ใช้ความน่าจะเป็นว่าประโยคดังกล่าวมีบริบทไหนมากกว่ากัน ซึ่งในภาษาธรรมชาติจะมีความหมายกำกวมเป็นจำนวนมาก ยกตัวอย่างเช่น

  • ฉันไม่ได้ซักผ้า
  • ผ้าฉันไม่ได้ซัก

เขียนต่างกันแต่มีความหมายเดียวกัน  การที่จะทำให้คอมพิวเตอร์เข้าใจนั้นต้องดูว่า ประโยคไหนมีการใช้บ่อยและมีบริบทที่ใกล้เคียงกัน