|
|
|
Data Mining คืออะไร
|
ในปัจจุบัน
สภาวะการแข่งขันเพื่อให้ได้ชัยชนะทางธุรกิจจำเป็นต้องมีกลยุทธ์หรือยุทธวิธี
(Business Strategies) ที่เชื่อมั่นได้ว่าจะลดความเสี่ยงขององค์กรลงได้
กลยุทธ์วิธีการต่างๆจำเป็นต้องมีฐานความรู้
(Knowledge Base)
เพื่อใช้ในการสร้างกรอบการทำงาน
(Framework) ที่สนองตอบกับกลยุทธ์ทางธุรกิจ
การที่จะได้มาซึ่งฐานความรู้และกรอบการทำงานที่มีประโยชน์
จำเป็นต้องมีเทคโนโลยีสารสนเทศที่สามารถวิเคราะห์ข้อมูลทางธุรกิจ
เทคโนโลยีสารสนเทศที่สามารถกลั่นกรองข้อมูลทางธุรกิจที่มีปริมาณมหาศาล
(Very
large data in business information systems)
เพื่อให้ได้ข้อมูลที่มีประโยชน์ในการคิดกลยุทธ์
(Usefull information from
very large data) ดังน้นในขณะนี้ Data Mining
จึงเป็นเทคโนโลยีสารสนเทศที่ได้รับการกล่าวถึงมากที่สุด
เหตุผลที่สำคัญสำหรับทำไมถึงมี Data Mining และทำไมถึงต้องทำ Data Mining
นั้นก็เพราะว่า Data Mining เป็นเทคโนโลยีสารสนเทศที่สามารถกลั่นกรอง
วิเคราะห์
ข้อมูลที่มีปริมาณมหาศาลเพื่อให้ได้ข้อมูลที่มีประโยชน์หรือได้ข้อมูลที่ซ่อนเร้นอยู่ในข้อมูลที่มีปริมาณมหาศาล
และนำข้อมูลที่มีประโยชน์มีใช้เป็นฐานความรู้เพื่อช่วยในการบริหารงาน เช่น
การบริหาร CRM (Customer Relationship
Management)
Data Mining
คือขบวนการทำงานที่เรียกว่า process ที่สกัดข้อมูล
(Extract data)
จากฐานข้อมูลขนาดใหญ่ (Large
Information) เพื่อให้ได้สารสนเทศ (Usefull
Information) ที่เรายังไม่รู้ (Unknown data) โดยเป็นสารสนเทศที่มีเหตุผล
(Valid) และสามารถนำไปใช้ได้ (Actionable)
ซึ่งเป็นสิ่งสำคัญในการที่จะช่วยการตัดสินใจในการทำธุรกิจ Data Mininig
เป็นโปรเซสที่สำคัญในการทำ Knowledge
Discovery in Database ที่เราเรียกสั้นๆว่า KDD ส่วน Data
Mining สามารถเรียกสั้นๆว่า DM ขั้นตอนการทำ Data Mining มี 4
ขั้นตอนหลักดังนี้
-
Business Object Determination
เป็นตัวจักรที่สำคัญในการทำ KDD เนื่องจากเป็นกำหนด ขอบเขต เป้าหมาย
ของการทำ KDD ซึ่งจะมีผลต่อทุกๆขั้นตอนของการทำ KDD โดยนักวิเคราะห์ธุรกิจ
(Business Analyst) จะต้อง Identify
ปัญหาที่เกิดขึ้นในการทำธุรกิจให้ครอบคลุมและชัดเจนรวมทั้งวัตถุประสงค์ด้วย
-
Data Preparation
หน้าที่ของขั้นตอนนี้คือจัดการข้อมูลให้สามารถนำเข้าสู่อัลกอริทึมส์ของ
Data Mining ได้ เช่น การทำ Data Cleaning, Data
Integration, Data
Reduction เป็นต้น ซึ่ง Data Preparation สามารถแบ่งออกเป็น 3 ส่วนได้แก่
Data Selection, Data Preprocessing และ Data Transformation
-
Data Mining เป็นขั้นตอนการทำ Mining โดยมี operation
ในการทำ Data Mining หลายแบบ เช่น Database
Segmentation, Predictive Modeling, Link Analysis เป็นต้น
แต่ละ Data Mining Operation จะมีอัลกอริทึมส์ให้เลือกใช้ เช่น การทำ
Database Segmentation อาจใช้ K-Mean Algorithms หรืออาจใช้ Unsupervised
Learning Neural Networks เช่น โมเดล Kohonen Neural Net ถ้าเป็นการทำ
Predictive Modeling อาจใช้ CART (Classification And Regression
Tree)
หรืออาจใช้ Supervised Learning Neural Network เช่น Backpropagation
Neural Net ถ้าเป็นการทำ Link Analysis ซึ่งมีการทำอยู่ 2 ลักษณะคือ
Association Rule Discovery และ Sequential Pattern Discovery อาจใช้
Apriori Algorithms
-
Analysis of Results and Knowledge Presentation
เป็นขั้นตอนสุดท้ายสำหรับนักวิเคาะห์ข้อมูลที่จะต้องเก็บผลลัพธ์ของ Data
Mining สรุปความหมายของผลลัพธ์ที่ได้ ซึ่งจะเป็นข้อมูลความรู้
(Knowledge)
นำไปเป็นสารสนเทศที่ช่วยในการตัดสินใจ
-
|
กลับไปหน้าหลัก
|
© The Power Station Co.,Ltd
|
|