(เข้าใจ) ประเภทข้อมูลแบบก่อนมา 'วิเคราะห์' หา 'อินไซต์'
หลักสูตรการจัดการมหาบัณฑิตการเป็นผู้ประกอบการเชิงนวัตกรรม, บัณฑิตวิทยาลัยการจัดการและนวัตกรรม, มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี
(เข้าใจ) ประเภทข้อมูลก่อนหา 'อินไซต์'
ผศ.ดร. ปารเมศ วรเศยานนท์
บัณฑิตวิทยาลัยการจัดการและนวัตรกรรม มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี
เมื่อข้อมูลล้นโลก นักการตลาด ผู้ประกอบการและนักวิชาการต่างให้คำนิยามข้อมูลเหล่านี้ว่าเป็น 'ทรัพย์สิน' ที่เพิ่มมูลค่าได้ ผ่านการนำข้อมูลมาทำความสะอาด มาเข้าโครงสร้าง มาวิเคราะห์หา 'สิ่งที่ซ่อนอยู่ในข้อมูล' และมาคิดต่อว่าจะต่อยอดอย่างไรเพื่อเพิ่มมูลค่า
ความสำคัญอยู่ที่ว่าก่อนที่ 'ข้อมูลดิบ' จะมาถูก 'ทำให้สุก' เพื่อเอาไปบริโภค (ใช้ประโยชน์นั้น) ผู้เริ่มต้นการปรุงต้องเข้าใจประเภทของข้อมูลก่อนเพื่อที่จะหยิบมาแยกแยะ วิเคราะห์ และสังเคราะห์ได้อย่างถูกต้องและได้ประโยชน์จากข้อมูลมากที่สุด ดังนั้นก่อนที่จะเอาข้อมูลไปวิเคราะห์จึงจำเป็นต้องเข้าใจประเภทข้อมูลก่อน เพื่อจะได้นำข้อมูลมาใช้ให้ถูกต้อง
ข้อมูลที่จะนำมาใช้วิเคราะห์นั้นจะถูกแยกออกเป็น 'ข้อมูลเชิงคุณภาพ' และ 'ข้อมูลเชิง
ปริมาณ' โดยข้อมูลเชิงคุณภาพนั้นเป็นข้อมูลที่ไม่สามารถนำมาสรุปเป็นตัวเลขบวก ลบ คูณ หาร ได้ชัดเจน เนื่องจากเป็นข้อมูลที่ไม่มีค่าเต็ม 0 ดังนั้นโดยมากจะถูกนำไปจัดกลุ่มประเภท จัดหมวด หรือเรียงลำดับสูงหรือต่ำเท่านั้น หากแต่ข้อมูลเชิงปริมาณจะเป็นข้อมูลที่มีค่าเต็ม 0 สามารถบวก ลบ คุณ หารได้เต็มที่
เพื่อไม่ให้งง ดูตัวอย่างนี้ นาย ก มีความสูง 180 ซม เข้าเส้นชัยก่อนนาย ข 13 วินาที โดยนาย ข มีส่วนสูง 177 เซ็นติเมตร ข้อมูลอะไรเป็นข้อมูลเชิงปริมาณหรือเชิงคุณภาพบ้าง?
จากตัวอย่างมีข้อมูลอยู่ 3 ประเภทคือ 1. ลำดับของผู้ชนะ 2.เวลา และ 3. ส่วนสูงของนักวิ่งทั้งสองคน ทการที่นาย ก ได้ที่ 1 ส่วนนาย ข ได้ที่ 2 ในกรณีนี้เป็นข้อมูลอันดับอันเป็นข้อมูลเชิงคุณภาพ เนื่องจากเป็นการแบ่งกลุ่มคนชนะกับคนแพ้หรือคนที่ 1 และ คนที่ 2 ส่วนเวลาก็จะยังเป็นข้อมูลเชิงปริมาณเนื่องจากมีจุดเริ่มต้นก่อแนวิ่งเท่ากับ 0 (โดยปรกตจิเวลาจะเป็นเชิงคุณภาพเนื่องจาก มี 00.00 น. แต่ไม่เคยหมายความว่าเท่ากับเวลา 0 แต่หมายถึง เที่ยง หรือเที่ยงคืน) แต่หากพิจารณาความสูงของนักวิ่งนั้นจะพบว่าเป็นข้อมูลเชิงปริมาณเช่นกันเนื่องจากถ้าความสูงเท่ากับสูญคือไม่มีเลย ไม่สามารถเป็นอื่นได้ (เป็น 0 โดยสมบูรณ์) ดังนั้นข้อมูลความสูงจึงเป็นข้อมูลเชิงปริมาณ
ถ้าเข้าใจตรงนี้แล้วมาลองทดสอบดู ความพึงพอใจที่วัดเป็นระดับ (มากที่สุดถึงน้อยที่สุด) เป็นข้อมูลเชิงคุณภาพหรือปริมาณฯ บอกได้ทันทีว่าเป็น ข้อมูลเชิงคุณภาพเนื่องจากเป็นการแบ่งลำดับชั้นไม่สามารถแสดงค่าเป็น 0 อย่างสมบูรณ์ (พอใจระดับปานกลางชัดเจนอยู่ตรงไหน แต่ละคนอาจไม่เท่ากันสมบูรณ์ดังนั้นจึงเป็นได้เพียงการแบ่งกลุ่มตามลำดับเท่านั้น
ในเชิงวิชาการข้อมูลเชิงปริมาณและคุณภาพสามารถแบ่งได้ตามประเภทการวัดค่า โดยข้อมูลเชิงคุณภาพจะเน้นแบ่งกลุ่มหรือระบุประเภท (Norminal data) วัดระดับ (แบบช่วงไม่เท่ากัน (Ordinal data) กับช่วงเท่ากัน Interval data) หากเป็นข้อมูลเชิงปริมาณที่มีสามารรถวัดค่า 0 ที่สมบูรณ์จะเป็นข้อมูลที่เรียกว่าอัตราส่วน (Ratio) ซึ่งข้อมูลอัตราส่วนนั้นจะสามารถแบ่งได้เป็น ข้อมูลตัวเลขที่เป็นการนับจำนวนเต็ม (Discrete) และข้อมูลตัวเลขที่มีการเปลี่ยนแปลงต่อเนื่อง (Continuous)
ตัวอย่างของข้อมูลประเภทต่างๆ
ข้อมูลแบ่งกลุ่มหรือระบุประเภท (Norminal) เช่น ชายหญิง เชื้อชาติ กลุ่มอาชีพ
ข้อมูลการวัดระดับแบบช่วงไม่เท่ากัน (Ordinal data) เช่น ระดับความพึงพอใจ ระดับความสำคัญ
ข้อมูลการวัดระดับแบบช่วงเท่ากัน (Interval data) เวลา อุณหภูมิ
ข้อมูลตัวเลขที่เป็นการนับจำนวนเต็ม (Discrete) จำนวนนักศึกษาในห้อง จำนวนพนักงานในสถานที่ทำงาน
ข้อมูลตัวเลขที่มีการเปลี่ยนแปลงต่อเนื่อง (Continuous) อายุ ส่วนสูง
รู้แล้วยังไงต่อ? หลังจากนี้เมื่อเข้าใจประเภทข้อมูลแล้วจะสามารถเลื่อกเครื่องมือวิเคราะห์ข้อมูลได้อย่างถูกต้องมากขึ้น ซึ่งจะกล่าวต่อไป
______________________________________________________________________________________
หลักสูตรการจัดการการเป็นผู้ประกอบการเชิงนวัตกรรม (#EPM) เป็นหลักสูตรภายใต้การกำกับดูแลของบัณฑิตวิทยาลัยการจัดการและนวัตกรรม (#GMI) มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี (#KMUTT)
หากมีข้อคิดเห็นหรือเสนอแนะใดๆ ทักมาคุยกัหรือแอดมาเป็นเพื่อนกันที่ https://www.facebook.com/kmuttentrepreneurship/
สามารถสอบถามเพิ่มเติมได้ที่ (02) 470-9795-6, 084-676-5885
LINE : @GMIKMUTT
หรือ ดูรายละเอียดเพิ่มเติม https://gmi.kmutt.ac.th/master_program
สนใจสมัครได้ที่ https://bit.ly/GMI_Apply
เรื่องที่น่าสนใจอื่น