5 เทคนิคทำความสะอาดข้อมูล (Data Cleansing) ใน Excel
5 เทคนิคทำความสะอาดข้อมูล (Data Cleansing) ใน Excel
Business
4 Min
21 Nov 2024
Share
Table of contents
5 เทคนิคทำความสะอาดข้อมูล (Data Cleansing) ใน Excel แบบง่ายๆ ที่ Data Analyst ต้องมี
Data Analyst หรือ คนที่ต้องทำงานกับข้อมูลจริงๆ มักจะทราบกันดีว่าข้อมูลได้มาอาจมีข้อมูลซ้ำ ข้อมูลผิด ข้อมูลหาย หรืออยู่ในรูปแบบที่แตกต่างกัน เป็นเรื่องยากมากที่ข้อมูลที่เก็บมาจะสมบูรณ์แบบ 100% ดังนั้นการทำความสะอาดข้อมูล (Data Cleansing) จึงเป็นอีกทักษะสำคัญก่อนนำข้อมูลไปวิเคราะห์ เพื่อให้ได้ผลลัพธ์ที่ถูกต้องและแม่นยำ
โดยในบทความนี้เราจะมาแนะนำการทำ Data Cleansing เบื้องต้นใน Excel ซึ่งเป็นโปรแกรมสเปรดชีตที่ได้รับความนิยมอย่างแพร่หลายในหมู่คนทำงานออฟฟิศ และเข้าใจง่าย เหมาะสำหรับชุดข้อมูลขนาดเล็กถึงปานกลาง ผู้อ่านที่คุ้นเคยกับการใช้งาน Excel อยู่แล้ว น่าจะสามารถเรียนรู้หลักการ และนำไปใช้งานได้จริง
5 เทคนิคทำความสะอาดข้อมูลเบื้องต้นแบบง่ายๆ ใน Excel
เทคนิคทำความสะอาดขั้นพื้นฐาน
จัดการกับปัญหาในข้อมูลทั่วๆ ไป เช่น ช่องว่างในเซลล์ เซลล์ข้อมูลว่างเปล่า และคำผิด
- ลบช่องว่างในเซลล์
- เลือกช่วงของเซลล์ที่คุณต้องการลบช่องว่าง
- ใช้แป้นพิมพ์ลัด Ctrl + H เพื่อเปิดกล่อง Find in document
- ในช่อง ค้นหา ให้กดแป้น Spacebar สองครั้งเพื่อป้อนช่องว่างสองช่อง
- ในช่อง แทนที่ด้วย ให้กดแป้น Spacebar หนึ่งครั้งเพื่อป้อนช่องว่างหนึ่งช่อง
- คลิกที่ แทนที่ทั้งหมด
- ทำซ้ำขั้นตอนจนกว่าจะไม่พบช่องว่างสองช่องที่จะส่งผลต่อข้อมูลอีก
- ใส่ข้อมูลในเซลล์ว่าง
- เลือกช่วงของเซลล์ที่คุณต้องการลบช่องว่าง
- ใช้แป้นพิมพ์ลัด Ctrl + G เพื่อเปิดกล่อง Go to
- คลิกที่ปุ่ม “Special…” เลือกตัวเลือก เซลล์ว่าง (Blanks) และคลิก ตกลง
- เซลล์ว่างทั้งหมดในช่วงจะเลือกถูกเลือก
- ป้อนค่า หรือสูตรที่ต้องการและ กด Ctrl + Enter
- ตรวจคำผิด
- ไปที่แท็บ Reveiw ในแถบเมนูด้านบน คลิกปุ่ม Spelling
- กล่อง Spelling จะเปิดขึ้น แสดงคำที่สะกดผิดที่ตรวจพบ และคำแนะนำในการแก้ไขให้
- ตรวจสอบและแก้ไขคำที่สะกดผิดตามต้องการ
เทคนิคจัดการ Error และเปลี่ยนสีตัวอักษรตามเงื่อนไข
ระบุและแก้ไขข้อผิดพลาด (Error) ด้วยการการตรวจสอบความสมบูรณ์ของข้อมูล ผ่านการแสดง Error ให้ชัดขึ้น และลบข้อมูลซ้ำที่ไม่จำเป็นทิ้ง
- เปลี่ยนสีตัวอักษรตามเงื่อนไข เพื่อแสดง Error ให้ชัด
- เลือกช่วงของเซลล์ ที่คุณต้องการตรวจสอบหาข้อผิดพลาด
- ไปที่แท็บ Home ในแถบเมนูด้านบน
- คลิกที่ Conditional Formatting
- เลือก New Rule จากเมนูแบบเลื่อนลง
- เลือก Use a Formula เพื่อกำหนดเซลล์ที่จะจัดรูปแบบ
- ป้อนสูตร =ISERROR(เซลล์) ในช่องจัดรูปเซลล์ที่มี Error
- คลิกปุ่ม Format… เพื่อเลือกการจัดรูปแบบที่คุณต้องการ เช่น ไฮไลท์ข้อความเป็นสีแดง
- คลิก ตกลง หลังจากเลือกการจัดรูปแบบ
- ลบข้อมูลซ้ำ
- เลือกเวิร์กชีตหรือช่วงของเซลล์ ที่คุณต้องการลบข้อมูลซ้ำ
- ไปที่แท็บ Data ในแถบเมนูด้านบน
- คลิกที่ Remove Duplicate
- ในกล่อง Remove Duplicate ให้ระบุคอลัมน์ที่จะตรวจสอบหาข้อมูลซ้ำ คลิก ตกลง
- Excel จะแสดงจำนวนค่าซ้ำที่ถูกลบไป
เทคนิคการจัดการข้อความ
จัดการและจัดรูปแบบข้อมูลข้อความเพื่อให้ตรงกับความต้องการ อาทิ การเชื่อมรวมข้อความ และการเปลี่ยนแปลงรูปแบบตัวอักษร
- รวมข้อความในเซลล์เดียว
- สร้างคอลัมน์ใหม่ พิมพ์ =CONCATENATE() ในเซลล์ว่าง
- เลือกเซลล์ ที่คุณต้องการรวมกัน โดยคั่นด้วยเครื่องหมายลูกน้ำ (,) หรือเครื่องหมายและ (&)
- กด Enter เพื่อดูผลลัพธ์
- เปลี่ยนตัวอักษรเป็นพิมพ์ใหญ่ หรือ พิมพ์เล็ก
- สร้างคอลัมน์ใหม่สร้างคอลัมน์ใหม่
- ป้อนสูตรในเซลล์ =UPPER() เพื่อเปลี่ยนเป็นตัวพิมพ์ใหญ่ หรือ =LOWER() เพื่อเปลี่ยนเป็นตัวพิมพ์เล็ก หรือ =PROPER() เพื่อทำให้เฉพาะตัวอักษรแรกของคำเป็นตัวพิมพ์ใหญ่
- กด Enter เพื่อใช้สูตร
เทคนิคแปลงข้อมูล
จัดระเบียบและปรับโครงสร้างข้อมูลเพื่อการวิเคราะห์ที่ดีขึ้น รวมถึงการแยกข้อความ และการใช้เครื่องมือ Flash Fill
- การแยกข้อความออกจากเซลล์ (Text to Column)
- เลือกข้อมูล ที่ต้องการแยก
- ไปที่แท็บ Data และคลิก Text to Column
- เลือก Delimited หากข้อมูลที่มีคั่นด้วยเครื่องหมายชัดเจน และคลิก ถัดไป
- หรือเลือก Fixed Width หากข้อมูลไม่มีเครื่องหมายคั่น แต่ต้องการแบ่งคอลัมน์จากความกว้างที่กำหนดคั่นเอง
- คลิก เสร็จสิ้น
- เติมข้อมูลอัตโนมัติ (Flash Fill)
- ป้อนข้อมูล ตามรูปแบบในเซลล์ถัดจากข้อมูลที่มีอยู่
- ใส่ตัวอย่างอื่น ในเซลล์ถัดไปเพื่อช่วย Excel ตรวจจับรูปแบบได้
- กดเลือกเซลล์ ที่มีตัวอย่าง
- ไปที่แท็บ Data คลิกที่ Flash Fill
- Excel จะเติมเซลล์ที่เหลือโดยอัตโนมัติตามรูปแบบที่ตรวจพบจากตัวอย่าง
เทคนิคจัดรูปแบบตัวเลขและวันที่
จัดรูปแบบและทำให้ข้อมูลตัวเลขและวันที่เป็นมาตรฐาน มีรูปแบบสอดคล้องกัน
- จัดรูปแบบตัวเลขและเครื่องหมายตัวเลข
- เลือกเซลล์ ที่มีตัวเลขที่ต้องการแก้ไข
- ไปที่แท็บ Home คลิกเมนู Drop down เพื่อเลือกรูปแบบข้อมูล ค่า Default อาจจะเป็น General หรือ Number อยู่
- กด More Number Formats และเลือก รูปแบบตัวเลข ที่เหมาะสมกับข้อมูล (เช่น ทั่วไป, ตัวเลข, สกุลเงิน)
- จัดรูปแบบวันที่และเวลา
- เลือกเซลล์ที่มีวันที่
- ไปที่แท็บ Home
- คลิกเมนู Drop down เลือกรูปแบบ วันที่แบบสั้น หรือ วันที่แบบยาว
คำแนะนำเพิ่มเติมสำหรับมือใหม่
สำหรับใครที่เพิ่งเริ่มเรียน Data Analytics และไม่คุ้นเคยกับการทำ Data Cleansing ควรเริ่มต้นจากข้อมูลขนาดเล็กก่อนจะทำได้ง่ายกว่า และอย่าลืมศึกษาโครงสร้างและความหมายของข้อมูลก่อนเริ่มทำความสะอาด รวมถึงบันทึกขั้นตอนการทำความสะอาดข้อมูล เพื่อใช้ในการอ้างอิงได้ในภายหลังว่าได้ทำอะไรกับข้อมูลไปแล้วบ้าง
สรุป
การทำความสะอาดข้อมูลเป็นขั้นตอนที่สำคัญในงานวิเคราะห์ข้อมูล เพื่อให้ได้ผลลัพธ์ที่ถูกต้องและแม่นยำ การเลือกใช้เทคนิคและเครื่องมือที่เหมาะสมจะช่วยให้คุณสามารถทำความสะอาดข้อมูลได้อย่างมีประสิทธิภาพ
สำหรับผู้สนใจเรียน Data Analytics ทักษะแห่งอนาคต เพื่อต่อยอดการทำงาน เพิ่มเงินเดือน หรือย้ายสายงาน True Digital Academy กำลังเปิดหลักสูตรอบรมทักษะ Data Analytics สุดเข้มข้น “Data Ready Bootcamp” สอนครบทั้งวิธีคิด-กระบวนการ-เครื่องมือจำเป็น ทุกทักษะ ที่ Data Analyst ต้องมี สนใจดูรายละเอียดเพิ่มเติม และสมัครเรียนได้ที่นี่ https://www.truedigitalacademy.com/course/data-ready-bootcamp