แจก 5 เทคนิคทำความสะอาดข้อมูล (Data Cleansing) ใน Excel

แจก 5 เทคนิคทำความสะอาดข้อมูล (Data Cleansing) ใน Excel

Business

4 นาที

21 พ.ย. 2024

แชร์

5 เทคนิคทำความสะอาดข้อมูล (Data Cleansing) ใน Excel แบบง่ายๆ ที่ Data Analyst ต้องมี


Data Analyst หรือ คนที่ต้องทำงานกับข้อมูลจริงๆ มักจะทราบกันดีว่าข้อมูลได้มาอาจมีข้อมูลซ้ำ ข้อมูลผิด ข้อมูลหาย หรืออยู่ในรูปแบบที่แตกต่างกัน เป็นเรื่องยากมากที่ข้อมูลที่เก็บมาจะสมบูรณ์แบบ 100% ดังนั้นการทำความสะอาดข้อมูล (Data Cleansing) จึงเป็นอีกทักษะสำคัญก่อนนำข้อมูลไปวิเคราะห์ เพื่อให้ได้ผลลัพธ์ที่ถูกต้องและแม่นยำ

โดยในบทความนี้เราจะมาแนะนำการทำ Data Cleansing เบื้องต้นใน Excel ซึ่งเป็นโปรแกรมสเปรดชีตที่ได้รับความนิยมอย่างแพร่หลายในหมู่คนทำงานออฟฟิศ และเข้าใจง่าย เหมาะสำหรับชุดข้อมูลขนาดเล็กถึงปานกลาง ผู้อ่านที่คุ้นเคยกับการใช้งาน Excel อยู่แล้ว น่าจะสามารถเรียนรู้หลักการ และนำไปใช้งานได้จริง

เทคนิคทำความสะอาดขั้นพื้นฐาน
จัดการกับปัญหาในข้อมูลทั่วๆ ไป เช่น ช่องว่างในเซลล์ เซลล์ข้อมูลว่างเปล่า และคำผิด

  1. ลบช่องว่างในเซลล์
    • เลือกช่วงของเซลล์ที่คุณต้องการลบช่องว่าง
    • ใช้แป้นพิมพ์ลัด Ctrl + H เพื่อเปิดกล่อง Find in document
    • ในช่อง ค้นหา ให้กดแป้น Spacebar สองครั้งเพื่อป้อนช่องว่างสองช่อง
    • ในช่อง แทนที่ด้วย ให้กดแป้น Spacebar หนึ่งครั้งเพื่อป้อนช่องว่างหนึ่งช่อง
    • คลิกที่ แทนที่ทั้งหมด
    • ทำซ้ำขั้นตอนจนกว่าจะไม่พบช่องว่างสองช่องที่จะส่งผลต่อข้อมูลอีก
  2. ใส่ข้อมูลในเซลล์ว่าง
    • เลือกช่วงของเซลล์ที่คุณต้องการลบช่องว่าง
    • ใช้แป้นพิมพ์ลัด Ctrl + G เพื่อเปิดกล่อง Go to
    • คลิกที่ปุ่ม “Special…” เลือกตัวเลือก เซลล์ว่าง (Blanks) และคลิก ตกลง
    • เซลล์ว่างทั้งหมดในช่วงจะเลือกถูกเลือก
    • ป้อนค่า หรือสูตรที่ต้องการและ กด Ctrl + Enter
  3. ตรวจคำผิด
    • ไปที่แท็บ Reveiw ในแถบเมนูด้านบน คลิกปุ่ม Spelling
    • กล่อง Spelling จะเปิดขึ้น แสดงคำที่สะกดผิดที่ตรวจพบ และคำแนะนำในการแก้ไขให้
    • ตรวจสอบและแก้ไขคำที่สะกดผิดตามต้องการ

เทคนิคจัดการ Error และเปลี่ยนสีตัวอักษรตามเงื่อนไข
ระบุและแก้ไขข้อผิดพลาด (Error) ด้วยการการตรวจสอบความสมบูรณ์ของข้อมูล ผ่านการแสดง Error ให้ชัดขึ้น และลบข้อมูลซ้ำที่ไม่จำเป็นทิ้ง

  1. เปลี่ยนสีตัวอักษรตามเงื่อนไข เพื่อแสดง Error ให้ชัด
    • เลือกช่วงของเซลล์ ที่คุณต้องการตรวจสอบหาข้อผิดพลาด
    • ไปที่แท็บ Home ในแถบเมนูด้านบน
    • คลิกที่ Conditional Formatting
    • เลือก New Rule จากเมนูแบบเลื่อนลง
    • เลือก Use a Formula เพื่อกำหนดเซลล์ที่จะจัดรูปแบบ
    • ป้อนสูตร =ISERROR(เซลล์) ในช่องจัดรูปเซลล์ที่มี Error
    • คลิกปุ่ม Format… เพื่อเลือกการจัดรูปแบบที่คุณต้องการ เช่น ไฮไลท์ข้อความเป็นสีแดง
    • คลิก ตกลง หลังจากเลือกการจัดรูปแบบ
  2. ลบข้อมูลซ้ำ
    • เลือกเวิร์กชีตหรือช่วงของเซลล์ ที่คุณต้องการลบข้อมูลซ้ำ
    • ไปที่แท็บ Data ในแถบเมนูด้านบน
    • คลิกที่ Remove Duplicate
    • ในกล่อง Remove Duplicate ให้ระบุคอลัมน์ที่จะตรวจสอบหาข้อมูลซ้ำ คลิก ตกลง
    • Excel จะแสดงจำนวนค่าซ้ำที่ถูกลบไป

เทคนิคการจัดการข้อความ
จัดการและจัดรูปแบบข้อมูลข้อความเพื่อให้ตรงกับความต้องการ อาทิ การเชื่อมรวมข้อความ และการเปลี่ยนแปลงรูปแบบตัวอักษร

  1. รวมข้อความในเซลล์เดียว
    • สร้างคอลัมน์ใหม่ พิมพ์ =CONCATENATE() ในเซลล์ว่าง
    • เลือกเซลล์ ที่คุณต้องการรวมกัน โดยคั่นด้วยเครื่องหมายลูกน้ำ (,) หรือเครื่องหมายและ (&)
    • กด Enter เพื่อดูผลลัพธ์
  2. เปลี่ยนตัวอักษรเป็นพิมพ์ใหญ่ หรือ พิมพ์เล็ก
    • สร้างคอลัมน์ใหม่สร้างคอลัมน์ใหม่
    • ป้อนสูตรในเซลล์ =UPPER() เพื่อเปลี่ยนเป็นตัวพิมพ์ใหญ่ หรือ =LOWER() เพื่อเปลี่ยนเป็นตัวพิมพ์เล็ก หรือ =PROPER() เพื่อทำให้เฉพาะตัวอักษรแรกของคำเป็นตัวพิมพ์ใหญ่
    • กด Enter เพื่อใช้สูตร

เทคนิคแปลงข้อมูล
จัดระเบียบและปรับโครงสร้างข้อมูลเพื่อการวิเคราะห์ที่ดีขึ้น รวมถึงการแยกข้อความ และการใช้เครื่องมือ Flash Fill

  1. การแยกข้อความออกจากเซลล์ (Text to Column)
    • เลือกข้อมูล ที่ต้องการแยก
    • ไปที่แท็บ Data และคลิก Text to Column
    • เลือก Delimited หากข้อมูลที่มีคั่นด้วยเครื่องหมายชัดเจน และคลิก ถัดไป
    • หรือเลือก Fixed Width หากข้อมูลไม่มีเครื่องหมายคั่น แต่ต้องการแบ่งคอลัมน์จากความกว้างที่กำหนดคั่นเอง
    • คลิก เสร็จสิ้น
  2. เติมข้อมูลอัตโนมัติ (Flash Fill)
    • ป้อนข้อมูล ตามรูปแบบในเซลล์ถัดจากข้อมูลที่มีอยู่
    • ใส่ตัวอย่างอื่น ในเซลล์ถัดไปเพื่อช่วย Excel ตรวจจับรูปแบบได้
    • กดเลือกเซลล์ ที่มีตัวอย่าง
    • ไปที่แท็บ Data คลิกที่ Flash Fill
    • Excel จะเติมเซลล์ที่เหลือโดยอัตโนมัติตามรูปแบบที่ตรวจพบจากตัวอย่าง

เทคนิคจัดรูปแบบตัวเลขและวันที่
จัดรูปแบบและทำให้ข้อมูลตัวเลขและวันที่เป็นมาตรฐาน มีรูปแบบสอดคล้องกัน

  1. จัดรูปแบบตัวเลขและเครื่องหมายตัวเลข
    • เลือกเซลล์ ที่มีตัวเลขที่ต้องการแก้ไข
    • ไปที่แท็บ Home คลิกเมนู Drop down เพื่อเลือกรูปแบบข้อมูล ค่า Default อาจจะเป็น General หรือ Number อยู่
    • กด More Number Formats และเลือก รูปแบบตัวเลข ที่เหมาะสมกับข้อมูล (เช่น ทั่วไป, ตัวเลข, สกุลเงิน)
  2. จัดรูปแบบวันที่และเวลา
    • เลือกเซลล์ที่มีวันที่
    • ไปที่แท็บ Home
    • คลิกเมนู Drop down เลือกรูปแบบ วันที่แบบสั้น หรือ วันที่แบบยาว

คำแนะนำเพิ่มเติมสำหรับมือใหม่
สำหรับใครที่เพิ่งเริ่มเรียน Data Analytics และไม่คุ้นเคยกับการทำ Data Cleansing ควรเริ่มต้นจากข้อมูลขนาดเล็กก่อนจะทำได้ง่ายกว่า และอย่าลืมศึกษาโครงสร้างและความหมายของข้อมูลก่อนเริ่มทำความสะอาด รวมถึงบันทึกขั้นตอนการทำความสะอาดข้อมูล เพื่อใช้ในการอ้างอิงได้ในภายหลังว่าได้ทำอะไรกับข้อมูลไปแล้วบ้าง

สรุป
การทำความสะอาดข้อมูลเป็นขั้นตอนที่สำคัญในงานวิเคราะห์ข้อมูล เพื่อให้ได้ผลลัพธ์ที่ถูกต้องและแม่นยำ การเลือกใช้เทคนิคและเครื่องมือที่เหมาะสมจะช่วยให้คุณสามารถทำความสะอาดข้อมูลได้อย่างมีประสิทธิภาพ


สำหรับผู้สนใจเรียน Data Analytics ทักษะแห่งอนาคต เพื่อต่อยอดการทำงาน เพิ่มเงินเดือน หรือย้ายสายงาน True Digital Academy กำลังเปิดหลักสูตรอบรมทักษะ Data Analytics สุดเข้มข้น “Data Ready Bootcamp” สอนครบทั้งวิธีคิด-กระบวนการ-เครื่องมือจำเป็น ทุกทักษะ ที่ Data Analyst ต้องมี สนใจดูรายละเอียดเพิ่มเติม และสมัครเรียนได้ที่นี่ https://www.truedigitalacademy.com/course/data-ready-bootcamp