สรุปประเด็นสำคัญจาก Event ‘เปิดโลก Data Science : From Big Data to Big Impact’ Chapter 1

สรุปประเด็นสำคัญจาก Event ‘เปิดโลก Data Science : From Big Data to Big Impact’ Chapter 1

Data

9 นาที

06 พ.ค. 2022

แชร์

สรุปประเด็นสำคัญจาก Virtual Event ‘เปิดโลก Data Science : From Big Data to Big Impact’ Chapter 1

หากสนใจอยากเริ่มต้นในสายอาชีพ Data Science ไม่ว่าจะเป็น Data Scientist, Data Analyst หรือ Data Engineer แต่ไม่รู้จะเริ่มจากตรงไหน อยากได้คำแนะนำเรื่องทักษะที่จำเป็นในสายงาน Data Science หรือสนใจเรื่อง Big Data วันนี้เราได้ทำการสรุปโลกแห่ง Data Science มาไว้ตรงนี้เรียบร้อยแล้ว


ในอีเวนต์เปิดโลก Data Science Chapter 1 นี้ เราได้ชวน Speakers ผู้ทำงานในสาย Data มาเล่าประสบการณ์ และมอบความรู้ด้าน Data Science ให้ทุกคน ได้แก่ คุณธนธัส เชวงวรกุล Software Engineer, Agoda และ คุณทะนุพงศ์ รัตนเศวตสรรค์ Data Scientist, True Corporation และ Alumni ในคอร์สเรียน Data Science Immersive รุ่น 1 ของ True Digital Academy  ดำเนินรายการโดย ผศ.ดร.อรรถพล ธํารงรัตนฤทธิ์ หรือ อาจารย์เต้ Lead Data Instructor แห่ง True Digital Academy 

ไม่รอช้า เราจะพาทุกคนไปทำความรู้จักโลกของ Data Science ผ่านบทสัมภาษณ์นี้กันเลย

หน้าที่ความรับผิดชอบของ Data Scientist มีอะไรบ้าง?

คุณดิปแบ่งงานออกเป็น 3 ส่วน ด้วยอัตราส่วน 30 : 30 : 40 “30” แรกเป็น Daily Task คอยซัพพอร์ต Business Team ซึ่งออกจะเป็นงานในรูปแบบ Data Analyst มากกว่า Data Scientist ด้วยในปัจจุบันอาจจะมีน้อยบริษัทมากที่พนักงานจะได้ทำงาน Data Science แบบเพียวๆ ในหลายๆ ที่อาจเป็นการผสมๆ กันไป ซึ่ง Daily Task นี้อาจเปลี่ยนไปเรื่อยๆ ตามอายุงาน ในบริษัทที่เพิ่งก่อตั้งแผนกนี้ หน้าที่ที่ต้องรับผิดชอบก็อาจจะเป็นในเรื่องของ Data Engineering การจัดการข้อมูลต่างๆ และนำมาใช้  “30” ต่อมาเป็นการประชุม พูดคุย คิดงานกับทั้งลูกค้าและทีมภายใน และอีก “40” ให้หลังถึงจะเป็นงานที่เป็น Data Science จริงๆ

ส่วนคุณโอ๊ตได้อธิบายหน้าที่ความรับผิดชอบ ในมุมของคนที่ทำ AI เป็นหลักมากกว่า ซึ่งปกติในการทำ AI จะมีการทำรีเสิร์ช มีหัวข้อหัวข้อหนึ่งอยู่ในหัวอยู่แล้ว เช่นเราจะแก้ปัญหาเรื่องอะไร พัฒนาในจุดไหน จะทำ Solution ใดๆ ขึ้นมาเพื่อให้จุดนี้ดียิ่งขึ้น คุณโอ๊ตได้ยกตัวอย่างหัวข้อที่ทำการรีเสิร์ชอยู่ในช่วงนี้ คือ ‘การอ่านปาก (Lips Reading)’ คุณโอ๊ตก็จะมีเป้าหมายอยู่แล้วว่าต้องการอะไร และขั้นตอนการทำงานก็จะเป็นการนำ Data มาขุดคุ้ย ซึ่งพอเป็น Data ในรูปแบบวิดีโอภาพ ไม่ใช่ตัวเลขที่ชัดเจน การนำ Data มาใช้งานจึงค่อนข้างหนักหนาพอสมควร ต่อจากนั้นก็จะทำการปั้นโมเดล ตั้งสมมติฐานหนึ่งขึ้นมา ลองใช้วิธีต่างๆ คล้ายกับนักวิทยาศาสตร์ทำการทดลองสิ่งใดสิ่งหนึ่ง

จะเห็นว่าหน้าที่ของ Data Scientist ในแต่ละบริษัทก็มีการทำงานที่แตกต่างกันออกไป บางบริษัทอาจจะเป็น Data Scientist ที่ทำ AI เพียวๆ มี Data มาให้อยู่แล้ว ไม่จำเป็นต้องแตะด้าน Business มาก บางบริษัทอาจจะไม่ต้องรับหน้าที่ Data Engineer เอง ขึ้นอยู่กับบริษัทแตกต่างกันไป 

สิ่งที่ยากที่สุดของอาชีพ Data Scientist คืออะไร?

คุณโอ๊ตเลือกให้การทำงานกับ Data เป็นส่วนที่ยากที่สุด ในการสร้างโมเดลหนึ่งขึ้นมา จุดที่แตกต่างกันในแต่ละโมเดลคือ Data และ Use Case จุดท้าทายคือการเตรียม Data วางแผนว่าจะนำ Data มาทำอะไร ต้องใช้วิธีการแบบใด อาจจะเป็นช่วงที่กินเวลามากที่สุด แต่ก็เป็นสิ่งสำคัญที่สุดในสายงานนี้เช่นกัน

คุณดิปก็เสริมอีกเช่นกัน ว่าในการทำโมเดลโมเดลหนึ่ง การทำฟีเจอร์ยากกว่าการทำโมเดลเสมอ เมื่อยิ่งเป็นโจทย์ที่มาจากทางทีม Business สิ่งที่ทำต้องไปในแนวทางเป้าหมายเดียวกับสิ่งที่ทีม Business คิด และอีกจุดท้าทายที่มองเห็น คือการใช้ความสามารถของเราอย่างสมดุล การตอบคำถามให้ได้ว่าสิ่งที่ทำ ตอบโจทย์ในแง่ธุรกิจอย่างไรบ้าง ในทางโมเดลอาจดีมาก แต่ก็อาจไม่สามารถใช้งานได้ หากไม่สามารถตอบโจทย์ในแง่ธุรกิจได้ ในทางกลับกัน หากในแง่ธุรกิจดี แต่การเขียนโค้ดใช้เวลานาน ก็อาจจะยังไม่ดีพอเช่นกัน ความสนุกของงาน Data Scientist อาจเป็นการสมดุลความสามารถของตนเอง เพื่อให้งานออกมาดีที่สุด

โดยรวมแล้ว จุดท้าทายของการเป็น Data Scientist คือการที่ต้องมีทักษะในหลายๆ ด้าน ทั้งเรื่อง Technical ที่ต้องเขียนโค้ดให้เป็นจริงๆ และมุมมองด้านธุรกิจ ทำโมเดลอย่างไรให้ตอบโจทย์ธุรกิจ การพิจารณาถึงข้อจำกัดทางธุรกิจต่างๆ
และอีก Soft Skill ที่สำคัญคือการสื่อสาร สื่อสารกับฝ่ายอื่นๆ ทั้งฝ่ายที่รับผิดชอบ Data รับผิดชอบผลิตภัณฑ์ หรือฝ่าย Business Development 

แล้วเมื่อต้องรู้ให้รอบด้านแบบนี้ การเตรียมตัวสัมภาษณ์งานให้ครอบคลุมทั้งหมด ควรทำอย่างไรบ้าง? 

คุณดิปได้เล่าว่าการสัมภาษณ์ที่พบมาจะมีสองส่วน คือ 1. การสอบ Coding ซึ่งความยากง่ายจะขึ้นอยู่กับเวลาที่ได้รับมอบหมาย อาจจะเป็นโจทย์ที่ให้ทำต่อหน้าผู้สัมภาษณ์ หรือโจทย์ที่สามารถนำกลับไปทำที่บ้านได้ เป็นขั้นตอนที่ใช้วัดทักษะพื้นฐาน ความเข้าใจใน Tools ที่ใช้ในการทำงาน และ 2. ความรู้ด้าน Business โดยเฉพาะกลุ่มบริษัทสตาร์ทอัป รีเทล หรืออีคอมเมิร์ซ เราอาจได้รับโจทย์ที่เกี่ยวข้องกับธุรกิจมากกว่า โจทย์ที่มาจากปัญหาจริงๆ ที่เกิดขึ้นในบริษัทนั้นๆ สิ่งที่อยากแนะนำให้เตรียมตัวคือ อาจจะคิดเอาไว้ล่วงหน้า ว่าถ้าเป็นบริษัทนี้ ปัญหาที่อาจเกิดขึ้นคืออะไร แล้วจะหาทางแก้ปัญหาได้อย่างไร 

อีกทั้งยังอยากให้สนใจ Job Description ของแต่ละบริษัท ว่าทางบริษัทมีความต้องการใดกับตำแหน่งที่ตามหา เพื่อให้เตรียมตัวได้ตรงจุดที่สุด

คุณโอ๊ตได้อธิบายความหมายของ AI Machine Learning ว่าเป็นกล่องบางอย่างที่เราสามารถทำอะไรก็ได้ AI หรือ Machine Learning เป็นเหมือนเครื่องมือหนึ่งอย่าง ที่มีไว้เพื่อทดแทนหน้าที่บางอย่างของมนุษย์ เช่น Face Recognition ในโทรศัพท์มือถือที่มีไว้เพื่อปลดล็อกตัวเครื่อง

“AI ต่างๆ ขึ้นอยู่กับบริบทว่าถูกสร้างมาเพื่อทำสิ่งใด 
ไม่ใช่ว่าสร้าง AI หนึ่งตัวแล้วจะสามารถแก้ปัญหาได้ทุกปัญหา 
เราต้องมองว่า AI เป็น Tool หนึ่งอย่าง”

ซึ่ง AI ถูกสร้างขึ้นมาจาก Data เฉกเช่นเดียวกับมนุษย์ที่เวลาจะทำอะไรบางอย่าง สิ่งหนึ่งที่ต้องมีก่อนคือ ความรู้ในเรื่องนั้นๆ AI ก็เช่นกัน AI จะทำการดูข้อมูล ทำความเข้าใจข้อมูลนั้น และทำงานออกมาให้ได้ตามที่เราต้องการ จากนั้นค่อยนำข้อมูลที่ได้จากการใช้ AI มาต่อยอดในทางธุรกิจ ใช้ความรู้ Data Engineering เชื่อมข้อมูลเข้ากับกิจกรรมด้านการตลาด ใช้ Big Data ทำให้ธุรกิจก้าวไปในทิศทางที่ดีขึ้น

เมื่อได้ข้อมูลมาอยู่ในมือ ขั้นต่อไปก็เป็นการนำ Tools ต่างๆ เข้ามาใช้ ต้องเลือกดูว่ามี Tools อะไรที่สามารถใช้ได้ ซึ่งแต่ละตัวก็มีข้อดีและข้อจำกัดแตกต่างกันไป โมเดลที่แม่นที่สุดอาจจะไม่ได้ดีที่สุดเสมอไป แล้วแต่กรณี

AI Lips Reading ที่ยกตัวอย่างขึ้นมาในข้างต้นคืออะไร? ทำอะไรได้บ้าง?

คุณโอ๊ตได้อธิบายว่าการทำรีเสิร์ชในเรื่องนี้ เป็นการทำเพื่อแก้ปัญหาบางอย่างที่เฉพาะเจาะจงมาก จึงทำให้อาจยังหา Value ในเชิงธุรกิจไม่ได้มาก แต่เป้าหมายของการทำรีเสิร์ชนี้คือ เวลาที่วิดีโอคอลหรือทำฟังก์ชันใดๆ สำหรับผู้พิการทางการได้ยิน เราสามารถใช้โมเดลนี้ตัดขั้นตอนการใส่ซับไตเติล ออกไปได้ 

โดยความยากคืออาจมีข้อจำกัดหลายๆ อย่าง เช่น แสงในวิดีโอต้องเพียงพอ เห็นปากผู้พูดชัดเจน แต่โดยรวมแล้ว หากทำโมเดลนี้ให้สำเร็จขึ้นมาได้ ก็สามารถนำไปต่อยอดอื่นๆ ได้มากมายเช่นกัน

“ต่อให้โมเดลดียังไง แต่ถ้าไม่สามารถหา Business Value ได้ มันก็แทบจะไร้ประโยชน์ในทันที
หนึ่งอย่างที่สำคัญมากของ Data Scientist คือ หากทำ Product ออกมาแล้ว เราต้องขายมันด้วย”

คำว่า ‘Big Data’ เมื่อไหร่ถึงจะนับว่า Big แล้วเอาความ Big นี้มาใช้ประโยชน์อย่างไร?

ฐานข้อมูล Big Data ในเชิงธุรกิจมีขนาดมหาศาล ข้อมูลในแต่ละวัน คนคนหนึ่งซื้ออะไร ซื้อเยอะแค่ไหน ลูกค้าคือใคร ใช้ส่วนลดอะไร ข้อมูลเหล่านี้จะเพิ่มปริมาณขึ้นในแต่ละวัน เป็น Data ที่เพิ่มขึ้นเรื่อยๆ ไม่เหมือนการทำรีเสิร์ชที่อาจไปเก็บ Data มาเพียงหนึ่งเดือนแล้วจบ แต่ Data ในเชิงธุรกิจเพิ่มมากขึ้นทุกวัน

แล้วจะนำ Big Data ที่รวบรวมไว้นี้ มาทำให้เกิด Impact ได้อย่างไร?

หลังจากได้ Data มาแล้ว ก็จะมีโจทย์ต่อไปคือ ธุรกิจสามารถทำอะไรกับ Data เหล่านี้ได้บ้าง หากยึด Business เป็นหลัก เมื่อมีโจทย์ว่าอยากจะทำอะไรสักอย่าง สิ่งที่เราต้องคิดคือจะสามารถสร้างโมเดลอะไรมาตอบโจทย์สิ่งๆ นั้นได้ ตัวอย่างเช่น หากต้องการเปิด TRUE Shop หนึ่งสาขา เราจะนำอะไรไปขาย ผลิตภัณฑ์รุ่นใด แบบไหน ต้องการพนักงานกี่คน สิ่งที่ทำได้คือการวิเคราะห์ Data ย้อนหลัง เพื่อหา Insight ต่างๆ ออกมา และแต่บริษัทก็จะมีแพลตฟอร์มใช้จัดการ Data ที่แตกต่างกัน ใช้ภาษาโปรแกรมมิ่งแตกต่างกัน การจะสร้างโมเดลขึ้นมาให้ตอบโจทย์ธุรกิจ ก็จะมีการดึงข้อมูลออกมาใช้เป็นหลักล้าน เป็น Big Data ที่ Big จริงๆ ไม่ได้พูดให้ดูเท่เฉยๆ 

หรือการใช้ Big Data ในเชิง Software Development เวลาต้องการจะพัฒนาฟีเจอร์บางอย่างในแอปพลิเคชันหรือเว็บไซต์ สิ่งใดจะทำให้แน่ใจได้ว่าเมื่อทำไปแล้ว User จะพอใจกับฟีเจอร์นั้นๆ สิ่งที่ทำคือต้องทำการทดลองกับมันก่อน ลงมือทำ AB Testing ที่เป็น Signature ของบริษัท Tech สมัยใหม่ คือการเลือก User ออกมาแค่ 10% ให้ User 10% นั้นได้ทดลองใช้ฟีเจอร์ใหม่ที่สร้างขึ้น จากนั้นทำการเก็บข้อมูล สำรวจ Behavior และ Matrix ต่างๆ ของผู้ใช้ หากข้อมูลที่ได้ชี้ให้เห็นว่า User พอใจกับฟีเจอร์นี้ จึงค่อยเปิดให้ User ทั้งหมดได้ใช้งาน

หรือในกรณีของ Facebook ที่เมื่อเราดูวิดีโอในแอปฯ เมื่อดูเกิน 30-40 วินาทีแล้วเลื่อนต่อ วิดีโอที่พบต่อจากนั้นก็มักจะเป็นวิดีโอจากผู้ใช้คนเดียวกัน หรือประเภทเดียวกัน นี่คือการเก็บข้อมูลเช่นกัน เป้าหมายของการเก็บข้อมูลเช่นนี้คือเพื่อให้สามารถขายโฆษณาได้ 

หากจะถามว่า Big Data ที่ว่า มัน Big แค่ไหน? 

ยกตัวอย่างง่ายๆ คือ สมมติว่ามี User อยู่ 10 ล้านคน และมีการเก็บข้อมูลการคลิกทุกครั้งของ User แต่ละคน หาก Flow การซื้อของบางอย่างทำให้ User ต้องกด 20 คลิก ข้อมูลปริมาณมหาศาลที่เลือกเก็บนี้อาจสูงถึงกว่าพันล้านคลิก เป็นจำนวน Data ที่ใหญ่มาก 

และเหตุที่ต้องใช้ Big Data ก็เพราะ Effect ต่างๆ ที่เกิดขึ้นนั้นเล็กมากในทางสถิติ อาจจะเพิ่มขึ้นเพียง 0.001% แต่เมื่อนำไปคูณกับ Data ทั้งหมดก็อาจมีผลลัพธ์หลายล้าน ดังนั้นเวลานำ Data มาใช้จึงต้องใช้จำนวนมาก ไม่เช่นนั้นอาจไม่เห็น Effect 

วิธีที่ดีที่สุดที่จะก้าวสู่การเป็น Data Scientist 

เพราะไม่ใช่ทุกคนจะมีทักษะครบทุกด้านตั้งแต่แรกเริ่ม สำหรับคนที่เริ่มใหม่ อยากจะเรียนรู้เพื่อมาเป็น Data Scientist ควรเริ่มต้นอย่างไร?

คุณดิปแนะนำว่าให้ศึกษาตัวเองก่อนว่าขาดสิ่งไหนไป ยกตัวอย่างอย่างในกรณีคุณดิปเอง ก็เริ่มต้นจากการเขียนโค้ดไม่เป็นเลย แต่ด้วยความสนใจก็ไปเรียนรู้เพิ่มเติม จากคอร์สออนไลน์ต่างๆ จากนั้นเริ่มโยกย้ายตัวเองไปทำงานที่เกี่ยวข้องกับ Business มากขึ้น ให้ได้มุมมองว่าโจทย์ที่ปกติฝ่าย Business ทำนั้นคืออะไร จากนั้นค่อยๆ ประกอบร่างออกมาให้เห็นภาพมากยิ่งขึ้น 

การฝึกทำ Challenge ในอินเทอร์เน็ต ฝึกทำโจทย์ต่างๆ ก็เป็นการฝึกนำทักษะ 3 ส่วน ซึ่งคือ Coding, Business, และ Statistic มาประกอบร่างกัน สามสิ่งที่หากจะเป็น Data Scientist ที่ดีแล้ว ย่อมทิ้งสิ่งใดสิ่งหนึ่งไปไม่ได้

ประสบการณ์การเรียนคอร์ส Data Science Immersive เป็นยังไงบ้าง?

คุณดิปให้ความเห็นว่า ความรู้ที่ได้รับในคอร์ส อาจเทียบเท่าระยะเวลา 2 ปีจากการทำงานจริง บางทีทำงานไป 5 ปีอาจจะเจอโปรเจกต์ไม่ครบทุกแบบเลยด้วยซ้ำ แต่คอร์สนี้มีมาให้ได้สัมผัสทั้งหมด เมื่อเคยเรียนมาหรือเคยทำมาแล้วจากคอร์ส ก็จะทำให้เห็นภาพเมื่อไปทำงานจริง  

แนะนำวิธีการเรียนสำหรับผู้ที่อยากเปลี่ยนสายมาด้าน Data Science

คุณโอ๊ตแนะนำว่าหากไม่รู้จริงๆ ว่าควรเริ่มต้นจากอะไร เพราะด้วยความที่สาย Data Science มีความหลากหลายมาก ไม่ว่าจะเป็น Data Engineering การทำ AI การเขียนโปรแกรม ฯลฯ บางครั้งการเรียนคอร์สออนไลน์ที่มีการคัดและกลั่นกรองความรู้มาแล้วว่ามีประโยชน์ก็สามารถช่วยส่งเสริมให้เราเรียนรู้ได้ดีขึ้น ซึ่งคอร์สการเรียนก็มักจะมาพร้อมกับ Use Case ในธุรกิจจริงๆ 

นอกจากนั้นก็ต้องหาประสบการณ์จากการทำ Kaggle แล้ว Kaggle คืออะไร? 

Kaggle เป็นเหมือนแพลตฟอร์มรวบรวม Data ที่สามารถเปิด Public ได้ มักจะมี Developer, Software Engineer, และ Data Scientist หลายๆ คนเข้ามาช่วยลงมือ วิเคราะห์ ทำโมเดล หา Insight ต่างๆ คล้ายๆ ว่าเป็นห้องสมุดห้องหนึ่ง แต่แทนที่จะเป็นหนังสือ กลับเป็น Use Case ของ Data Science เหมาะมากในกรณีที่ไม่รู้จะเริ่มต้นอย่างไรกับเคสที่ถืออยู่ เราสามารถเข้าไปดูความเห็นของคนจากทั่วโลก มุมมอง Insight ต่างๆ ของแต่ละคน เป็นการได้ทดลอง และสร้างประสบการณ์ที่ดี 

อะไรที่จุดไฟ Passion ให้ทำงานในสายนี้ต่อไป?

คุณดิปได้เล่าว่า ก่อนจะ Passion ใน Data Science เขามี Passion จาก Data ก่อน ทุกวันที่ทุกคนคงเคยได้ยินคำว่า Data Driven Business กันบ่อยครั้ง การที่เราทำสิ่งใดสิ่งหนึ่ง และอยากได้เหตุผลรองรับ เป็นตัวเลขที่จับต้องได้ Data Driven คือการนำข้อมูลที่มี มาใช้กับโปรเจกต์จริงๆ ซึ่งความสนุกของมันคือความท้าทายที่เกิดขึ้น เมื่อโจทย์เปลี่ยนไปทุกวัน แนวคิด การทำโจทย์ในทางธุรกิจก็เปลี่ยนแปลงตลอดเวลา แต่ด้วยความที่ทุกธุรกิจล้วนต้องการ Data Science จึงทำให้เหล่า Data Scientist มีโอกาสกระโดดไปทำอะไรได้หลากหลาย 

ส่วนคุณโอ๊ตที่มีความชอบในเรื่อง AI และ Data มาตั้งแต่สมัยเรียนบอกว่า แม้ตอนจบมาจะยังเป็นแค่ Research Assistant หรือทำแค่ด้าน AI เป็นหลัก แต่คุณโอ๊ตก็มีความสุขเพราะความชอบ ในปัจจุบัน Data Science เป็นสายงานที่ค่อนข้างมาแรง ไม่ใช่แค่ในประเทศไทย แต่ทั่วโลก จึงทำให้อาชีพ Data Scientist ยังมีโอกาสโตได้อีกเยอะ ในช่วงนี้เป็นช่วง Digital Transformation ที่คนต้องการจะเปลี่ยนทุกอย่างจากกระดาษ เข้าสู่แพลตฟอร์มที่เป็น Database หรือ Tools อื่นที่เหมาะกับการทำเป็น Big Data เมื่อผ่านช่วงนี้ไปแล้ว หากถึงยุคที่มีข้อมูลมากพอ มีไซต์ที่ต้องการมากขึ้น อาชีพ Data Scientist ก็อาจเติบโตยิ่งขึ้นไปอีกขั้นเช่นกัน

Virtual Event เปิดโลก Data Science ยังมีต่อใน Chapter 2 รอติดตามอ่านสรุปกันได้เร็วๆ นี้ 

—————————————————————-
สำหรับใครอัปสกิลเพื่อก้าวเข้าสู่สายงาน Data Scientist ไปกับคอร์ส Data Science Immersive จาก True Digital Academy สมัครได้แล้ววันนี้ คลิก https://bit.ly/3u17RBB
—————————————————————-
ติดตามได้ทางโซเชียลมีเดียต่างๆ ของ True Digital Academy ดังต่อไปนี้
Website – https://bit.ly/3ts5KGG
Facebook – https://bit.ly/3KeUFzj
LinkedIn – https://bit.ly/3hEdKig
Instagram – https://bit.ly/3Cf4BG9

แชร์