สรุปประเด็นสำคัญจาก Event ‘เปิดโลก Data Science : From Big Data to Big Impact’ Chapter 2

สรุปประเด็นสำคัญจาก Event ‘เปิดโลก Data Science : From Big Data to Big Impact’ Chapter 2

Data

7 Min

09 May 2022

Share

สรุปประเด็นสำคัญจาก Virtual Event ‘เปิดโลก Data Science : From Big Data to Big Impact’ Chapter 2

สรุปเนื้อหาจาก Virtual Event เปิดโลก Data Science | From Big Data To Big Impact Chapter 2 ถาม-ตอบทุกข้อสงสัย ก่อนก้าวเข้าสู่โลกของ Data Science

ในอีเวนต์เปิดโลก Data Science ใน Chapter ที่ 2 เป็นการแชร์ประสบการณ์จากวิทยากรผู้คร่ำหวอดในวงการ Data Scientist 2 ท่าน ได้แก่คุณพรพระ ชำนาญวนิชกุล Data Analytics, บริษัท ปตท. น้ำมันและการค้าปลีก จำกัด (มหาชน) (PTTOR) และ คุณณฐนพ พิมลเสถียร Data Specialist จาก Unilever กับหลากหลายประเด็นที่น่าสนใจ และเป็นประโยชน์สำหรับผู้ที่ต้องการเข้าสู่สายงาน Data Science

ทั้งนี้จุดเริ่มต้นของวิทยากรทั้งคู่ที่ไม่ได้เริ่มต้นจากการเรียนจบมาตรงสาย แต่ด้วยพื้นฐานความรู้และโอกาสสำคัญที่ช่วยจุดประกายกับการเข้ารับหน้าที่สำคัญในสายงานด้าน DS พร้อมเผยประสบการณ์ในโลกของการทำงานจริงที่ท้าทายและต้องอาศัยการเรียนรู้ใหม่ๆ ที่หาไม่ได้ในห้องเรียน พ่วงด้วยมุมมองต่อสายงาน Data Science ที่น่าสนใจในหลากหลายประเด็น ปิดท้ายด้วยมุมมองที่มีต่ออาชีพนี้ในอนาคต


เนื้อหาข้อมูลที่น่าสนใจเกี่ยวกับโลก Data Science มีดังต่อไปนี้ . .

อยากเป็น Data Scientist จำเป็นต้องเรียนจบตรงสายไหม?

การศึกษาถือเป็นหนึ่งในองค์ประกอบสำคัญเป็นเหมือนใบเบิกทาง หรือเข็มทิศในการช่วยเลือกเส้นทางที่เหมาะสมในการประกอบอาชีพแต่หลังจากชีวิตของคนเราพ้นจากรั้วมหาวิทยาลัยเพื่อก้าวสู่มหาลัยชีวิต ประสบการณ์ในการทำงาน ตลอดจนโอกาสในการได้รับความรู้ใหม่ ๆ จะช่วยเปิดโลกทัศน์และวิสัยทัศน์ใหม่ๆ ให้เรา

เช่นเดียวกับการทำงานในสายของ Data Scientist ที่วิทยากรทั้งสองคนไม่ได้เรียนจบมาตรงสายซะทีเดียว คุณต้นจบมาทางด้านวิศวกรรมไฟฟ้า ส่วนคุณแฮมจบทางด้าน Engineering Management แต่ด้วยจุดร่วมของรูปแบบในการทำงานที่ต้องเจอ หรือการได้เรียนรู้เพิ่มเติมในระดับที่สูงขึ้น เปิดโอกาสให้ทั้งสองได้สัมผัสกับโลกของการทำงานกับ Data จนเกิดเป็นความชื่นชอบ และประสบการณ์ใหม่ๆ ที่สามารถนำมาต่อยอดได้ในการประกอบอาชีพ โดยเฉพาะการทำหน้าที่ Data Scientist ซึ่งเป็นอาชีพที่ มุมมอง ความรู้ และความท้าทายใหม่ๆ เกิดขึ้นได้ในทุกวัน

“โลกของDataScientistมีอะไรที่มากกว่าในตำราเสมอ โจทย์ในตำราเรียนกับโจทย์ในชีวิตจริงเป็นสิ่งที่แตกต่างกัน การทำงานในชีวิตจริงย่อมท้าทายกว่าเสมอ”

คุณแฮมยกตัวอย่างในคลาสเรียนที่สิ่งต่างๆ มีการสรุปมาให้แล้ว เช่น มี Data Set หรือ มี Label มาให้ ผู้เรียนแค่ฝึกทำโมเดลให้ได้ตามที่ต้องการ แต่ในโลกของการทำงานไม่ได้มี Data set หรือ Label มาให้ ทางออกของปัญหา คือ ต้องลงมือสังเคราะห์ชุดของ Data ออกมาเอง ต้องคิดว่าควรจะเลือกใช้ Label อะไร ยกตัวอย่างเช่น หากเรามีหน้าที่ต้อง Predict sales ก็ต้องคิดว่า ควรเป็น sales ของอะไร Department ไหน ของช่องทางไหน ซึ่งจะมีคำถามเกิดขึ้นมากมายระหว่างทางกว่าที่เราจะสร้าง Label หรือสร้าง Target ขึ้นมาได้ ยิ่งไปกว่านั้นพอทำเสร็จแล้ว ก็จะมีโจทย์ให้คิดต่ออีกว่า จะเอาไปใช้งานอะไรต่อ? ซึ่งเป็นสิ่งที่ต้องมาเรียนรู้นอกจากทางเทคนิค นอกบทเรียน

คุณต้นเสริมว่าหน้าที่ของ Data Scientist คือ การทำงานเพื่อตอบโจทย์ Business ดังนั้นต้องเข้าใจก่อนว่า Business ต้องการอะไร เพราะถ้าหากทำโมเดลออกมาแล้ว ท้ายที่สุดสิ่งที่ทำไม่สอดคล้องกับสิ่งที่ธุรกิจอยากจะไป ก็ไม่มีทางได้เอาโมเดลมาใช้จริง อีกหนึ่งประเด็นที่สำคัญ คือ เรื่องของคำแนะนำที่จะเอาไปคุยกับลูกค้า หรือ เรื่องทางเทคนิคที่จะอธิบายให้คนที่ไม่มีความรู้เกี่ยวกับ Data ฟัง โจทย์ คือ เราจะ Provide อะไรให้เขา เพราะบางทีลูกค้าไม่ได้อยากรู้ในประเด็นความแม่นยำของโมเดล แต่อยากรู้แค่เรื่อง How to Use หรือ How to Apply มากกว่า เป็นต้น

ความท้าทาย และความสนุก ของการทำงานในสายงาน Data Scientist?

อย่างที่รู้กันว่า การทำงานในสาย Data Scientist นั้นแบ่งออกเป็น 3 ส่วน ได้แก่ Data Analytics คือการวิเคราะห์ข้อมูล อีกส่วนหนึ่ง คือ ด้าน AI หรือ Machine Learning และส่วนที่สามคือ Data Engineering ซึ่งแต่ละส่วนก็จะมีความท้ายทาย และความสนุกของการทำงานที่แตกต่างกันออกไป คุณต้นยกตัวอย่าง งานในส่วน Data Scientist นั้นอาจต้องยุ่งกับ Machine Learning หรือ Algorithm มากหน่อย งานหลักๆ ก็จะเน้นใช้ Forecast ซึ่งค่อนข้างที่จะท้าทาย เพราะต้องทำนายอนาคตล่วงหน้าคล้ายกับหมอดู แต่เป็นการ Base on ข้อมูลทางวิทยาศาสตร์แทน

คุณแฮมเสริมต่อว่า เรื่องที่น่าภูมิใจในการทำงานด้าน Data Science คือการได้พัฒนาอะไรออกไป แล้วสามารถทำนายอนาคตได้ เท่ากับเป็นการช่วยลดภาระในการตัดสินใจต่างๆ เป็นเหมือน Value ที่ใช้เวลานานกว่าจะสำเร็จ

ในแต่ละวัน Data Scientist ทำอะไรบ้าง?

คุณต้นบอกว่า อย่างแรกคือ ต้องเช็คเรื่อง Priority ของงาน สมมติงาน A ต้องรีบส่งก็เข้าสู่ Process ของ Data Analytic ถ้างาน A เป็นแค่การดึงข้อมูลให้กับ Business User อย่างเดียว ก็ใช้แค่ SQL ในการดึงข้อมูลแล้วก็จบไป หรือถ้างานไหนจำเป็นต้อง Run Machine Learning อันนี้ก็ตาม Process เริ่มตั้งแต่การดึงข้อมูล ทำความสะอาดข้อมูล เลือก Algorithm และวัดผลโมเดล ทำแบบนี้ไปเรื่อยๆ ซึ่งอาจคล้ายกับตอนเรียน แต่สิ่งที่ต่าง คือ Dimension ของข้อมูล จะเยอะกว่ามาก ยกตัวอย่าง Transaction ของลูกค้าบางทีเป็นหลักล้านก็มี แล้วบางทีต้องดึงข้อมูลย้อนหลัง 3 เดือน 6 เดือน ก็มีเรื่องของ Time Consume เหมือนกัน

ส่วนคุณแฮม เริ่มจากเช็คอีเมลก่อน ว่ามี Requirement อะไรไหม โดยอีเมลส่วนมากเป็น User ที่ส่งมา ระบบการทำงานของคุณแฮม จะเป็นแบบ Global ที่ต้องคุยกับต่างประเทศ ว่าให้ช่วย Run Test ต่างๆ ให้หน่อย ให้ช่วยดูตัวเลขว่าตรงไหม Data เข้าหรือยัง ซึ่งมี User Request ด้วยเหมือนกันว่าอยากได้ Data แบบ ไหน ให้ช่วยทำให้ พอช่วงสายๆ จะเริ่มทำโมเดล หรือสร้าง Data Set หรือทำการเก็บข้อมูลที่เราต้องการ บางทีต้องคุยกับ Stakeholders ว่าเราต้องการอะไร ทำอะไรไปแล้ว เป็นการ Check-in ต่างๆ ทำแบบนี้ซ้ำไป 5 วัน จนหมดสัปดาห์พอดี

Skill ที่สำคัญสุดสำหรับการเป็น Data Scientist?

คุณต้นให้ความเห็นว่า Business Domain Expertise เป็นเรื่องที่ค่อนข้างสำคัญ คุณต้นมองว่า DS มือใหม่ส่วนใหญ่ จะยังขาดเรื่องของ Business Background ดังนั้นมือใหม่ควรต้องมี Background Knowledge ของสายธุรกิจที่ตัวเองทำงานอยู่ด้วย ซึ่งอาจเป็นเรื่องที่ค่อนข้างท้าทาย เพราะ Know-how ตรงนี้ ไม่ค่อยมีที่ไหนสอน มันจะเกิดขึ้นได้ก็ต่อเมื่อได้เรียนรู้จากประสบการณ์ในการทำงานจริง

ด้านคุณแฮมมองว่าควรเน้นไปที่ความอยากรู้อยากเห็น เพราะจะเป็นเหมือน Interface ที่ทำให้เราได้เข้าไปคุยกับคนที่ใช้ของๆเรา ทำให้เราสามารถเข้าไปคุยกับคนที่จะช่วยให้เราเก่งเรื่องเทคนิคมากขึ้น ความอยากรู้อยากเห็นจะทำให้เราสงสัยอยู่ตลอดเวลา ว่าเราต้องทำแบบนั้นแบบนี้ ยกตัวอย่าง เช่น ดูว่าสิ่งที่เราทำอยู่โอเคหรือเปล่าในเชิงของเทคนิค หรืองานที่ run อยู่จะทำให้เร็วกว่านี้ได้มั้ย ซึ่งทักษะตรงนี้เป็นหนึ่งในสิ่งสำคัญที่นักวิทยาศาสตร์ควรมี

ก่อนจะเป็น Data Scientist มีการ Practice อะไรบ้าง?

คุณต้นกล่าวว่า ต้องลองเล่น ลองฝึก ลอง Explore ไปเรื่อยๆ ส่วนตัวคุณต้นเคยลองฝึกแข่งใน Kaggle ซึ่งเป็น DS Community ที่มีคนเก่งเยอะมาก แล้วก็เคยส่ง Pitching ใน Hackathon ที่เกี่ยวกับ DS คุณต้นมองว่าการลงแข่งรายการต่างๆ เหมือนเป็นอีกหนึ่งลู่ทางสำคัญที่ทำให้เราสามารถ Practice ตัวเอง ที่สำคัญเราจะเจอ Community ที่สนใจในเรื่องเดียวกับเรา ซึ่งตรงนี้จะช่วยให้เราได้เรียนรู้แบบก้าวกระโดดเลย

ด้านคุณแฮม ก็เล่าถึงประสบการณ์ที่เคยร่วม Hackathon เช่นกัน ซึ่งแทบจะไม่ได้หลับได้นอน ตอนนั้นโจทย์ คือ Online Supermarket แล้วอยากรู้ว่ามีอะไรที่ Drive ยอดขายของ Online Supermarket บ้าง มันมีเวลาจำกัด เราก็ต้องเลือกว่าเราจะสร้างโมเดลหรือสร้าง Exploratory Study ต้องตัดสินใจในเวลาที่จำกัด ตอนนั้นสกิลเรายังไม่ค่อยแน่น เพราะเราเขียนโค้ดมาจากที่มันมีข้อมูลอยู่แล้ว แต่พอไปเจอใน Hackathon เขาสมมติให้เราดึงมาจากเซิร์ฟเวอร์ เราก็ต้องมาดีไซน์ว่าเราจะใช้ SQL ดึงยังไง มีเรื่องจุกจิกเต็มไปหมด คุณแฮมแนะนำว่า เวลาที่เราทำโปรเจกต์ไม่ว่าจะเรียนที่ไหนก็ตาม เราควรตั้งใจทำให้ดี แล้วก็พยายาม Publish ขึ้น GitHub ไปเลย เพราะ มันฝึกให้เราเขียนโค้ดเป็นระเบียบ ที่สำคัญยังช่วยลำดับความคิดของเราได้ว่าเราจะสื่อสารออกไปยังไง ถ้าได้ฝึกตั้งแต่ตอนเรียนอันนี้จะคุ้มค่ามาก

อยากทำงานสาย Data Science ควรเริ่มต้นอย่างไร?

คุณต้นมองว่า อย่างแรก คือ ให้ลองเสิร์ชสิ่งที่เราสนใจดูก่อน เพราะทุกอย่างมันคอนเน็คกันหมดแล้ว มีคนเคยมาปรึกษาเหมือนกัน ว่าถ้าอยากจะเริ่มเข้าทางสายงาน DS จะเริ่มต้นยังไงดี คุณต้นเลยตอบไปว่า ให้ลองเสิร์ชดูก่อนว่าเราสนใจอะไร ให้ Career Path ดูก่อน ว่ามันเป็นยังไง เช่น DS ที่เราสนใจ เราสนใจประเภทไหน เช่น DS ในสายประกัน สายธนาคาร พยายามใช้ Specific Keywords แล้วก็เสิร์ชไปเรื่อยๆ เราอาจจะเจอมากขึ้น เพราะ DS มันกว้างมาก น่าจะ Specific หน่อย ว่าเราสนใจ Area ไหน ซึ่งน่าจะเป็นจุดเริ่มต้นที่ดี

คุณแฮมกล่าวเสริมว่า จริงๆ แค่เปิด YouTube แล้วเสิร์ชคำว่า Data Science มันก็น่าจะมาเยอะมาก เราเลือกคอนเทนต์ที่เราจะดูได้เลย อาจจะเริ่มดูเกี่ยวกับพวกรถที่มันวิ่งได้ มีโมเดลที่มันทำแบบนี้ได้นะ ผมว่าน่าจะเริ่มดูจากตรงนี้ก่อน น่าจะช่วยตัดสินใจได้ว่าเราน่าจะชอบทำแบบไหน สเต็ปต่อไปก็คือ คนที่อยากทำจริงๆ ก็อาจจะหาคอร์สออนไลน์มาเรียนเขียน Python ในระดับเริ่มต้นอะไรแบบนี้ แล้วถ้ายังชอบมากจริงๆ การเขียนโปรแกรมมันก็เป็นสกิลที่สามารถไปต่อได้

แต่ว่าการต่อยอดทาง Data Science ส่วนตัวที่คุณแฮมเลือก Journey ป.โท เพราะว่าอยากจะ Invest เวลากับมัน แล้วก็อยากให้มีคนช่วยตัดสินว่า สิ่งที่เราทำ สิ่งที่เราคิด มันดีขนาดไหน การไปลงคอร์สเรียนแม้จะเสียเงินมากกว่าเปิดดูยูทูปเองก็จริง แต่ว่าก็ได้อย่างอื่นเพิ่มมามากขึ้น ได้คอมเมนต์ ได้แลกเปลี่ยนความคิด ได้เจอคนต่างๆ ก็อาจจะเริ่มจากตรงนี้ก่อน เพราะว่าพอมันไปสักพัก มันจะเป็นเรื่องที่เราต้องคุยกับเพื่อน คุยกับอาจารย์ คุยกับคนที่สอนเรา แล้วมันจะทำให้เราสามารถไปได้เร็วและสามารถเลือกได้ว่าอะไรคือสิ่งที่เหมาะสมกับเราต่อไป
—————————————————————-
สำหรับใครอัปสกิลเพื่อก้าวเข้าสู่สายงาน Data Scientist ไปกับคอร์ส Data Science Immersive จาก True Digital Academy สมัครได้แล้ววันนี้ คลิก https://bit.ly/3u17RBB
—————————————————————-
หากชื่นชอบสาระดีๆ แบบนี้ สามารถติดตามอีเวนต์ครั้งต่อๆ ไปได้ทางโซเชียลมีเดียของ True Digital Academy ดังต่อไปนี้
Website – https://bit.ly/3ts5KGG
Facebook – https://bit.ly/3KeUFzj
LinkedIn – https://bit.ly/3hEdKig
Instagram – https://bit.ly/3Cf4BG9