รวม Dataset แจกฟรี ใช้ฝึกวิเคราะห์ข้อมูลเขียน SQL / Python
รวม Dataset แจกฟรี ใช้ฝึกวิเคราะห์ข้อมูลเขียน SQL / Python
Data
3 Min
13 Jun 2024
Share
Share
Table of contents
การเริ่มต้นเรียนภาษาสำหรับการจัดการ หรือวิเคราะห์ข้อมูลต้องอาศัยการเรียนรู้และฝึกฝน ซึ่งแน่นอนว่าข้อมูลที่จะนำมาฝึกนั้นอาจจะสร้างขึ้นเองก็ได้ แต่จะดียิ่งกว่าหากมีโอกาสได้ลองฝึกกับข้อมูลจริงๆ ที่มีความซับซ้อนและคาดเดาได้ยากเหมือนชีวิตการทำงานจริง วันนี้เรารวบรวมเว็บไซต์ ‘Dataset แจกฟรี’ มาให้ เพื่อให้ทุกคนได้ลองเอาไปฝึกเขียน SQL และ Python กัน!
รวมแหล่งดาวน์โหลด Dataset ฟรี
🔗 https://trends.google.com/trends/explore
🔗 https://data.go.th/dataset
🔗 https://abcnews.go.com/538
🔗 https://www.kaggle.com/
🔗 https://developer.imdb.com/non-commercial-datasets/
🔗 https://insideairbnb.com/get-the-data/
🔗 https://www.earthdata.nasa.gov/
รวมแหล่งดาวน์โหลด Dataset ฟรี
1. Google Trends
คงจะไม่มีใครที่ไม่เคยใช้ Google ดังนั้นนี่จึงเป็นแหล่ง Dataset ที่ใหญ่ที่สุดแหล่งหนึ่ง เพราะทุกอย่างที่ถูกค้นหาจะถูกติดตามและบันทึกไว้ โดยจัดเรียงข้อมูลไว้อย่างเป็นระเบียบ ข้อมูลที่คุณจะเจอได้ เช่น คำค้นหายอดนิยม หรือดูคำค้นหาที่เกี่ยวข้องกับสิ่งที่เราสนใจ ว่าคนมักจะค้นหาว่าอะไรบ้าง หรือมันถูกค้นหาบ่อยมากแค่ไหน สามารถโหลดเป็นไฟล์ CSV ได้🔗 https://trends.google.com/trends/explore
2. Data.go.th
ข้อมูลกว่าหมื่นชุดจากรัฐบาลไทย สามารถเลือกได้ตามหัวข้อท่ีสนใจ หรือเลือกตามองค์กรที่ต้องการได้ เช่น ดูเป็นรายจังหวัด หรือดูข้อมูลจากกรมต่างๆ โดยมีประเภทไฟล์ให้เลือกหลายหลาย รวมถึง CSV, JSON, XLSX ฯลฯ🔗 https://data.go.th/dataset
3. FiveThirtyEight
นี่ไม่ใช่แค่เว็บรวบรวมข้อมูล เพราะ 538 ยังเป็นเว็บไซต์ข่าวอีกด้วย จึงเหมาะกับผู้ที่สนใจเรื่องการเมืองเป็นพิเศษ คุณจะได้เจอกับข้อมูลจากโพลเลือกตั้งประธานาธิบดีสหรัฐฯ รวมถึงข้อมูลขององค์กรต่างๆ ในสหรัฐฯ ไปจนถึงข่าวกีฬา โดยโหลดเป็นไฟล์ CSV ได้🔗 https://abcnews.go.com/538
4. Kaggle
นอกจาก Kaggle จะรวบรวม Dataset มันยังเป็นคอมมูนิตี้ที่คนจะเข้ามาเผยแพร่ผลงานเกี่ยวกับข้อมูลของพวกเขาอีกด้วย นี่จึงจะเป็นแหล่งเรียนรู้ชั้นดี ที่จะทำให้ได้ทั้ง Dataset ที่น่าสนใจ และเข้าใจการทำงานของ SQL ผ่านผลงานของคนอื่นๆ มากขึ้น ที่สำคัญ Kaggle ยังมีการจัดการแข่งขันต่างๆ เป็นประจำ เพื่อให้คุณได้ฝึกทักษะและลุ้นเงินรางวัล🔗 https://www.kaggle.com/
5. IMDb Data Set
สายหนังคงจะคุ้นเคยอยู่แล้วกับฐานข้อมูลเกี่ยวกับภาพยนตร์ที่ใหญ่ที่สุดอย่าง IMDb ที่มีข้อมูลทั้งผู้กำกับ คนเขียนบท นักแสดง และคนอื่นๆ ที่เกี่ยวข้อง โดยในปัจจุบัน เว็บไซต์ IMDb มีข้อมูลของภาพยนตร์มากกว่า 6 ล้านเรื่องแล้ว และยังมีข้อมูลที่เกี่ยวข้องอีกกว่า 100 ล้านรายการ ถ้าคิดไม่ออกว่าจะเริ่มใช้ Dataset ยังไง ลองเสิร์ชดูก็ได้ว่าคำที่คุณนึกถึงอยู่ตอนนี้ มีในชื่อหนังกี่เรื่อง🔗 https://developer.imdb.com/non-commercial-datasets/
6. Airbnb
ถ้าอยากจองที่พักเมื่อไปเยือนต่างแดน Airbnb คงเป็นอีกชื่อแรกๆ ที่คนนึกถึง ดังนั้น Airbnb จึงมีข้อมูลเกี่ยวกับสถานที่ต่างๆ รวมถึงข้อมูลวิเคราะห์ผู้ใช้เต็มไปหมด ข้อมูลใน Airbnb นี้จึงเหมาะกับคนที่อยากฝึกฝนการเขียน SQL เกี่ยวกับข้อมูลทางภูมิศาสตร์🔗 https://insideairbnb.com/get-the-data/
7. Earthdata
เคยสงสัยไหมว่า NASA เขาทำอะไรกันบ้าง? ข้อมูลเกี่ยวกับสิ่งที่พวกเขาศึกษา รวมไว้ที่นี่แล้ว! อาจจะไม่ถึงขั้นได้เจอตำแหน่ง UFO แต่ก็มีข้อมูลที่น่าสนใจเต็มไปหมดเกี่ยวกับชั้นบรรยากาศโลก การแผ่รังสีแสงอาทิตย์ กระแสน้ำ และการเคลื่อนตัวของเปลือกโลก ซึ่งคุณสามารถรับชมข้อมูลนี้ได้แบบ real-time หรือจะวิเคราะห์ออกมาเป็นฐานข้อมูลก็ได้🔗 https://www.earthdata.nasa.gov/
Source: learnsql.com
อยากเขียน SQL ให้เก่งมากขึ้น ทำยังไงดี?
การเรียนรู้ทักษะใหม่ๆ ต้องอาศัยการเรียนรู้และฝึกฝนอย่างสม่ำเสมอ โดย SQL ก็เป็นภาษาที่ผู้ไม่มีพื้นฐานสามารถเริ่มเรียนรู้ได้ไม่ยากนัก แต่ถ้ามีเวลาและทุนทรัพย์ การลงทุนกับคอร์สเรียน หรือหลักสูตรแบบออนไลน์ ก็จะช่วยให้เรียนรู้ได้อย่างถูกจุดและมีประสิทธิภาพยิ่งขึ้น
สำหรับผู้ที่สนใจ เราขอแนะนำคอร์สเรียน ‘SQLPro: Extract Database For Real-World Success’ เหมาะสำหรับผู้ที่อยากปูพื้นฐานให้แน่น เพื่อก้าวสู่เส้นทาง Data Engineer และ Database Management ด้วย SQL และนำ Generative AI เข้ามาช่วย สอนโดยผู้มีประสบการณ์จริงและเข้าใจผู้เรียน พร้อมให้ผู้เรียนได้ลงมือทำระหว่างคอร์ส
📌ดูรายละเอียดเพิ่มเติม และสมัครเรียนที่นี่ : https://bit.ly/3KJdygi
Share