รวม Dataset แจกฟรี ใช้ฝึกวิเคราะห์ข้อมูลเขียน SQL / Python

รวม Dataset แจกฟรี ใช้ฝึกวิเคราะห์ข้อมูลเขียน SQL / Python

Data

3 Min

13 Jun 2024

Share

การเริ่มต้นเรียนภาษาสำหรับการจัดการ หรือวิเคราะห์ข้อมูลต้องอาศัยการเรียนรู้และฝึกฝน ซึ่งแน่นอนว่าข้อมูลที่จะนำมาฝึกนั้นอาจจะสร้างขึ้นเองก็ได้ แต่จะดียิ่งกว่าหากมีโอกาสได้ลองฝึกกับข้อมูลจริงๆ ที่มีความซับซ้อนและคาดเดาได้ยากเหมือนชีวิตการทำงานจริง วันนี้เรารวบรวมเว็บไซต์ ‘Dataset แจกฟรี’ มาให้ เพื่อให้ทุกคนได้ลองเอาไปฝึกเขียน SQL และ Python กัน!

รวมแหล่งดาวน์โหลด Dataset ฟรี 

1. Google Trends

คงจะไม่มีใครที่ไม่เคยใช้ Google ดังนั้นนี่จึงเป็นแหล่ง Dataset ที่ใหญ่ที่สุดแหล่งหนึ่ง เพราะทุกอย่างที่ถูกค้นหาจะถูกติดตามและบันทึกไว้ โดยจัดเรียงข้อมูลไว้อย่างเป็นระเบียบ ข้อมูลที่คุณจะเจอได้ เช่น คำค้นหายอดนิยม หรือดูคำค้นหาที่เกี่ยวข้องกับสิ่งที่เราสนใจ ว่าคนมักจะค้นหาว่าอะไรบ้าง หรือมันถูกค้นหาบ่อยมากแค่ไหน สามารถโหลดเป็นไฟล์ CSV ได้
🔗 https://trends.google.com/trends/explore

2. Data.go.th 

ข้อมูลกว่าหมื่นชุดจากรัฐบาลไทย สามารถเลือกได้ตามหัวข้อท่ีสนใจ หรือเลือกตามองค์กรที่ต้องการได้ เช่น ดูเป็นรายจังหวัด หรือดูข้อมูลจากกรมต่างๆ โดยมีประเภทไฟล์ให้เลือกหลายหลาย รวมถึง CSV, JSON, XLSX ฯลฯ
🔗 https://data.go.th/dataset

3. FiveThirtyEight

นี่ไม่ใช่แค่เว็บรวบรวมข้อมูล เพราะ 538 ยังเป็นเว็บไซต์ข่าวอีกด้วย จึงเหมาะกับผู้ที่สนใจเรื่องการเมืองเป็นพิเศษ คุณจะได้เจอกับข้อมูลจากโพลเลือกตั้งประธานาธิบดีสหรัฐฯ รวมถึงข้อมูลขององค์กรต่างๆ ในสหรัฐฯ ไปจนถึงข่าวกีฬา โดยโหลดเป็นไฟล์ CSV ได้
🔗 https://abcnews.go.com/538

4. Kaggle

นอกจาก Kaggle จะรวบรวม Dataset มันยังเป็นคอมมูนิตี้ที่คนจะเข้ามาเผยแพร่ผลงานเกี่ยวกับข้อมูลของพวกเขาอีกด้วย นี่จึงจะเป็นแหล่งเรียนรู้ชั้นดี ที่จะทำให้ได้ทั้ง Dataset ที่น่าสนใจ และเข้าใจการทำงานของ SQL ผ่านผลงานของคนอื่นๆ มากขึ้น ที่สำคัญ Kaggle ยังมีการจัดการแข่งขันต่างๆ เป็นประจำ เพื่อให้คุณได้ฝึกทักษะและลุ้นเงินรางวัล
🔗 https://www.kaggle.com/

5. IMDb Data Set

สายหนังคงจะคุ้นเคยอยู่แล้วกับฐานข้อมูลเกี่ยวกับภาพยนตร์ที่ใหญ่ที่สุดอย่าง IMDb ที่มีข้อมูลทั้งผู้กำกับ คนเขียนบท นักแสดง และคนอื่นๆ ที่เกี่ยวข้อง โดยในปัจจุบัน เว็บไซต์ IMDb มีข้อมูลของภาพยนตร์มากกว่า 6 ล้านเรื่องแล้ว และยังมีข้อมูลที่เกี่ยวข้องอีกกว่า 100 ล้านรายการ ถ้าคิดไม่ออกว่าจะเริ่มใช้ Dataset ยังไง ลองเสิร์ชดูก็ได้ว่าคำที่คุณนึกถึงอยู่ตอนนี้ มีในชื่อหนังกี่เรื่อง
🔗 https://developer.imdb.com/non-commercial-datasets/

6. Airbnb

ถ้าอยากจองที่พักเมื่อไปเยือนต่างแดน Airbnb คงเป็นอีกชื่อแรกๆ ที่คนนึกถึง ดังนั้น Airbnb จึงมีข้อมูลเกี่ยวกับสถานที่ต่างๆ รวมถึงข้อมูลวิเคราะห์ผู้ใช้เต็มไปหมด ข้อมูลใน Airbnb นี้จึงเหมาะกับคนที่อยากฝึกฝนการเขียน SQL เกี่ยวกับข้อมูลทางภูมิศาสตร์
🔗 https://insideairbnb.com/get-the-data/

7. Earthdata

เคยสงสัยไหมว่า NASA เขาทำอะไรกันบ้าง? ข้อมูลเกี่ยวกับสิ่งที่พวกเขาศึกษา รวมไว้ที่นี่แล้ว! อาจจะไม่ถึงขั้นได้เจอตำแหน่ง UFO แต่ก็มีข้อมูลที่น่าสนใจเต็มไปหมดเกี่ยวกับชั้นบรรยากาศโลก การแผ่รังสีแสงอาทิตย์ กระแสน้ำ และการเคลื่อนตัวของเปลือกโลก ซึ่งคุณสามารถรับชมข้อมูลนี้ได้แบบ real-time หรือจะวิเคราะห์ออกมาเป็นฐานข้อมูลก็ได้
🔗 https://www.earthdata.nasa.gov/

Source: learnsql.com

อยากเขียน SQL ให้เก่งมากขึ้น ทำยังไงดี?

การเรียนรู้ทักษะใหม่ๆ ต้องอาศัยการเรียนรู้และฝึกฝนอย่างสม่ำเสมอ โดย SQL ก็เป็นภาษาที่ผู้ไม่มีพื้นฐานสามารถเริ่มเรียนรู้ได้ไม่ยากนัก แต่ถ้ามีเวลาและทุนทรัพย์ การลงทุนกับคอร์สเรียน หรือหลักสูตรแบบออนไลน์ ก็จะช่วยให้เรียนรู้ได้อย่างถูกจุดและมีประสิทธิภาพยิ่งขึ้น

สำหรับผู้ที่สนใจ เราขอแนะนำคอร์สเรียน ‘SQLPro: Extract Database For Real-World Success’ เหมาะสำหรับผู้ที่อยากปูพื้นฐานให้แน่น เพื่อก้าวสู่เส้นทาง Data Engineer และ Database Management ด้วย SQL และนำ Generative AI เข้ามาช่วย สอนโดยผู้มีประสบการณ์จริงและเข้าใจผู้เรียน พร้อมให้ผู้เรียนได้ลงมือทำระหว่างคอร์ส 

📌ดูรายละเอียดเพิ่มเติม และสมัครเรียนที่นี่ : https://bit.ly/3KJdygi

More Information