來源:北大青鳥總部 2022年12月16日 11:26
小編最近已經擼完了各種機器學習算法視頻和原理實現的博客,已經擼了半個月的各種機器學習流程以及方法。頭皮發麻,感覺自己渾身充滿了能量。但現在有一個問題,就是有力無處使啊!!!小編現在睡覺的時候滿腦子都是“簡單!簡單!太簡單了!老師,請給我黃岡的題”。
相信大家也有這樣的煩惱,就是學習了很長一段時間的理論課之后,想找一些數據集、實戰案例練手,來實際的檢驗一下自己對各類算法的掌握情況。苦于手上資源貧乏,造數據的話嫌數據不真實,爬蟲的話嫌業務流程非常白癡不成體系。
下面由小編給大家介紹一個神仙網站,它不僅提供大量的各種數據量的數據集,各種真實業務場景之外,還提供一個公共討論社區,社區簡直就是各種大神的舞池!各種大神在花式的秀著操作,把處理各種數據集和業務問題的過程和代碼全方位的剖析!最重要的是這一切全部都免費!這對每次看某酷會員視頻都需要發10個朋友圈借會員的小編來說簡直是大型真香現場!
小編要介紹的就是這位大兄dei。
簡單介紹一下:
Kaggle
這是一個數據挖掘和數據分析的競賽平臺,從公司角度上說,一些公司向Kaggle提供真實的業務場景和數據,以及亟待解決的問題。從參賽者角度說,它們可以通過自己的專業技能來解決公司提出的問題,并最終取結果最好的幾位或者幾組發放獎金。從學習者角度說,它提供了大量真實數據、案例、以及各種大神的解答過程。下面小編將親身帶著大家來感受一下真香感覺。
首先打開網頁,你會看到
在這個界面中,可以看到導航欄上有幾個顯眼的選項,當然我們的目的是找數據集,并找數據集對應的業務場景及亟待解決的問題來練手!不廢話直接開找。
點開Datasets選項,進入頁面尋找自己適合的數據集。
直接可以看到,公開數據集有非常多的選擇,排序是熱門的數據集比較靠前,當然我們也可以自己來篩選想要的數據集,如數據集數據量大小,數據集的文件格式以及數據集的關鍵字等等。(注意是英文)
選擇好數據集后,直接點進去,查看好業務場景,如果覺得業務場景你比較喜歡,就可以歡快的下載這份數據集啦。
甚至,如果你當時沒有思路,或者你已經做完了,想和大神們對比一下做法,你也可以在上面輕松的找到大神們的做法進行參考。