作者:張倩、王淑婷
在過去的一年里,機器之心發(fā)布了許多關(guān)于基礎(chǔ)知識、進階技能、人生選擇等方面的教程文章。為了方便廣大讀者查閱,小編將這些文章打包成一篇合集(加鏈接加到手疼……),作為2018年末大禮包送給大家。
本文盤點了機器之心 2018 年 2 月~12 月的教程精華,分為入門、語言、框架、數(shù)據(jù)、進階、人生選擇、Just for Fun 七大板塊,從基本概念到深度解析,從語言到框架,從讀博到就業(yè)……既有理論,也有實戰(zhàn);既有精華文章,也有視頻、教科書、筆記??傊?,你想要的,這里都有。
入門
基本概念
機器學習、深度學習、強化學習……剛?cè)腴T的你是不是覺得這些概念很難區(qū)分?仔細讀以下幾篇文章,邁出 AI 之路第一步:
數(shù)學知識
數(shù)學在機器學習中非常重要,不論是在算法上理解模型代碼,還是在工程上構(gòu)建系統(tǒng),數(shù)學都必不可少。2018 年,機器之心發(fā)布了多位「獨秀同學」本著「再看不懂就 sǐ給你看」的態(tài)度寫的數(shù)學知識解讀,幫你完成從入門到精通(不放棄)的進階之路。
教材/課程
當然,要成功入門 AI,讀幾篇文章、掌握一點碎片知識是遠遠不夠的,以下課程、教材幫你系統(tǒng)梳理了入門所需的基礎(chǔ)知識。
讀論文
學完了入門課程,是時候讀一些論文了。但論文那么多,究竟怎么讀?這里有兩篇文章幫你解鎖讀論文的正確姿勢。
工具
學了這么多理論知識,當然要來點實戰(zhàn)檢驗一下。但在此之前,你還要 get 兩樣工具——GitHub 和 Jupyter Notebook。前者是一個大型代碼庫,是開發(fā)人員和公司托管項目、文檔和代碼的常用平臺。后者是一款免費、開源的交互式 web 工具,你可以利用該工具將軟件代碼、計算輸出、解釋文本和多媒體資源組合在一個文檔中。以下幾篇文章將告訴你如何更好地利用這兩個工具。
實戰(zhàn)
實戰(zhàn)開始!Are you ready?
語言
Python
隨著機器學習的興起,Python 逐步成為了「最受歡迎」的語言。它簡單易用、邏輯明確并擁有海量的擴展包,因此其不僅成為機器學習與數(shù)據(jù)科學的首選語言,同時在網(wǎng)頁、數(shù)據(jù)爬取可科學研究等方面成為不二選擇。此外,很多入門級的機器學習開發(fā)者都是隨大流選擇 Python(參見《人生苦短,為什么我要用 Python?》)。Stack Overflow 將 Python 稱為「增長最快的主要編程語言」,Indeed.com 估計美國的 Python 開發(fā)人員平均年收入將超過 JavaScript 和 Java 的開發(fā)人員,達到 114,811 美元(參見《業(yè)界 | 2018 最流行的編程語言 Top 3(附薪資情況)》)。人生苦短,你還有什么理由不學 Python?
Julia
今年 8 月份,Julia 1.0 正式發(fā)布,在社區(qū)內(nèi)引發(fā)了極大的關(guān)注,成為熱度上升最快的編程語言之一,下載量超過 200 萬次,下載者包括谷歌、Facebook、FAA 和美國能源部等各個部門的開發(fā)者。該語言期望結(jié)合 C 的速度、Matlab 的數(shù)學表征、Python 的通用編程與 Shell 的膠水命令行,并構(gòu)建開源、自由與便捷的編程語言。想成為斜杠青年,不多學點語言怎么行?
框架
深度學習是機器學習領(lǐng)域最熱門的方向之一,而 Python 又是深度學習使用的熱門語言,因此,能兼容 Python 的框架非常值得學習。下面我們將介紹兩份框架學習教程。
TensorFlow
Kaggle 上的一份排行榜從領(lǐng)英職位需求、谷歌搜索熱度、Medium 文章數(shù)、arXiv 論文數(shù)和 GitHub 活躍度等方面審視了不同的框架,發(fā)現(xiàn) TensorFlow 是絕對贏家。在 GitHub 活躍度、谷歌搜索、Medium 文章數(shù)、亞馬遜書籍和 arXiv 論文這些數(shù)據(jù)源上,它所占的比重都是最大的。此外,TensorFlow 還擁有最多的開發(fā)者用戶,出現(xiàn)在最多的在線職位描述中。因此,框架還要從 TensorFlow 學起。
PyTorch
自 2017 年 1 月推出以來,PyTorch 熱度持續(xù)上升,一度有趕超 TensorFlow 的趨勢。PyTorch 能在短時間內(nèi)被眾多研究人員和工程師接受并推崇是因為其有著諸多優(yōu)點,如采用 Python 語言、動態(tài)圖機制、網(wǎng)絡構(gòu)建靈活以及擁有強大的社群等。因此,走上學習 PyTorch 的道路已刻不容緩。
PaddlePaddle
百度深度學習框架 PaddlePaddle 自 2016 年開源以來,受到了業(yè)界的廣泛關(guān)注。不久之前,PaddlePaddle 1.0 正式發(fā)布。這一由中國科技巨頭開源的首個深度學習框架為我們提供了超全的官方模型支持和最完善的移動端硬件支持。更重要的是,這一框架非常適合國內(nèi)開發(fā)者,有興趣的geek可以從以下教程入手。
數(shù)據(jù)
數(shù)據(jù)是人工智能發(fā)展的一大基石。這部分教程包含了 AI 研究者、工程師等相關(guān)人員需要的數(shù)據(jù)集和數(shù)據(jù)可視化方法。
數(shù)據(jù)集
數(shù)據(jù)可視化
進階
掌握了基礎(chǔ)知識,學了語言、框架,想不想在 AI 之路上再進一步呢?這一部分盤點了機器學習、深度學習、強化學習、計算機視覺、自然語言處理方面的理論知識、實踐經(jīng)驗及工程技巧,此外還有全面、深入的詳解、綜述、競賽類文章,既適合研究人員,也適合各個領(lǐng)域的工程師閱讀學習。
機器學習
深度學習
強化學習
計算機視覺
自然語言處理
綜述/詳解/競賽
人生選擇
繼續(xù)深造還是就業(yè)?每個即將走出校門的人面臨這種艱難的人生選擇,甚至有些已經(jīng)就業(yè)的人也在考慮重新選擇。這里有一些過來人給出了一些實用的人生建議/職業(yè)指導,希望對你有所啟發(fā)。
讀博
就業(yè)
Just for Fun!
2018 年,谷歌的「猜畫小歌」在朋友圈火了一把,眾多吃瓜群眾驚呼「amazing!」這些小程序的出現(xiàn)拉近了 AI 與大眾的距離,又好玩又親切,想不想自己做一個出來玩呢?