選自 Google Research Blog
作者: Nathan Silberman 、 Sergio Guadarrama
機器之心編譯
參與:杜夏德、吳攀
今年早些時候,我們發布了一款在 TensorFlow 上的最先進的圖像分類模型實現——Inception -V3。這些代碼允許用戶使用一個單一的本地機器或機器集群在 Image Net 分類數據集上通過同步梯度下降(synchronized gradient descent)的方式訓練模型。該 Inception-V3模型建立在 TenorFlow 的 TF- Slim 實驗庫上,它是一個用于在 TensorFlow 中定義、訓練和評估模型的輕量軟件包。這個TF-Slim 庫提供了常見的抽象,可以使用戶簡要快速地定義模型,同時還能維持模型架構透明和其超參數的明確性。
自發布以后,TF-Slim 增長迅速,添加了多種類型的層、損失函數和評估指標,用于訓練和評估模型的方便的例程(routine)也越來越多,。這些例程考慮到了擴展工作時你需要擔心的所有細節,比如并行讀取數據、在多臺機器上部署模型等等。此外,我們已經利用標準數據集創建了 TF-Slim 圖像模型庫(TF-Slim Image Models library),可以為許多廣泛使用的圖像分類模型提供定義和訓練腳本。TF-Slim 和它的組件已經在谷歌內部得到了廣泛使用,而很多改進已經被集成到 tf.contrib.slim 中。(https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/slim)
今天,我們很高興與 TF 社區共享最新的 TF-Slim 版本。以下幾點需要強調:
許多新種類的層(如 Atrous Convolution 和 Deconvolution)豐富了神經網絡架構的大家庭。
支持更多的損失函數和評估指標(例如,mAP,IoU)
一個部署庫,可以使得用多個 GPU / CPU在同一臺機器或多臺機器上執行同步或異步訓練變得更簡單:https://github.com/tensorflow/models/blob/master/slim/deployment/model_deploy.py
用于定義和訓練許多使用廣泛的圖形分類模型的代碼(例如,Inception[1][2][3],VGG[4],AlexNet[5],ResNet[6]):https://github.com/tensorflow/models/tree/master/slim/nets
用于上述圖像分類模型的預訓練模型權重。這些模型已經在 ImageNet 分類數據集上訓練過了,但是也能用來執行很多其他的計算機視覺任務。舉個簡單的例子,我們提供了可以微調這些分類器以適應一個新的輸出標簽集合的代碼。
容易處理標準圖像數據集的工具,如 ImageNet,CIFAR 10 和 MNIST。
想嘗試一下 TF-Slim 嗎?這條鏈接(https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/slim)可以幫到你。
如果你想試試圖像分類模型可以看下這條介紹(https://github.com/tensorflow/models/blob/master/slim/README.md)或者 Jupyter notebook(https://github.com/tensorflow/models/blob/master/slim/slim_walkthough.ipynb)
參考文獻:
[1] Going deeper with convolutions, *Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov, Dumitru Erhan, Vincent Vanhoucke, Andrew Rabinovich, CVPR 2015*
[2] Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift,*Sergey Ioffe, Christian Szegedy, ICML 2015*
[3] Rethinking the Inception Architecture for Computer Vision , *Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe, Jonathon Shlens, Zbigniew Wojna, arXiv technical report 2015*
[4] Very Deep Convolutional Networks for Large-Scale Image Recognition, *Karen Simonyan, Andrew Zisserman, ICLR 2015*
[5] ImageNet Classification with Deep Convolutional Neural Networks , *Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton, NIPS 2012*
[6] Deep Residual Learning for Image Recognition, *Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun, CVPR 2016*
本文由機器之心編譯,轉載請聯系本公眾號獲得授權。
------------------------------------------------
加入機器之心(全職記者/實習生):hr@almosthuman.cn
投稿或尋求報道:editor@almosthuman.cn
廣告&商務合作:bd@almosthuman.cn
點擊「閱讀原文」,下載論文↓↓↓