從事數據分析一定要選一門編程語言和工具,技多不壓身嘛。
數據分析的工具有很多,按功能和側重點來分有統計工具、可視化工具等等。
應用最廣的也是最常被提到的,無非是Excel、SAS、Python、R等等。那么,這么多工具是否都要學?都適用于什么情況?又應該如何使用呢?
Excel
EXCEL是其中最簡單的,倒不是容易而是人人都會。但如果是用來分析的話,圖表只是基礎,還要學會使用透視圖以及VBA函數。Excel的功能其實非常強大,尤其是通過學習VBA,幾乎能解決所有的問題,但成本就高了,而且Excel的數據處理量并不是很大,幾十萬而已,大數據量還要另尋方法。
SPSS
SPSS最初是社會科學統計軟件,如果剛入門數據分析,懂點SPSS事非常有好處的,當然前提是要懂SQL。SPSS得使用對人的能力要求不高,編程模塊很少使用,通常用于科學、市場之類的調研,在院校中使用較多。
有了以上的基礎之后,可能就需要精通一門統計分析軟件。
近幾年的互聯網潮,R語言流行起來了,在互聯網行業運用較多。R語言是開源的,學習起來并不容易,需要一個長期的過程。
SPSS剛剛有提到,適用于市場研究,上手較快。如果會編程的話,功能還是蠻強大的。
SAS一般是金融行業應用較廣,特別是銀行業和醫學統計,包括一些制造業也很多。銀行業通常會用SAS來做統計,數據挖掘也會用到,價格昂貴,學起來比較難,建議網上尋找一些課程和教材來學。
所以打擊愛可以針對自己的行業和實際情況來做選擇,以上列舉的只是大致情況。
Python
Python&R的比較
以上就是各種數據分析工具和語言的介紹,其次還要掌握一些第三方工具,這些工具一般偏業務化應用,可視化數據展示類偏多,所以在技術上沒有太多要求,不過SQL需要掌握。
Tableau
多次介紹過的一款可視化工具,可視化方面應該是做得最不錯的工具了,偏前端分析。不懂python不懂R的可以試試。有點貴,土豪們加油!
Qlikview
相對tableau有點丑,不要噴,畢竟人家走數據處理路線,作為BI產品,數據處理速度還是不錯的,取個數不至于像tableau慢。兩者像互補兄弟,各有優勢,但都一樣貴,哈哈!所以對數據處理要求較高的話,建議嘗試。
FineBI
國內的可視化軟件,bi工具。無功無過,重在穩定和應用,國內有一定市場,企業應用挺廣。有一定數據分析基礎的同學,應該說很快就能上手,免費版無限用!
還有一些D3之類的chart軟件這里由于篇幅就不介紹了,主要偏應用,在工作中使用還是蠻廣的。
總體來將,每個工具各有優勢,但最關鍵的還是對于業務的熟悉度,沒有遠離和思路,任何工具都用不起來,所以在做數據分析時,一定要扎根學習業務和數據建模方法,工具不是萬能的!