沈浩老師:談數據分析軟件

1 評論 8847 瀏覽 16 收藏 11 分鐘

數據分析也好,統計分析也好,數據挖掘也好、商業 智能也好都需要在學習的時候掌握各種分析手段和技能,特別是要掌握分析軟件工具!我曾經說過,沈老師的學習方法,一般是先學軟件開始,再去應用,再學會理 論和原理,因為是老師,再去教給別人!沒有軟件的方法就不去學了,因為學了也不能做,除非你自己會編程序。

那么在數據分析領域,都有哪些軟件分析工具呢?如何選擇呢?其實很多領域或者說分析方法都有相應的軟件工具,只要你想找就應該能夠找到!

這里我把軟件分成縱橫四個層次的的象限圖來表達!

第一維度:數據存儲層——>數據報表層——>數據分析層——>數據展現層

第二維度:用戶級——>部門級——>企業級——>BI級

首先,存儲層:

我們必須能夠存儲數據,對個人來講至少應該掌握一種數據庫技術,當然也不一定要熟練操作,但至少要能夠理解數據的存儲和數據的基本結構和數據類型,比如數據的安全性、唯一性、冗余性,表的關系,粒度,容量等,最好能夠理解SQL查詢語言的基本結構和讀取等等!

  • Access2003、Access07等:這是最基本的個人數據庫,經常用于個人或部分基本的數據存儲;
  • MySQL數據庫,這個對于部門級或者互聯網的數據庫應用是必要的,這個時候關鍵掌握數據庫的庫結構和SQL語言的數據查詢能力;
  • SQL Server 2005或更高版本,對中小企業,一些大型企業也可以采用SQL Server數據庫,其實這個時候本身除了數據存儲,也包括了數據報表和數據分析了,甚至數據挖掘工具都在其中了;
  • DB2,Oracle數據庫都是大型數據庫了,主要是企業級,特別是大型企業或者對數據海量存儲需求的就是必須的了,一般大型數據庫公司都提供非常好的數據整合應用平臺;
  • BI級,實際上這個不是數據庫,而是建立在前面數據庫基礎上的,這個主要是數據庫的企業應用級了,一般這個時候的數據庫都叫數據倉庫了,Data Warehouse,建立在DW級上的數據存儲基本上都是商業智能平臺,或許整合了各種數據分析,報表、分析和展現!

第二:報表層

當企業存儲了數據后,首先要解決的報表,還不是分析問題,是要能夠看到,看到報表,各種各樣的報表!國內外有專門提供報表分析服務的企業和軟件。

  • Crystal Report水晶報表,Bill報表,這都是全球最流行的報表工具,非常規范的報表設計思想,早期商業智能其實大部分人的理解就是報表系統,不借助IT技術人員就可以獲取企業各種信息——報表。而且很多數據庫內置的報表也是采用CR報表的開發版嵌入的!
  • Tableau軟件,這個軟件是近年來非常棒的一個軟件,當然它已經不是單純的數據報表軟件了,而是更為可視化的數據分析軟件,因為我經常用它來從數據庫中進行報表和可視化分析,先暫列在報表層;

這個軟件從3.0開始,現在已經有了5.1版本,兩年的時間已經到了服務器和Web方式了!

當然,如果企業有上萬張報表,需要好好管理起來,還有安全性,并發請求等,就需要有Server版;

博易智訊公司專門提供Crystal Report和Crystal Report Server版銷售和軟件服務;

第三:數據分析層

這個層其實有很多分析工具,當然我們最常用的就是Excel,我經常用的就是統計分析和數據挖掘工具;

  • Excel軟件,首先版本越高越好用這是肯定的;當然對Excel來講很多人只是掌握了5%Excel功能,Excel功能非常強大,甚至可以完成所有的統計分析工作!但是我也常說,有能力把Excel玩成統計工具不如專門學會統計軟件;
  • SPSS軟件:當前版本是18,名字也改成了PASW Statistics;我從3.0開始Dos環境下編程分析,到現在版本的變遷也可以看出SPSS社會科學統計軟件包的變化,從重視醫學、化學等開始越來越重視商業分析,現在已經成為了預測分析軟件。
  • Clementine軟件:當前版本13.0,數據挖掘工具,我從6.0開始用,到了13版,已經越來越多的提高了更多有好的建模工具,現在改名叫PASW Modeler 13建模器了。而且與SPSS統計功能有了更多的整合,數據處理也更加靈活和好用。
  • SAS軟件:SAS相對SPSS其實功能更強大,SAS是平臺化的,EM挖掘模塊平臺整合,相對來講,SAS比較難學些,但如果掌握了SAS會更有價值,比如離散選擇模型,抽樣問題,正交實驗設計等還是SAS比較好用,另外,SAS的學習材料比較多,也公開,會有收獲的!

當然,我主要是采用SPSS和Clementine,有時候就是習慣,當然會了一種軟件在學其他的也不是很困難!

  • JMP分析:SAS的一個分析分支
  • XLstat:Excel的插件,可以完成大部分SPSS統計分析功能
  • Ucinet社會網分析軟件:SNA社會網絡分析是非常流行和有價值的分析工具和方法,特別是從關系角度進行分析社會網絡,關系分析非常重要,過去我們都是屬性數據分析

大家如果有需要試用版,可以聯系博易智訊,他們可以提供SPSS和Clementine軟件版本的咨詢。

第四:表現層

最近我一直在研究數據可視化技術,一方面是因為Excel大家有需求,另一方面就是我第一個購買了Xcelsius,也寫了《Excel高級應用與數據分析》和《數據展現的藝術——Xcelsius》。這個領域的軟件,特別是一些小工具非常有價值!

  • PowerPoint軟件:這個沒得說了,大部分人都是用PPT寫報告;
  • Visio、SmartDraw軟件:這些都是非常好用的流程圖、營銷圖表、地圖等,而且從這里可以得到很多零件;
  • Swiff Chart軟件:制作圖表的軟件,生成的是Flash;
  • Color Wheel軟件:配色軟件
  • Yed軟件:網絡關系圖、流程圖和圖形分析軟件,類似SNA分析,我經常用來設計流程圖,還有就是分析優化關系圖;
  • Netdraw軟件:這是社會網絡分析展現軟件,主要是可視化網絡關系圖的,讀取Ucinet軟件;
  • Mindmanager軟件:思維導圖,非常好的軟件,可以把非線性思維很快構建起來,并且項目組織管理、報告設計構想都可以應用,直接生成PPT等,當然這個軟件功能非常強大,我的學生都用它來做筆記和會議記錄;
  • Xcelsius軟件:Dashboard制作和數據可視化報表工具,可以直接讀取數據庫,在Excel里建模,互聯網展現,最大特色還是可以在PPT中實現動態報表;這個是我最希望應用的一個軟件工具,非常有價值!

最后,需要說明的是,我這樣的分層分類并不是區分軟件,只是想說明軟件的應用,其實每個層次的軟件都是相互融合的,追求:平臺化,整合化,智能化,可視化,專業化,都是各有特色;價格也不同,有免費的,有上百萬的;有單機版的,有服務器版的;有正版的,有盜版的!

有時候我們把數據庫就用來進行報表分析,有時候報表就是分析,有時候分析就是展現;當然有時候展現就是分析,分析也是報表,報表就是數據存儲了!

沒有最好,只有更好,適合你的就是最好的!

其實還有很多數據分析軟件:

  • AMOS軟件:結構方程式模型SEM,實證研究和理論模型的重要分析工具,從事學術研究的人,特別是社會科學工作者應該掌握;
  • Lisrel軟件:結構方程式模型SEM,同上!
  • HLM軟件:分層線性模型;
  • 來自:http://shenhaolaoshi.blog.sohu.com/148204624.html

原文來自:互聯網分析沙龍

更多精彩內容,請關注人人都是產品經理微信公眾號或下載App
評論
評論請登錄
  1. 表示沒有看到R有些小小失望

    來自北京 回復