成為一名數(shù)據(jù)分析師所需要掌握的知識(shí):
數(shù)學(xué)知識(shí)
對(duì)于初級(jí)數(shù)據(jù)分析師來說,則需要了解統(tǒng)計(jì)相關(guān)的基礎(chǔ)性內(nèi)容,公式計(jì)算,統(tǒng)計(jì)模型等。當(dāng)你獲得一份數(shù)據(jù)集時(shí),需要先進(jìn)行了解數(shù)據(jù)集的質(zhì)量,進(jìn)行描述統(tǒng)計(jì)。
而對(duì)于高級(jí)數(shù)據(jù)分析師,必須具備統(tǒng)計(jì)模型的能力,線性代數(shù)也要有一定的了解。
分析工具
對(duì)于分析工具,SQL 是必須會(huì)的,還有要熟悉Excel數(shù)據(jù)透視表和公式的使用,另外,還要學(xué)會(huì)一個(gè)統(tǒng)計(jì)分析工具,SAS作為入門是比較好的,VBA 基本必備,SPSS/SAS/R 至少要熟練使用其中之一,其他分析工具(如 Matlab)可以視情況而定。
編程語言
數(shù)據(jù)分析領(lǐng)域最熱門的兩大語言是 R 和 Python。涉及各類統(tǒng)計(jì)函數(shù)和工具的調(diào)用,R無疑有優(yōu)勢(shì)。但是大數(shù)據(jù)量的處理力不足,學(xué)習(xí)曲線比較陡峭。Python 適用性強(qiáng),可以將分析的過程腳本化。所以,如果你想在這一領(lǐng)域有所發(fā)展,學(xué)習(xí) Python 也是相當(dāng)有必要的。
當(dāng)然其他編程語言也是需要掌握的。要有獨(dú)立把數(shù)據(jù)化為己用的能力, 這其中SQL 是最基本的,你必須會(huì)用 SQL 查詢數(shù)據(jù)、會(huì)快速寫程序分析數(shù)據(jù)。當(dāng)然,編程技術(shù)不需要達(dá)到軟件工程師的水平。要想更深入的分析問題你可能還會(huì)用到:Exploratory analysis skills、Optimization、Simulation、Machine Learning、Data Mining、Modeling 等。
業(yè)務(wù)理解
對(duì)業(yè)務(wù)的理解是數(shù)據(jù)分析師工作的基礎(chǔ),數(shù)據(jù)的獲取方案、指標(biāo)的選取、還有最終結(jié)論的洞察,都依賴于數(shù)據(jù)分析師對(duì)業(yè)務(wù)本身的理解。
對(duì)于初級(jí)數(shù)據(jù)分析師,主要工作是提取數(shù)據(jù)和做一些簡(jiǎn)單圖表,以及少量的洞察結(jié)論,擁有對(duì)業(yè)務(wù)的基本了解就可以。對(duì)于高級(jí)數(shù)據(jù)分析師,需要對(duì)業(yè)務(wù)有較為深入的了解,能夠基于數(shù)據(jù),提煉出有效觀點(diǎn),對(duì)實(shí)際業(yè)務(wù)能有所幫助。對(duì)于數(shù)據(jù)挖掘工程師,對(duì)業(yè)務(wù)有基本了解就可以,重點(diǎn)還是需要放在發(fā)揮自己的技術(shù)能力上。
邏輯思維
對(duì)于初級(jí)數(shù)據(jù)分析師,邏輯思維主要體現(xiàn)在數(shù)據(jù)分析過程中每一步都有目的性,知道自己需要用什么樣的手段,達(dá)到什么樣的目標(biāo)。對(duì)于高級(jí)數(shù)據(jù)分析師,邏輯思維主要體現(xiàn)在搭建完整有效的分析框架,了解分析對(duì)象之間的關(guān)聯(lián)關(guān)系,清楚每一個(gè)指標(biāo)變化的前因后果,會(huì)給業(yè)務(wù)帶來的影響。對(duì)于數(shù)據(jù)挖掘工程師,羅輯思維除了體現(xiàn)在和業(yè)務(wù)相關(guān)的分析工作上,還包括算法邏輯,程序邏輯等,所以對(duì)邏輯思維的要求也是最高的。
數(shù)據(jù)可視化
數(shù)據(jù)可視化主要借助于圖形化手段,清晰有效地傳達(dá)與溝通信息。聽起來很高大上,其實(shí)包括的范圍很廣,做個(gè) PPT 里邊放上數(shù)據(jù)圖表也可以算是數(shù)據(jù)可視化。
對(duì)于初級(jí)數(shù)據(jù)分析師,能用 Excel 和 PPT 做出基本的圖表和報(bào)告,能清楚地展示數(shù)據(jù),就達(dá)到目標(biāo)了。對(duì)于稍高級(jí)的數(shù)據(jù)分析師,需要使用更有效的數(shù)據(jù)分析工具,根據(jù)實(shí)際需求做出或簡(jiǎn)單或復(fù)雜,但適合受眾觀看的數(shù)據(jù)可視化內(nèi)容。
協(xié)調(diào)溝通
數(shù)據(jù)分析師不僅需要具備破譯數(shù)據(jù)的能力,也經(jīng)常被要求向項(xiàng)目經(jīng)理和部門主管提供有關(guān)某些數(shù)據(jù)點(diǎn)的建議,所以,你需要有較強(qiáng)的交流能力。
對(duì)于高級(jí)數(shù)據(jù)分析師,需要開始獨(dú)立帶項(xiàng)目,或者和產(chǎn)品做一些合作,因此除了溝通能力以外,還需要一些項(xiàng)目協(xié)調(diào)能力。
統(tǒng)計(jì)基礎(chǔ)知識(shí)第一章總論第一節(jié)統(tǒng)計(jì)的涵義第二節(jié)統(tǒng)計(jì)學(xué)中的基本概念第三節(jié)統(tǒng)計(jì)的任務(wù)與過程第二章統(tǒng)計(jì)調(diào)查第一節(jié)統(tǒng)計(jì)調(diào)查的概念與種類第二節(jié)統(tǒng)計(jì)調(diào)查方案第三節(jié)統(tǒng)計(jì)調(diào)查的方式第四節(jié)統(tǒng)計(jì)資料搜集的方法第五節(jié)統(tǒng)計(jì)調(diào)查資料的質(zhì)量控制第三章統(tǒng)計(jì)整理第一節(jié)統(tǒng)計(jì)整理的內(nèi)容和方法第二節(jié)統(tǒng)計(jì)分組第三節(jié)次數(shù)分布第四節(jié)數(shù)據(jù)的計(jì)算機(jī)錄入?yún)R總與質(zhì)量控制第五節(jié)統(tǒng)計(jì)表第四章統(tǒng)計(jì)指標(biāo)第一節(jié)統(tǒng)計(jì)指標(biāo)與統(tǒng)計(jì)指標(biāo)體系第二節(jié)總量指標(biāo)第三節(jié)相對(duì)指標(biāo)第四節(jié)平均指標(biāo)第五節(jié)標(biāo)志變異指標(biāo)第五章時(shí)間數(shù)列第一節(jié)時(shí)間數(shù)列的概念和種類第二節(jié)時(shí)間數(shù)列的水平指標(biāo)第三節(jié)時(shí)間數(shù)列的速度指標(biāo)第六章統(tǒng)計(jì)指數(shù)第一節(jié)統(tǒng)計(jì)指數(shù)的概念及其應(yīng)用第二節(jié)總指數(shù)及其編制方法第三節(jié)指數(shù)體系及其因素分析第四節(jié)幾種常用的統(tǒng)計(jì)指數(shù)第七章抽樣調(diào)查基礎(chǔ)知識(shí)第一節(jié)抽樣調(diào)查的概念、特點(diǎn)及分類第二節(jié)抽樣推斷的幾個(gè)基本概念第三節(jié)抽樣誤差第四節(jié)參數(shù)估計(jì)第五節(jié)樣本單位數(shù)的確定第八章統(tǒng)計(jì)分析基礎(chǔ)知識(shí)第一節(jié)什么是統(tǒng)計(jì)分析第二節(jié)常用的統(tǒng)計(jì)分析方法第三節(jié)統(tǒng)計(jì)分析報(bào)告寫作的特點(diǎn)與原則統(tǒng)計(jì)實(shí)務(wù)第一章統(tǒng)計(jì)報(bào)表制度綜述第一節(jié)統(tǒng)計(jì)報(bào)表制度基本框架第二節(jié)統(tǒng)計(jì)報(bào)表制度的管理第三節(jié)統(tǒng)計(jì)報(bào)表制度的貫徹與實(shí)施第二章統(tǒng)計(jì)分類與統(tǒng)計(jì)分類標(biāo)準(zhǔn)化第一節(jié)概述第二節(jié)常用統(tǒng)計(jì)標(biāo)準(zhǔn)分類介紹第三章基本單位統(tǒng)計(jì)第一節(jié)概述第二節(jié)基本單位統(tǒng)計(jì)的主要內(nèi)容第三節(jié)基本單位統(tǒng)計(jì)調(diào)查方法第四章生產(chǎn)活動(dòng)統(tǒng)計(jì)第一節(jié)概述第二節(jié)生產(chǎn)活動(dòng)價(jià)值量統(tǒng)計(jì)第四節(jié)生產(chǎn)活動(dòng)成果統(tǒng)計(jì)分析指標(biāo)第五章能源統(tǒng)計(jì)第一節(jié)概述第二節(jié)能源統(tǒng)計(jì)的主要內(nèi)容第六章財(cái)務(wù)統(tǒng)計(jì)第一節(jié)概述第二節(jié)企業(yè)財(cái)務(wù)統(tǒng)計(jì)的主要內(nèi)容第三節(jié)行政事業(yè)單位財(cái)務(wù)統(tǒng)計(jì)的主要內(nèi)容第七章勞動(dòng)統(tǒng)計(jì)第一節(jié)概述第二節(jié)從業(yè)人員統(tǒng)計(jì)第三節(jié)城鎮(zhèn)勞動(dòng)力就業(yè)與失業(yè)統(tǒng)計(jì)第四節(jié)從業(yè)人員勞動(dòng)報(bào)酬統(tǒng)計(jì)第八章固定資產(chǎn)投資統(tǒng)計(jì)第一節(jié)概述 第二節(jié)固定資產(chǎn)投資統(tǒng)計(jì)的主要內(nèi)容 。
1.統(tǒng)計(jì)法的基本原則,是統(tǒng)計(jì)法所調(diào)整的統(tǒng)計(jì)法律關(guān)系的集中反映,是貫穿整個(gè)統(tǒng)計(jì)法律規(guī)范,對(duì)各項(xiàng)統(tǒng)計(jì)制度和所有統(tǒng)計(jì)法律規(guī)范起統(tǒng)帥作用的準(zhǔn)則。主要有以下5項(xiàng):
一是,保障統(tǒng)計(jì)工作統(tǒng)一性原則;
二是,統(tǒng)計(jì)機(jī)構(gòu)依法履行職責(zé)原則;
三是,統(tǒng)計(jì)調(diào)查對(duì)象依法履行義務(wù)原則;
四是,維護(hù)統(tǒng)計(jì)調(diào)查對(duì)象合法權(quán)益原則;
五是,保障統(tǒng)計(jì)信息社會(huì)共享原則。
2.統(tǒng)計(jì)人員的職權(quán),是指統(tǒng)計(jì)人員在一定的機(jī)構(gòu)擔(dān)負(fù)統(tǒng)計(jì)工作,為了完成統(tǒng)計(jì)任務(wù)而由統(tǒng)計(jì)法規(guī)定擁有的權(quán)利。根據(jù)《統(tǒng)計(jì)法》的規(guī)定,統(tǒng)計(jì)人員的職權(quán)包括以下幾個(gè)方面:
一是,統(tǒng)計(jì)人員具有依照《統(tǒng)計(jì)法》規(guī)定獨(dú)立行使統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)報(bào)告、統(tǒng)計(jì)監(jiān)督的職權(quán);
二是,統(tǒng)計(jì)人員有權(quán)要求有關(guān)單位和人員依照國家規(guī)定,如實(shí)提供統(tǒng)計(jì)資料;
三是,統(tǒng)計(jì)人員有權(quán)檢查統(tǒng)計(jì)資料的準(zhǔn)確性,要求改正不確實(shí)的統(tǒng)計(jì)資料;
四是,統(tǒng)計(jì)人員有權(quán)揭發(fā)、檢舉統(tǒng)計(jì)調(diào)查工作中的違法行為。
另外,統(tǒng)計(jì)人員有學(xué)習(xí)專業(yè)知識(shí)的權(quán)利。
3. 統(tǒng)計(jì)違法行為,是指行為人在統(tǒng)計(jì)活動(dòng)中違反統(tǒng)計(jì)法和統(tǒng)計(jì)制度規(guī)定,對(duì)統(tǒng)計(jì)法所保護(hù)的社會(huì)關(guān)系形成侵害的行為。統(tǒng)計(jì)違法行為具有如下特征:
一是,統(tǒng)計(jì)違法行為是具有社會(huì)危害性的行為;
二是,統(tǒng)計(jì)違法行為是行為人有過錯(cuò)的行為;
三是,統(tǒng)計(jì)違法行為是違反統(tǒng)計(jì)法律規(guī)定的行為。
概念人類對(duì)事物數(shù)量的認(rèn)識(shí)形成的定義。
漢語中的“統(tǒng)計(jì)”有合計(jì)、總計(jì)的意 統(tǒng)計(jì)學(xué)思。指對(duì)某一現(xiàn)象有關(guān)的數(shù)據(jù)的搜集、整理、計(jì)算、分析、解釋、表述等的活動(dòng)。
1. 指對(duì)某一現(xiàn)象有關(guān)的數(shù)據(jù)的搜集、整理、計(jì)算和分析等。例:人口統(tǒng)計(jì)2. 亦指總括地計(jì)算例:把全國報(bào)來的數(shù)據(jù)統(tǒng)計(jì)一下典故:明胡應(yīng)麟《少室山房筆叢·經(jīng)籍會(huì)通一》:“古今書籍,統(tǒng)計(jì)一代,前后之藏,往往無過十萬;統(tǒng)計(jì)一朝,公私之蓄,往往不能十萬。”
清宣鼎《夜雨秋燈錄·銀雁》:“ 佛奴 掘深窖藏之,統(tǒng)計(jì)約有二十馀萬。”外文詞源英語中的“統(tǒng)計(jì)”[statistics;count;add up] ,statistics用作復(fù)數(shù)名詞時(shí),意思是統(tǒng)計(jì)資料,作單數(shù)名詞時(shí),指的是統(tǒng)計(jì)學(xué)。
詞源:德語Statistik ,政治學(xué);新拉丁語 statisticus ,國事;意大利語statista ,老練的政客;舊意大利語、拉丁語 status ,形勢(shì),政體。三種涵義在實(shí)際應(yīng)用中,人們對(duì)統(tǒng)計(jì)一詞的理解一般有三種涵義:統(tǒng)計(jì)工作、統(tǒng)計(jì)資料和統(tǒng)計(jì)科學(xué):(1)統(tǒng)計(jì)工作。
指利用科學(xué)的方法搜集、整理和分析和提供關(guān)于社會(huì)經(jīng)濟(jì)現(xiàn)象數(shù)量資料的工作的總稱,是統(tǒng)計(jì)的基礎(chǔ)。也稱統(tǒng)計(jì)實(shí)踐,或統(tǒng)計(jì)活動(dòng),是在一定統(tǒng)計(jì)理論指導(dǎo)下,采用科學(xué)的方法,搜集、整理、分析統(tǒng)計(jì)資料的一系列活動(dòng)過程。
它是隨著人類社會(huì)的發(fā)展、治國和管理的需要而產(chǎn)生和發(fā)展起來的,至今已有四五千年的歷史?,F(xiàn)實(shí)生活中,統(tǒng)計(jì)工作作為一種認(rèn)識(shí)社會(huì)經(jīng)濟(jì)現(xiàn)象總體和自然現(xiàn)象總體的實(shí)踐過程,一般包括統(tǒng)計(jì)設(shè)計(jì)、統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)整理和統(tǒng)計(jì)分析四個(gè)環(huán)節(jié)。
(2)統(tǒng)計(jì)資料。指通過統(tǒng)計(jì)工作取得的、用來反映社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)據(jù)資料的總稱。
統(tǒng)計(jì)工作所取得的各項(xiàng)數(shù)字資料及有關(guān)文字資料,一般反映在統(tǒng)計(jì)表、統(tǒng)計(jì)圖、統(tǒng)計(jì)手冊(cè)、統(tǒng)計(jì)年鑒、統(tǒng)計(jì)資料匯編和統(tǒng)計(jì)分析報(bào)告中。也稱統(tǒng)計(jì)信息,是反映一定社會(huì)經(jīng)濟(jì)現(xiàn)象總體或自然現(xiàn)象總體的特征或規(guī)律的數(shù)字資料、文字資料、圖表資料及其他相關(guān)資料的總稱。
它包括剛剛調(diào)查取得的原始資料和經(jīng)過一定程度整理、加工的次級(jí)資料,其形式有:統(tǒng)計(jì)表、統(tǒng)計(jì)圖、統(tǒng)計(jì)年鑒、統(tǒng)計(jì)公報(bào)、統(tǒng)計(jì)報(bào)告和其他有關(guān)統(tǒng)計(jì)信息的載體。(3)統(tǒng)計(jì)科學(xué)。
也稱統(tǒng)計(jì)學(xué),是統(tǒng)計(jì)工作經(jīng)驗(yàn)的總結(jié)和理論概括,是系統(tǒng)化的知識(shí)體系。指研究如何搜集、整理和分析統(tǒng)計(jì)資料的理論與方法。
統(tǒng)計(jì)工作、統(tǒng)計(jì)資料、統(tǒng)計(jì)科學(xué)三者之間的關(guān)系是:統(tǒng)計(jì)工作的成果是統(tǒng)計(jì)資料,統(tǒng)計(jì)資料和統(tǒng)計(jì)科學(xué)的基礎(chǔ)是統(tǒng)計(jì)工作,統(tǒng)計(jì)科學(xué)既是統(tǒng)計(jì)工作經(jīng)驗(yàn)的理論概括,又是指導(dǎo)統(tǒng)計(jì)工作的原理、原則和方法??傮w來說,“統(tǒng)計(jì)”一詞的三方面涵義是緊密聯(lián)系的,統(tǒng)計(jì)資料是統(tǒng)計(jì)工作的成果,統(tǒng)計(jì)工作與統(tǒng)計(jì)科學(xué)之間是實(shí)踐與理論的關(guān)系。
方法均值、中位數(shù)、眾數(shù)、正態(tài)分布、抽樣、標(biāo)準(zhǔn)差、概率論、檢驗(yàn)、方差分析、卡方檢驗(yàn)。編輯本段特征數(shù)量性社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的認(rèn)識(shí)對(duì)象是社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量方面,包括現(xiàn)象的數(shù)量表現(xiàn)、現(xiàn)象之間的數(shù)量關(guān)系和質(zhì)量互變的數(shù)量界限。
總體性社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的認(rèn)識(shí)對(duì)象是社會(huì)經(jīng)濟(jì)現(xiàn)象的總體的數(shù)量方面。國民經(jīng)濟(jì)總體的數(shù)量方面、社會(huì)總體的數(shù)量方面、地區(qū)國民經(jīng)濟(jì)和社會(huì)總體的數(shù)量方面、各企事業(yè)單位總體數(shù)量方面等等。
具體性社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)的認(rèn)識(shí)對(duì)象是具體事物的數(shù)量方面,而不是抽象的量。這是統(tǒng)計(jì)與數(shù)學(xué)的區(qū)別。
社會(huì)性社會(huì)經(jīng)濟(jì)現(xiàn)象是人類有意識(shí)的社會(huì)活動(dòng),是人類社會(huì)活動(dòng)的條件、過程和結(jié)果,社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)以社會(huì)經(jīng)濟(jì)現(xiàn)象作為研究對(duì)象,自然具有明顯的社會(huì)性。編輯本段職能統(tǒng)計(jì)要達(dá)到認(rèn)識(shí)社會(huì)的目的,不僅需要科學(xué)的方法,而且需要強(qiáng)有力的組織領(lǐng)導(dǎo)。
因此統(tǒng)計(jì)兼有信息、咨詢、監(jiān)督三種職能。信息職能是統(tǒng)計(jì)部門根據(jù)科學(xué)的統(tǒng)計(jì)指標(biāo)體系和統(tǒng)計(jì)調(diào)查方法,靈敏、系統(tǒng)的采集、處理、傳輸、貯存和提供大量的以數(shù)據(jù)描述為基本特征的社會(huì)經(jīng)濟(jì)信息。
咨詢職能指利用已經(jīng)掌握的豐富的統(tǒng)計(jì)信息資源,運(yùn)用科學(xué)的分析方法和先進(jìn)的技術(shù)手段,深入開展綜合分析和專題研究,為科學(xué)決策和管理提供各種可供選擇的咨詢建議與對(duì)策方案。監(jiān)督職能指根據(jù)統(tǒng)計(jì)調(diào)查和分析,及時(shí)、準(zhǔn)確地從總體上反映經(jīng)濟(jì)、社會(huì)和科技的運(yùn)行狀態(tài),并對(duì)其實(shí)行全面、系統(tǒng)的定量檢查、監(jiān)測(cè)和預(yù)警,以促使國民經(jīng)濟(jì)按照客觀規(guī)律的要求,持續(xù)、穩(wěn)定、協(xié)調(diào)地發(fā)展。
這三種職能是相互聯(lián)系、相輔相成的。統(tǒng)計(jì)信息職能是保證咨詢和監(jiān)督職能有效發(fā)揮的基礎(chǔ);統(tǒng)計(jì)咨詢職能是統(tǒng)計(jì)薪資職能的延續(xù)和深化;而統(tǒng)計(jì)監(jiān)督職能則是信息、咨詢職能基礎(chǔ)上進(jìn)一步拓展并促進(jìn)統(tǒng)計(jì)信息和咨詢職能的優(yōu)化。
編輯本段組織統(tǒng)計(jì)的組織必須貫徹集中統(tǒng)一的原則,在全國范圍內(nèi)建立集中統(tǒng)一的統(tǒng)計(jì)系統(tǒng),執(zhí)行統(tǒng)一的方針政策和統(tǒng)計(jì)調(diào)查計(jì)劃,貫徹統(tǒng)一的統(tǒng)計(jì)制度和統(tǒng)計(jì)標(biāo)準(zhǔn),使用統(tǒng)一的統(tǒng)計(jì)報(bào)表和數(shù)字管理制度,以及協(xié)調(diào)統(tǒng)計(jì)、會(huì)計(jì)、業(yè)務(wù)核算制度和核算標(biāo)準(zhǔn)及分工等。國家集中統(tǒng)一的統(tǒng)計(jì)系統(tǒng)有各級(jí)部門的綜合統(tǒng)計(jì)系統(tǒng)、各級(jí)業(yè)務(wù)部門的專業(yè)統(tǒng)計(jì)系統(tǒng)、以及城鄉(xiāng)基層組織企業(yè)單位的統(tǒng)計(jì)組織所組成。
綜合統(tǒng)計(jì)系統(tǒng)各級(jí)政府部門的綜合統(tǒng)計(jì)系統(tǒng)是由國家統(tǒng)計(jì)局和地方各級(jí)統(tǒng)計(jì)機(jī)構(gòu)所組成,是國家統(tǒng)計(jì)組織的主系統(tǒng)。其主要職責(zé):1. 制定統(tǒng)計(jì)調(diào)查計(jì)劃,部署和檢查全國或者行政區(qū)域。
數(shù)據(jù)分析所需要掌握的知識(shí):
數(shù)學(xué)知識(shí)
對(duì)于初級(jí)數(shù)據(jù)分析師來說,則需要了解統(tǒng)計(jì)相關(guān)的基礎(chǔ)性內(nèi)容,公式計(jì)算,統(tǒng)計(jì)模型等。當(dāng)你獲得一份數(shù)據(jù)集時(shí),需要先進(jìn)行了解數(shù)據(jù)集的質(zhì)量,進(jìn)行描述統(tǒng)計(jì)。
而對(duì)于高級(jí)數(shù)據(jù)分析師,必須具備統(tǒng)計(jì)模型的能力,線性代數(shù)也要有一定的了解。
分析工具
對(duì)于分析工具,SQL 是必須會(huì)的,還有要熟悉Excel數(shù)據(jù)透視表和公式的使用,另外,還要學(xué)會(huì)一個(gè)統(tǒng)計(jì)分析工具,SAS作為入門是比較好的,VBA 基本必備,SPSS/SAS/R 至少要熟練使用其中之一,其他分析工具(如 Matlab)可以視情況而定。
編程語言
數(shù)據(jù)分析領(lǐng)域最熱門的兩大語言是 R 和 Python。涉及各類統(tǒng)計(jì)函數(shù)和工具的調(diào)用,R無疑有優(yōu)勢(shì)。但是大數(shù)據(jù)量的處理力不足,學(xué)習(xí)曲線比較陡峭。Python 適用性強(qiáng),可以將分析的過程腳本化。所以,如果你想在這一領(lǐng)域有所發(fā)展,學(xué)習(xí) Python 也是相當(dāng)有必要的。
當(dāng)然其他編程語言也是需要掌握的。要有獨(dú)立把數(shù)據(jù)化為己用的能力, 這其中SQL 是最基本的,你必須會(huì)用 SQL 查詢數(shù)據(jù)、會(huì)快速寫程序分析數(shù)據(jù)。當(dāng)然,編程技術(shù)不需要達(dá)到軟件工程師的水平。要想更深入的分析問題你可能還會(huì)用到:Exploratory analysis skills、Optimization、Simulation、Machine Learning、Data Mining、Modeling 等。
業(yè)務(wù)理解
對(duì)業(yè)務(wù)的理解是數(shù)據(jù)分析師工作的基礎(chǔ),數(shù)據(jù)的獲取方案、指標(biāo)的選取、還有最終結(jié)論的洞察,都依賴于數(shù)據(jù)分析師對(duì)業(yè)務(wù)本身的理解。
對(duì)于初級(jí)數(shù)據(jù)分析師,主要工作是提取數(shù)據(jù)和做一些簡(jiǎn)單圖表,以及少量的洞察結(jié)論,擁有對(duì)業(yè)務(wù)的基本了解就可以。對(duì)于高級(jí)數(shù)據(jù)分析師,需要對(duì)業(yè)務(wù)有較為深入的了解,能夠基于數(shù)據(jù),提煉出有效觀點(diǎn),對(duì)實(shí)際業(yè)務(wù)能有所幫助。對(duì)于數(shù)據(jù)挖掘工程師,對(duì)業(yè)務(wù)有基本了解就可以,重點(diǎn)還是需要放在發(fā)揮自己的技術(shù)能力上。
邏輯思維
對(duì)于初級(jí)數(shù)據(jù)分析師,邏輯思維主要體現(xiàn)在數(shù)據(jù)分析過程中每一步都有目的性,知道自己需要用什么樣的手段,達(dá)到什么樣的目標(biāo)。對(duì)于高級(jí)數(shù)據(jù)分析師,邏輯思維主要體現(xiàn)在搭建完整有效的分析框架,了解分析對(duì)象之間的關(guān)聯(lián)關(guān)系,清楚每一個(gè)指標(biāo)變化的前因后果,會(huì)給業(yè)務(wù)帶來的影響。對(duì)于數(shù)據(jù)挖掘工程師,羅輯思維除了體現(xiàn)在和業(yè)務(wù)相關(guān)的分析工作上,還包括算法邏輯,程序邏輯等,所以對(duì)邏輯思維的要求也是最高的。
數(shù)據(jù)可視化
數(shù)據(jù)可視化主要借助于圖形化手段,清晰有效地傳達(dá)與溝通信息。聽起來很高大上,其實(shí)包括的范圍很廣,做個(gè) PPT 里邊放上數(shù)據(jù)圖表也可以算是數(shù)據(jù)可視化。
對(duì)于初級(jí)數(shù)據(jù)分析師,能用 Excel 和 PPT 做出基本的圖表和報(bào)告,能清楚地展示數(shù)據(jù),就達(dá)到目標(biāo)了。對(duì)于稍高級(jí)的數(shù)據(jù)分析師,需要使用更有效的數(shù)據(jù)分析工具,根據(jù)實(shí)際需求做出或簡(jiǎn)單或復(fù)雜,但適合受眾觀看的數(shù)據(jù)可視化內(nèi)容。
協(xié)調(diào)溝通
數(shù)據(jù)分析師不僅需要具備破譯數(shù)據(jù)的能力,也經(jīng)常被要求向項(xiàng)目經(jīng)理和部門主管提供有關(guān)某些數(shù)據(jù)點(diǎn)的建議,所以,你需要有較強(qiáng)的交流能力。
對(duì)于高級(jí)數(shù)據(jù)分析師,需要開始獨(dú)立帶項(xiàng)目,或者和產(chǎn)品做一些合作,因此除了溝通能力以外,還需要一些項(xiàng)目協(xié)調(diào)能力。
從學(xué)科知識(shí)來看,數(shù)據(jù)分析需要掌握的知識(shí)要點(diǎn)包括:
(1)統(tǒng)計(jì)學(xué):參數(shù)檢驗(yàn)、非參檢驗(yàn)、回歸分析等
(2)數(shù)學(xué):線性代數(shù)、微積分等
(3)社會(huì)學(xué):主要是一些社會(huì)學(xué)量化統(tǒng)計(jì)的知識(shí),如問卷調(diào)查與統(tǒng)計(jì)分析;還有就是一些社會(huì)學(xué)的知識(shí),這些對(duì)于從事營銷類的數(shù)據(jù)分析人員比較有幫助
(4)經(jīng)濟(jì)金融:如果是從事這個(gè)行業(yè)的數(shù)據(jù)分析人員,經(jīng)濟(jì)金融知識(shí)是必須的,這里就不多說了
1)數(shù)據(jù)分析報(bào)告類:Microsoft Office軟件等,如果連excel表格基本的處理操作都不會(huì),連PPT報(bào)告都不會(huì)做,那我只好說離數(shù)據(jù)分析的崗位還差的很遠(yuǎn)?,F(xiàn)在的數(shù)據(jù)呈現(xiàn)不再單單只是表格的形式,而是更多需要以可視化圖表去展示你的數(shù)據(jù)結(jié)果,因?yàn)閿?shù)據(jù)可視化軟件就不能少,BDP個(gè)人版、TABLUEA、Echart等這些必備的;
2)專業(yè)數(shù)據(jù)分析軟件:常見的有諸如SPSS、SAS、Matlab等等,這些軟件可以很好地幫助我們完成專業(yè)性的算法或模型分析,還有高級(jí)的Python、R等。
3)數(shù)據(jù)庫:hive、hadoop、impala等數(shù)據(jù)庫相關(guān)的知識(shí)可以學(xué)習(xí);
4)輔助工具:比如思維導(dǎo)圖軟件(如MindManager、MindNode Pro等)也可以很好地幫助我們整理分析思路。
希望同學(xué)們謹(jǐn)記:理論知識(shí)+軟件工具+數(shù)據(jù)思維=數(shù)據(jù)分析基礎(chǔ),最后要把這些數(shù)據(jù)分析基礎(chǔ)運(yùn)用到實(shí)際的工作業(yè)務(wù)中,好好理解業(yè)務(wù)邏輯,真正用數(shù)據(jù)分析驅(qū)動(dòng)網(wǎng)站運(yùn)營、業(yè)務(wù)管理,真正發(fā)揮數(shù)據(jù)的價(jià)值。
統(tǒng)計(jì)分析是統(tǒng)計(jì)工作的最后階段,具體內(nèi)容如下:
1、它將大量通過調(diào)查和整理的統(tǒng)汁資料,進(jìn)行科學(xué)分析,找出發(fā)展規(guī)律;
2、發(fā)現(xiàn)企業(yè)管理和計(jì)劃執(zhí)行中的問題和薄弱環(huán)節(jié),并找出其原因;
3、提出符合實(shí)際的解決問題的辦法或建議。
通過對(duì)資料的分析,最后會(huì)形成統(tǒng)計(jì)分析報(bào)告。統(tǒng)計(jì)分析報(bào)告是統(tǒng)計(jì)分析研究過程中所形成的論點(diǎn)、論據(jù)、結(jié)論的集中表現(xiàn),它乃是運(yùn)用統(tǒng)計(jì)資料和統(tǒng)計(jì)方法、數(shù)字與文字相結(jié)合,對(duì)客觀事物進(jìn)行分析研究結(jié)果的表現(xiàn)。
統(tǒng)計(jì)分析結(jié)果可以通過表格式、圖形式和文章式等多種形式表現(xiàn)出來。文章式的主要形式是統(tǒng)計(jì)分析報(bào)告。它是全部表現(xiàn)形式中最完善的形式。
擴(kuò)展資料:
統(tǒng)計(jì)分析是指運(yùn)用統(tǒng)計(jì)方法及與分析對(duì)象有關(guān)的知識(shí),從定量與定性的結(jié)合上進(jìn)行的研究活動(dòng)。它是繼統(tǒng)計(jì)設(shè)計(jì)、統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)整理之后的一項(xiàng)十分重要的工作,是在前幾個(gè)階段工作的基礎(chǔ)上通過分析從而達(dá)到對(duì)研究對(duì)象更為深刻的認(rèn)識(shí)。
它又是在一定的選題下,集分析方案的設(shè)計(jì)、資料的搜集和整理而展開的研究活動(dòng)。系統(tǒng)、完善的資料是統(tǒng)計(jì)分析的必要條件。
運(yùn)用統(tǒng)計(jì)方法、定量與定性的結(jié)合是統(tǒng)計(jì)分析的重要特征。隨著統(tǒng)計(jì)方法的普及,不僅統(tǒng)計(jì)工作者可以搞統(tǒng)計(jì)分析,各行各業(yè)的工作者都可以運(yùn)用統(tǒng)計(jì)方法進(jìn)行統(tǒng)計(jì)分析。只將統(tǒng)計(jì)工作者參與的分析活動(dòng)稱為統(tǒng)計(jì)分析的說法嚴(yán)格說來是不正確的。
提供高質(zhì)量、準(zhǔn)確而又及時(shí)的統(tǒng)計(jì)數(shù)據(jù)和高層次、有一定深度、廣度的統(tǒng)計(jì)分析報(bào)告是統(tǒng)計(jì)分析的產(chǎn)品。從一定意義上講,提供高水平的統(tǒng)計(jì)分析報(bào)告是統(tǒng)計(jì)數(shù)據(jù)經(jīng)過深加工的最終產(chǎn)品。
統(tǒng)計(jì)分析法的優(yōu)點(diǎn):方法簡(jiǎn)單,工作量小。
統(tǒng)計(jì)分析法的缺點(diǎn):定額的準(zhǔn)確性差,可靠性差。
一是對(duì)歷史統(tǒng)計(jì)數(shù)據(jù)的完整性和準(zhǔn)確性要求高,否則制定的標(biāo)準(zhǔn)沒有任何意義;
二是統(tǒng)計(jì)數(shù)據(jù)分析方法選擇不當(dāng)會(huì)嚴(yán)重影響標(biāo)準(zhǔn)的科學(xué)性;
三是統(tǒng)計(jì)資料只反映歷史的情況而不反映現(xiàn)實(shí)條件的變化對(duì)標(biāo)準(zhǔn)的影響;
四是利用本企業(yè)的歷史性統(tǒng)計(jì)資料為某項(xiàng)工作確定標(biāo)準(zhǔn),可能低于同行業(yè)的先進(jìn)水平,甚至是平均水平。
參考資料:百度百科——統(tǒng)計(jì)分析
《統(tǒng)計(jì)基礎(chǔ)知識(shí)與統(tǒng)計(jì)實(shí)務(wù)》依據(jù)“統(tǒng)計(jì)從業(yè)資格考試大綱”的要求,涵蓋了考試大綱所規(guī)定的所有基本內(nèi)容。編寫中充分考慮到教材培訓(xùn)對(duì)象的特點(diǎn)和知識(shí)層次,本著理論與實(shí)際相結(jié)合的原則,著眼于對(duì)統(tǒng)計(jì)理論基本知識(shí)的理解和統(tǒng)計(jì)工作基本技能的掌握,力求闡述規(guī)范、簡(jiǎn)明扼要、深入淺出、通俗易懂。全書分為統(tǒng)計(jì)基礎(chǔ)知識(shí)、統(tǒng)計(jì)實(shí)務(wù)兩部分。
國家統(tǒng)計(jì)局發(fā)布的“2013年統(tǒng)計(jì)從業(yè)資格考試大綱”較2012年相比,個(gè)別內(nèi)容有了變化。適應(yīng)這種變化,并根據(jù)2012年教學(xué)實(shí)踐中發(fā)現(xiàn)的問題,《統(tǒng)計(jì)基礎(chǔ)知識(shí)與統(tǒng)計(jì)實(shí)務(wù)》今年對(duì)原教材的部分內(nèi)容進(jìn)行了修改,但章節(jié)仍與原教材相同,即統(tǒng)計(jì)基礎(chǔ)知識(shí)部分包括:總論、統(tǒng)計(jì)調(diào)查、統(tǒng)計(jì)整理、統(tǒng)計(jì)指標(biāo)、時(shí)間數(shù)列、統(tǒng)計(jì)指數(shù)、抽樣調(diào)查基礎(chǔ)知識(shí)、統(tǒng)計(jì)分析基礎(chǔ)知識(shí);統(tǒng)計(jì)實(shí)務(wù)部分包括:統(tǒng)計(jì)報(bào)表制度綜述、統(tǒng)計(jì)分類與統(tǒng)計(jì)分類標(biāo)準(zhǔn)化、基本單位統(tǒng)計(jì)、生產(chǎn)活動(dòng)統(tǒng)計(jì)、能源統(tǒng)計(jì)、財(cái)務(wù)統(tǒng)計(jì)、勞動(dòng)統(tǒng)計(jì)、固定資產(chǎn)投資統(tǒng)計(jì)。
聲明:本網(wǎng)站尊重并保護(hù)知識(shí)產(chǎn)權(quán),根據(jù)《信息網(wǎng)絡(luò)傳播權(quán)保護(hù)條例》,如果我們轉(zhuǎn)載的作品侵犯了您的權(quán)利,請(qǐng)?jiān)谝粋€(gè)月內(nèi)通知我們,我們會(huì)及時(shí)刪除。
蜀ICP備2020033479號(hào)-4 Copyright ? 2016 學(xué)習(xí)鳥. 頁面生成時(shí)間:5.151秒