- 相關(guān)推薦
相對(duì)于直接操作數(shù)據(jù)庫(kù)分析,hadoop和SPSS等分析軟件的作用
可能我的標(biāo)題會(huì)讓專業(yè)人士有些鄙視,我是作為一個(gè)基本小白的角度提出這個(gè)問(wèn)題的.
我目前在某國(guó)企的基層分公司從事數(shù)據(jù)統(tǒng)計(jì)工作,具體的工作就是按照市場(chǎng)分析人員的要求,每天從oracle數(shù)據(jù)庫(kù)里寫(xiě)SQL或存儲(chǔ)過(guò)程,調(diào)取相應(yīng)的數(shù)據(jù),制成excel表格給市場(chǎng)分析人員進(jìn)行二次加工或分析. 簡(jiǎn)單來(lái)說(shuō),算是個(gè)人肉數(shù)據(jù)提取器.
一晃工作已經(jīng)快十年了,感覺(jué)每天做的工作已經(jīng)從新奇變成低級(jí)的重復(fù)勞動(dòng),技術(shù)上已經(jīng)處于半荒廢狀態(tài),只對(duì)oracle有個(gè)大致的了解,對(duì)數(shù)據(jù)倉(cāng)庫(kù)的最簡(jiǎn)單應(yīng)用有個(gè)大概的認(rèn)識(shí).對(duì)于未來(lái)還是越來(lái)越惶恐,所以想學(xué)習(xí)一些新的知識(shí)來(lái)勉強(qiáng)跟上時(shí)代.
(我們常用的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)簡(jiǎn)略來(lái)說(shuō)是這樣的,若干個(gè)系統(tǒng)搜集的底層數(shù)據(jù)經(jīng)過(guò)清洗放在DW層,進(jìn)過(guò)二次加工的原始數(shù)據(jù)放在一個(gè)中間層MID層,最終系統(tǒng)級(jí)的展現(xiàn)及前臺(tái)應(yīng)用放在DM層; 而我們是通過(guò)這三層數(shù)據(jù)用SQL語(yǔ)句進(jìn)行一些系統(tǒng)外的整理加工. 一般的表日全量數(shù)據(jù)大約一千萬(wàn)到1億行不等,常用的基礎(chǔ)表大約百來(lái)個(gè))
由于一直從事的是數(shù)據(jù)挖掘(勉強(qiáng)算吧)工作,我們一直以來(lái)都是直接通過(guò)sql語(yǔ)句操作進(jìn)行過(guò)清洗的底層數(shù)據(jù).在網(wǎng)上搜索數(shù)據(jù)分析相關(guān)的知識(shí),大部分的答案都指向SPSS及hadoop等數(shù)據(jù)挖掘軟件. 大概搜索了一下這些軟件的概況,可能我比較笨或是很久沒(méi)有學(xué)習(xí)專業(yè)知識(shí)了,很難看懂它們的作用.
說(shuō)了那么多,主要想請(qǐng)問(wèn)下從事這個(gè)行業(yè)的牛人們,
1,假設(shè)我學(xué)習(xí)hadoop或SPSS,對(duì)我目前從事的數(shù)據(jù)統(tǒng)計(jì)分析工作有什么幫助?
2,相對(duì)于直接用sql操作數(shù)據(jù)庫(kù),hadoop和SPSS可以更便捷的實(shí)現(xiàn)哪些方面的功能?
3,這些軟件的學(xué)習(xí)周期大致是個(gè)什么情況?
4,在拋開(kāi)主題,我上面提到的數(shù)據(jù)倉(cāng)庫(kù)的規(guī)模下,擴(kuò)展學(xué)習(xí)哪些技能能起到最快的幫助.
期待專業(yè)人士的回答我這個(gè)開(kāi)始有些中年危機(jī)的小白,萬(wàn)分感謝. 可能我的標(biāo)題會(huì)讓專業(yè)人士有些鄙視,我是作為一個(gè)基本小白的角度提出這個(gè)問(wèn)題的.
我目前在某國(guó)企的基層分公司從事數(shù)據(jù)統(tǒng)計(jì)工作,具體的工作就是按照市場(chǎng)分析人員的要求,每天從oracle數(shù)據(jù)庫(kù)里寫(xiě)SQL或存儲(chǔ)過(guò)程,調(diào)取相應(yīng)的數(shù)據(jù),制成excel表格給市場(chǎng)分析人員進(jìn)行二次加工或分析. 簡(jiǎn)單來(lái)說(shuō),算是個(gè)人肉數(shù)據(jù)提取器.
一晃工作已經(jīng)快十年了,感覺(jué)每天做的工作已經(jīng)從新奇變成低級(jí)的重復(fù)勞動(dòng),技術(shù)上已經(jīng)處于半荒廢狀態(tài),只對(duì)oracle有個(gè)大致的了解,對(duì)數(shù)據(jù)倉(cāng)庫(kù)的最簡(jiǎn)單應(yīng)用有個(gè)大概的認(rèn)識(shí).對(duì)于未來(lái)還是越來(lái)越惶恐,所以想學(xué)習(xí)一些新的知識(shí)來(lái)勉強(qiáng)跟上時(shí)代.
(我們常用的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)簡(jiǎn)略來(lái)說(shuō)是這樣的,若干個(gè)系統(tǒng)搜集的底層數(shù)據(jù)經(jīng)過(guò)清洗放在DW層,進(jìn)過(guò)二次加工的原始數(shù)據(jù)放在一個(gè)中間層MID層,最終系統(tǒng)級(jí)的展現(xiàn)及前臺(tái)應(yīng)用放在DM層; 而我們是通過(guò)這三層數(shù)據(jù)用SQL語(yǔ)句進(jìn)行一些系統(tǒng)外的整理加工. 一般的表日全量數(shù)據(jù)大約一千萬(wàn)到1億行不等,常用的基礎(chǔ)表大約百來(lái)個(gè))
由于一直從事的是數(shù)據(jù)挖掘(勉強(qiáng)算吧)工作,我們一直以來(lái)都是直接通過(guò)sql語(yǔ)句操作進(jìn)行過(guò)清洗的底層數(shù)據(jù).在網(wǎng)上搜索數(shù)據(jù)分析相關(guān)的知識(shí),大部分的答案都指向SPSS及hadoop等數(shù)據(jù)挖掘軟件. 大概搜索了一下這些軟件的概況,可能我比較笨或是很久沒(méi)有學(xué)習(xí)專業(yè)知識(shí)了,很難看懂它們的作用.
說(shuō)了那么多,主要想請(qǐng)問(wèn)下從事這個(gè)行業(yè)的牛人們,
… 顯示全部
[相對(duì)于直接操作數(shù)據(jù)庫(kù)分析,hadoop和SPSS等分析軟件的作用]相關(guān)文章:
2.相對(duì)于直接操作數(shù)據(jù)庫(kù)分析,hadoop和SPSS等分析軟件的作用
【相對(duì)于直接操作數(shù)據(jù)庫(kù)分析,hadoop和SPSS等分析軟件的作用】相關(guān)文章:
spss統(tǒng)計(jì)分析實(shí)習(xí)心得01-24
PPT、EXCEL、SPSS、數(shù)據(jù)分析資料匯總07-10
spss統(tǒng)計(jì)分析實(shí)習(xí)心得2篇04-07
spss統(tǒng)計(jì)分析實(shí)習(xí)心得6篇01-24
spss統(tǒng)計(jì)分析實(shí)習(xí)心得(6篇)01-24
數(shù)據(jù)分析與辦公軟件:數(shù)據(jù)分析方法07-10
數(shù)據(jù)分析、SPSS、EXCEL、PPT、水晶易表資料匯總07-10
淘寶數(shù)據(jù)分析軟件07-10