萬物分析的大數(shù)據(jù)
2019-05-22 14:47:09陽光高考網(wǎng)
一、專業(yè)解析
什么是大數(shù)據(jù)?
進入互聯(lián)網(wǎng)時代,中國的網(wǎng)民人數(shù)已超7億,大數(shù)據(jù)的應用涉及到生活的方方面面。例如,你在網(wǎng)站上買書,商家就會根據(jù)你的喜好和其他購書者的評價給你推薦另外的書籍;手機定位數(shù)據(jù)和交通數(shù)據(jù)可以幫助城市規(guī)劃;甚至用戶的搜索習慣和股市都有很大關(guān)系。
在談到大數(shù)據(jù)的時候,人們往往知道的就是數(shù)據(jù)很大,但大數(shù)據(jù)≠大的數(shù)據(jù)。對外經(jīng)濟貿(mào)易大學信息學院副院長華迎教授介紹:“現(xiàn)在的大數(shù)據(jù)包括來自于多種渠道的多類數(shù)據(jù),其中主要來源網(wǎng)絡數(shù)據(jù)。數(shù)據(jù)分析不是新的,一直都有,但是為什么叫大數(shù)據(jù)呢?主要是因為網(wǎng)絡數(shù)據(jù)的格式、體量、價值,都超出了傳統(tǒng)數(shù)據(jù)的規(guī)模。對這些海量信息的采集、存儲、分析、整合、控制而得到的數(shù)據(jù)就是大數(shù)據(jù)。大數(shù)據(jù)技術(shù)的意義不在于掌握龐大的數(shù)據(jù)信息,而在于對這些數(shù)據(jù)進行專業(yè)化處理,通過‘加工’實現(xiàn)數(shù)據(jù)的‘增值’,更好地輔助決策。”
數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)專業(yè)
本科專業(yè)中和大數(shù)據(jù)相對應的是“數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)”專業(yè),它是2015年教育部公布的新增專業(yè)。2016年3月公布的《高校本科專業(yè)備案和審批結(jié)果》中,北京大學、對外經(jīng)濟貿(mào)易大學和中南大學3所高校首批獲批開設“數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)”專業(yè)。隨后第二年又有32所高校獲批“數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)”專業(yè)。兩次獲批的名單中顯示,該專業(yè)學制為四年,大部分為工學。
“數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)是個交叉性很強的專業(yè),很難說完全歸屬于哪個獨立的學科。所以,不同的學校有的是信息學院申報,有的是計算機學院牽頭申報,有的設在統(tǒng)計學院,還有的在經(jīng)管學院。像北京大學這個專業(yè)是放在理學下,授予理學學位。大多數(shù)是設在工學計算機門類下,授予的是工學學位。”華迎教授說:“數(shù)據(jù)科學很早就存在,是個比較經(jīng)典的學科,現(xiàn)在和大數(shù)據(jù)技術(shù)結(jié)合形成了這個專業(yè)。目前教育部設定的本科專業(yè)名稱為‘數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)’,?泼Q是‘大數(shù)據(jù)技術(shù)與應用’。”
數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)學什么?
以對外經(jīng)濟貿(mào)易大學該專業(yè)為例,專業(yè)知識結(jié)構(gòu)包括數(shù)學、統(tǒng)計、計算機和大數(shù)據(jù)分析四大模塊,具體課程設置如下:
數(shù)學:數(shù)學分析一、數(shù)學分析二、高等代數(shù)、離散數(shù)學。統(tǒng)計學:概率論與數(shù)理統(tǒng)計、多元統(tǒng)計分析、隨機過程。計算機:數(shù)據(jù)結(jié)構(gòu)、計算機組成原理、操作系統(tǒng)、數(shù)據(jù)庫系統(tǒng)原理、C++程序設計、Java程序設計、Python與大數(shù)據(jù)分析、科學計算與Matlab應用、R語言等。大數(shù)據(jù)分析:數(shù)據(jù)科學導論、機器學習與數(shù)據(jù)挖掘、信息檢索與數(shù)據(jù)處理、自然語言處理、智能計算、推薦系統(tǒng)原理、大數(shù)據(jù)分析技術(shù)基礎(chǔ)、數(shù)據(jù)可視化、大數(shù)據(jù)存儲與管理、大數(shù)據(jù)分析實踐等課程。
華迎教授介紹:“數(shù)據(jù)科學與大數(shù)據(jù)技術(shù)是一門實踐性很強的新興交叉復合型學科,無論是開設在哪個學院下,數(shù)學、統(tǒng)計學、計算機三大塊課程是必須得有。各高校在這幾門背景學科的基礎(chǔ)上,交叉融合其他的專業(yè)知識技能。如我校在數(shù)學、統(tǒng)計學、計算機知識體系模塊中又增加了體現(xiàn)學校特色的財經(jīng)類行業(yè)應用和外語模塊,以提升學生的行業(yè)應用能力和國際化水平。根據(jù)各校偏重的專業(yè)方向,課程設置有所差異,感興趣的同學可以具體查看各校的專業(yè)和課程設置情況。”
二、專業(yè)與就業(yè)
行業(yè)增速快 人才缺口180萬
隨著移動互聯(lián)網(wǎng)和智能終端的普及,信息技術(shù)與經(jīng)濟社會的交匯融合,引發(fā)了數(shù)據(jù)迅猛增長。新摩爾定律認為,人類有史以來的數(shù)據(jù)總量,每過18個月就會翻一番。而海量的數(shù)據(jù)蘊含著巨大生產(chǎn)力和商機。
2011年至2014年四年間,我國大數(shù)據(jù)處于起步階段,每年均增長在20%以上。2015年,大數(shù)據(jù)市場規(guī)模已達到98.9億元。2016年增速達到45%,超過160億元。預計2020年,我國大數(shù)據(jù)市場規(guī)模將超過8000億元,有望成世界第一數(shù)據(jù)資源大國。但數(shù)據(jù)開放度低、技術(shù)薄弱、人才缺失、行業(yè)應用不深入等都是產(chǎn)業(yè)發(fā)展中亟待解決的問題。
根據(jù)領(lǐng)英發(fā)布《2016年中國最熱職位人才報告》顯示,有六類熱門職位的人才當前都處于供不應求狀態(tài),稀缺程度各有不同,其中,數(shù)據(jù)分析人才的供給指數(shù)最低,僅為0.05,屬于高度稀缺。
中國商業(yè)聯(lián)合會數(shù)據(jù)分析專業(yè)委員會資料顯示,未來3至5年,中國需要180萬數(shù)據(jù)人才,但截至目前,中國大數(shù)據(jù)從業(yè)人員只有約30萬人。同時,大數(shù)據(jù)行業(yè)選才的標準也在不斷變化。初期,大數(shù)據(jù)人才的需求主要集中在ETL研發(fā)、系統(tǒng)架構(gòu)開發(fā)、數(shù)據(jù)倉庫研究等偏硬件領(lǐng)域,以IT、計算機背景的人才居多。隨著大數(shù)據(jù)往各垂直領(lǐng)域延伸發(fā)展,對統(tǒng)計學、數(shù)學專業(yè)的人才,數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智能等偏軟件領(lǐng)域的需求加大。
大數(shù)據(jù)主要就業(yè)方向
2015年9月國務院印發(fā)《促進大數(shù)據(jù)發(fā)展行動綱要》,系統(tǒng)部署大數(shù)據(jù)發(fā)展工作!毒V要》明確提出了七方面政策機制,其中第六條就是加強專業(yè)人才培養(yǎng),建立健全多層次、多類型的大數(shù)據(jù)人才培養(yǎng)體系。目前,大數(shù)據(jù)主要有三大就業(yè)方向:大數(shù)據(jù)系統(tǒng)研發(fā)類、大數(shù)據(jù)應用開發(fā)類和大數(shù)據(jù)分析類。具體崗位如:大數(shù)據(jù)分析師、大數(shù)據(jù)工程師等。
“大數(shù)據(jù)分析師是用適當?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進行分析,強調(diào)的是數(shù)據(jù)的應用,側(cè)重于統(tǒng)計層面內(nèi)容會多一些。比如做產(chǎn)品經(jīng)理,可以通過數(shù)據(jù)建立金融模型,來推出一些理財產(chǎn)品。而大數(shù)據(jù)工程師則側(cè)重于技術(shù),主要是圍繞大數(shù)據(jù)平臺系統(tǒng)級的研發(fā),偏開發(fā)層面。”華迎教授介紹:“我們把大數(shù)據(jù)分析在業(yè)務中使用的流程總結(jié)起來,分為以下幾個步驟:數(shù)據(jù)獲取和預處理、數(shù)據(jù)存儲管理、數(shù)據(jù)分析建模、數(shù)據(jù)可視化。在這個應用流程中,畢業(yè)生可以根據(jù)自己的興趣和特長,在不同的環(huán)節(jié)選擇就業(yè)。”