首頁 > 精品范文 > 數據分析師統計學基礎
時間:2023-09-18 17:07:49
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇數據分析師統計學基礎范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
互聯網行業在快速發展,“互聯網+”概念的提出標志著互聯網已叩響“萬物互聯時代”的大門。在這個時代,大數據滲透于各行各業,掌握數據核心價值成為企業脫穎而出并取得勝利的法寶。越來越多的企業承認競爭優勢與大數據有關,由此,數據分析師這一職業逐漸得到認可并受到追捧。世界500強企業中,有90%以上都建立了數據分析部門。在國內,已有超過56%的企業在籌備和發展大數據研究,據有關部門預測未來5年,94%的公司都將需要數據分析專業人才。數據分析師的職位需求隨之不斷增長,全國數據分析師的職位由2014年初的200多個職位增長到接近3000個職位。正如著名出版公司O’Reilly的創始人Tim O’Reilly斷言,大數據就是下一個Intel Inside,未來屬于那些能把數據轉換為產品的公司和人群。
優秀的數據分析師已經成為促進各行各業發展,推動國家經濟進步的重要人物。但我國針對數據分析的研究起步晚,市場巨大,職位空缺現象十分嚴重。因此,培養數據分析人才的項目活動應引起高度重視。
1互聯網環境下的數據分析師
1.1數據分析師的定義
談起數據分析師,很多人都認為其職位高高在上,不可企及,但實際并非如此。讓我們從案例出發來探索其內在含義,數據分析最經典的案例便是“啤酒與尿布”,沃爾瑪超市將Aprior算法引入Pos機數據分析發現美國年輕的父親去超市為嬰兒購買尿布的同時,往往會順便為自己購買啤酒,這樣便使尿布和啤酒這兩樣看似不相干的商品有了某種聯系。于是,沃爾瑪嘗試將兩種商品擺放在同一區域,進而取得了意想不到的良好銷售收入。可見,數據分析是運用適當的方法對收集來的大量數據進行分析整理,篩選有價值的信息并形成相應的解決方案以幫助人們作出判斷,采取適當行動的過程。
1.2數據分析師的層級分類
經對多家招聘網站數據分析師的招聘信息進行分析研究,發現目前數據分析師大體分為三個層級:傳統行業的數據分析師、互聯網初級數據分析師、互聯網高級數據分析師。傳統行業的數據分析師的主要工作是整理、處理數據,專業技能只要具備一定的數學和統計學知識儲備即可;第二層級是互聯網初級數據分析師,職位要求在傳統數據分析師的基礎上掌握少數的計算機工具譬如SPSS、SQL等,從職人員需具備一定的數據敏感度和邏輯思維能力,能夠對數據源進行分析并能制作數據報表;互聯網高級數據分析師是一類復合型人才,要熟悉業務環境并能與技術相結合解決企業實際問題,并掌握數據挖掘常用算法和一系列相關的分析軟件,他們的工作與企業發展密切相連,擁有一名優秀的數據分析師的企業將擁有與同行業競爭的資本。
1.3數據分析師的能力需求
數據分析師的工作分為采集、存儲、篩選、數據挖掘、建模分析、優化、展現、應用等一系列過程。接下來從主要步驟詳細分析數據分析師的能力需求。數據挖掘過程即從海量數據中提取潛在的有價值的信息,要求數據分析師掌握一系列相關分析方法譬如聚類分析、關聯分析、等并能熟練運用數據挖掘算法和相關工具;建模分析即對數據抽象組織,確定數據及相關性的過程,在此基礎上要掌握譬如決策樹、神經網絡、K-means算法、SVM等至少一種相關算法;展現過程要求具備數據整理、數據可視化、報表制作能力,熟練應用D3、Vega實現數據可視化,并能運用R和DateWangler工具將原始數據轉化為實用的格式。
2數據分析師的培養現狀
2.1國外數據分析師的培養現狀
在國外,無論是學術研究還是企業部門,數據分析已發展到較為成熟的地步。斯坦福大學的研究成員著手開發MEGA(現代動態網絡圖像分析Modern Graph Analysis for Dynamic Networks)并與多家媒體公司緊密合作,研究社交媒體中的用戶行為,建立模型并探究其中的規律;哥倫比亞大學已開設了《數據科學導論》和《應用數據科學》課程,從2013年秋季起開設“數據科學專業成就認證”培訓項目,并于2014年設立專業碩士學位和博士學位;華盛頓大學開設《數據科學導論》課程,并對修滿數據科學相關課程學分的學生頒發數據科學證書。數據分析師在國外已引起了充分的重視,他們均衡分布在各行各業,運用掌握的專業知識并結合相關思維為自身、企業乃至社會的發展做著不小的貢獻。
2.2國內數據分析師的培養現狀
近年來,在國內,大數據的概念雖被媒體和行業廣泛提及,但數據分析算是剛剛起步,數據分析師的培養課程未得到普及,我國目前將數據分析納入教學體系的高校寥寥無幾,開設相關課程并取得一定成果的有:香港中文大學設立“數據科學商業統計科學”碩士學位;復旦大學開設數據科學討論班,于2010年開始招收數據科學博士研究生;北京航空航天大學設立大數據工程碩士學位;中國人民大學統計學院開設數據分析方向應用統計碩士。
和國外相比,我國數據分析師的人才培養機制還未成熟,高校教育仍存在各種各樣的問題,譬如,大學生雖然從多門課程中接觸到與數據分析相關內容,但各門課程的教學資源未能實現有效的整合。互聯網環境下,大數據帶來的是一場革命性的變化,若想把握機遇,實現國家經濟革命性發展,首要任務就是數據分析師的培養。
3如何成為優秀的數據分析師
數據分析師作為新時代新興起的高薪職業,對人員的能力要求是相當高的,下面將根據數據分析師的定義、能力需求并結合互聯網環境的時代背景,對數據分析師的成才途徑作出詳細的分析。
思維變革,數據分析師成才的前提。首先要在思維方面有所改變,培養自身數據思維、多模式思維、邏輯思維和結構化思維。數據思維即量化思維,對數據具有獨特的敏感度,相信一切事物皆可量化;多模式思維即構造多種想法和解決思路,拓寬思維,從多角度出發,以尋求最優的解決問題的方案;邏輯思維,在錯綜復雜的海量數據中要有縝密的思維和清晰的邏輯推理能力才能按照自己既定的目標有效解決問題;結構化思維即系統性思考問題,深入分析內在原因,能夠制定系統可行的解決方案。
技能變革,數據分析師成才的工具。作為一名優秀的數據分析師若想在互聯網環境下對海量數據進行有效的管理,就要努力學習相關的專業技能。要掌握多種機器學習方法,不斷學習相關軟件應用,譬如,Java、Python、SQL、Hadoop、R等等,這將成為數據分析全過程的輔助工具;除此,還要掌握一定的心理學知識,能夠很好的分析和解釋客戶行為;在此基礎上,最核心的是要掌握一定的業務能力和管理能力。
素質變革,數據分析師成才的保證。在個人素質方面,互聯網時代對數據分析師的要求增多,若想成為優秀的數據分析師就應不斷學習完善以下素質能力:對工作的態度嚴謹認真,對數據的變化時刻保持敏銳的洞察力,對方法的運用保持一定的創新性,對團隊保持團結合作之心,能與顧客溝通交流并及時了解他們的需求。
實踐,數據分析師成才的推動力。數據分析師的職責是幫助企業挖掘市場價值、發現機遇、準確進行市場定位并從海量數據中找出問題,提出解決方案。因此,在數據分析師的成才道路上,實踐是必不可少的。相關人員要在掌握理論的基礎上,敢于應用于實踐,充分考慮數據中存在的價值和風險。使自我能力在實踐中不斷改進和完善。
4給我國高校的建議
高校為數據分析師的成長提供指導和途徑,肩負著為我國社會培養有用人才的重任,因此高校要努力構建數據分析師的人才培養機制,不斷輸出數據分析相關人才。
高校的首要任務是,強化師資力量,改進教學方法。各大高校應聯合共建優秀師資團隊,鼓勵教師考取數據分析師資格證,并到實際企業中進行歷練。再者,我們要組建專門師資團隊到國外開展學習工作,取其精髓,去其槽粕,不斷優化我國數據分析師的培養體系。
第二、培養專業化的人才就要有效整合各門課程的教學資源,構建系統性教學結構。鑒于市場對數據分析師的需求的火熱程度,高校完全可以開設專門課程,將與數據相關的課程進行有機的整合并開設數據分析導論、基礎等課程,制定數據分析系統性課程體系,專門為市場培養數據分析的專業人才。
第三、在具備優秀的師資力量和良好的教學體系的基礎上,高校也高度應注重學生興趣的培養。數據分析師是新時代的復合型人才,一名優秀的數據分析師需掌握包括數學、統計學、運籌學、社會學、管理學以及大量軟件應用在內的大量相關知識,學習過程會十分繁瑣、復雜,學習周期長,學習難度大,所以建議各大高校在制定教學體系時應合理安排課程,在教學過程中應注重課程的趣味性,寓教于樂,采用案例導入、項目教學等教學方法,逐漸培養學生對數據分析濃厚的興趣。
第四、隨時更新教學數據,培養適應時展的人才。基于大數據的4V特征即大量化(Volume)、多樣化(Variety)、快速化(Velocity)、價值化(Value),在培養數據分析人才的期間,高校一方面要注重數據的全面性,另一方面要注重數據的更新,及時更改教學方法和教學案例,與時俱進。高校要充分利用互聯網的優勢,引入MOOC(Massive Open Online Course,大規模網絡開放課程)教學方式,充分發揮大數據在教育領域的作用,克服傳統教學方法資源少、反饋慢、綜合分析困難等缺點,將數據分析的研究成果應用于數據分析人才的培養,實現數據分析行業的良性循環。
第五、注重理論與實踐相結合,努力為學生搭建實踐的平臺。高校可考慮校企合作的教學理念,邊教學邊實踐,讓學生將所學到的理論知識轉化為實際應用,一方面在實踐中鞏固并檢驗自己的理論知識,另一方面數據來源真正的企業運營中,讓學生切實體驗數據的作用和風險,有助于塑造真正對企業有用的人才。
5結語
綜上所述,互聯網帶來了全球范圍的數據信息大爆炸,這對企業來說是機遇同時也是挑戰,能將大數據為自己所用,是企業取勝的關鍵,因此數據分析師逐漸被各行各業認可。文章從數據分析師的定義出發,結合目前的時代背景,對數據分析師的每一工作步驟所需的能力進行研究,旨在初步探索優秀數據分析師的成才之道,為即將成為數據分析師的學者提供一定的理論參考。最后,針對如何構建數據分析人才培養體系,對我國高校提出了幾點建議。高校的培養只是為數據分析師提供成才的途徑,如何成為資深的數據分析師還有賴于每個學者的不斷探索和研究。
參考文獻:
[1]張明元.數據分析師的職業是否高不可及[J].出國與就業,2007(08):56.
[2]鄭葵,馬濤.經管類專業大學生數據分析能力提升策略探討[J].商業經濟,2013(19):52-53.
[3]馮海超.大數據時代正式到來[J].互聯網周刊,2012(24):36-38.
[4]譚立云,李強麗,李慧.大數據時代數據分析人才培養的思考及對策[J].科技論壇,2015.
[5]尹穎堯,李鴻琳.趕緊培養數據分析師[J].大學生,2013(18):78-79.
[6]程征.提升數字閱讀質感的數據分析師[J].中國記者,2013(6):46-47.
[7]張文霖.數據分析師那些事[J].統計論壇,2013(7):44-45.
關鍵詞:大數據 市場調查與預測 教學改革 專業特色
中圖分類號:F274
文獻標識碼:A
文章編號:1004-4914(2017)02-237-02
一、引言
信息技術和社會化媒體的飛速發展引發了數據的大爆炸,而龐大的數據集為企業進行市場調查與預測提出了新的挑戰。為了適應新的企業需求,高校《市場調查與預測》課程的人才培養方案和培養模式必須做出相應的調整,引入新的教學方法和人才培養理念,使用更加先進的調查預測工具,為企業培養出具備數據分析能力的優秀人才。
二、課程改革的必要性
(一)大數據時代的要求
隨著大數據時代的到來,企業越來越重視基于大數據的更多樣本,更多實時數據的分析。對于市場專業本科階段的學生來講,雖然不能達到數據分析的專家,但是必須順應時代及企業人才需求的變化,提升數據分析的能力,《市場調查與預測》課程的教學改革迫在眉睫。
(二)傳統教學方法與教學模式存在很多弊端
《市場調查與預測》課程最顯著的特點就是實踐性強,但是傳統的教學方法與教學模式很難達到鍛煉學生實踐能力的目的。主要體現在以下三個方面:第一,傳統的注入式教學方法主要強調的是理論知識的傳授,學生缺乏參與感,很難調動學生的自主性和積極性,培養學生的創新性;第二,傳統課程安排實踐課時偏少,通過查閱各類院校本課程的教學計劃,多數高校實踐課時占總課程課時的比例不足30%,教師很難對整個實踐過程進行監管和指導。第三,傳統的教學模式忽略了對實踐能力的考核,基于實踐課時偏少,實踐成績所占總成績的比重很低且缺乏完整科學的成績評定體系,容易造成學生“搭便車”的現象;第四,《市場調研與預測》課程與《統計學》存在較強的相關關系,在授課過程中如果缺乏課程銜接與配合意識,很容易造成內容的重疊。同時,如果學生的統計學知識不扎實,對數據的分析僅僅停留在問卷調查數據的初步統計,很難提高學生的數據分析能力。
三、課程改革的基本思路
《市場調查與預測》課程的教學改革應順應大數據時展的要求,通過以學生為主體,教師為主導的教學方法,著重培養學生的實踐能力、創新能力和數據分析能力。教學內容上增加數據分析的內容,主要引入SPSS統計軟件的實驗課程,提升學生的數據分析能力;教學形式上采用課題式教學,通過課題式教學與分組合作學習的互動式教學模式提高學生的實踐能力;課程考核上,通過制定公平合理的考核制度提高學生參與實踐鍛煉的積極性,并在提高自身綜合素質的基礎上提高對教師教學的滿意度。
(一)教學內容的調整
依據市場調查與預測統計分析的需要,學生要先修《統計學》課程,通過和《統計學》教師的溝通與配合,《市場調查與預測》課程教學內容減少與《統計學》重復的理論部分,增加數據分析內容,尤其是SPSS操作模塊。與此同時,增加實踐課時。該課程的總課時為48學時,其中課堂理論授課占用24學時,SPSS操作占用12學時,實踐課時12學時。課程理論講授模塊的內容包括:市場調研方案設計、數據搜集方法、市場調研誤差、數據整理與分析、市場調研報告的撰寫、市場預測的基本方法。SPSS操作模塊包括:問卷設計與數據收集、問卷數據的錄入與清理、單變量的一維頻率分析、雙變量的交叉表分析、多選變量的一維頻率分析和交叉表分析、描述統計分析、簡單統計推斷、單因素方差分析、線性相關分析與線性回歸分析。@兩個模塊不是孤立的,而是通過課題式教學完成,學生通過選定的課題展開,圍繞選題在實踐課時完成完整的市場調研過程,應用SPSS完成數據的分析過程,最后以課題小組的形式進行匯報。
(二)教學的組織形式
教學組織形式上主要采用課題式教學與分組合作學習的形式,鼓勵學生按照興趣以4~6人為一組進行組隊,通過發現生活中與市場調查相關的實際問題,參與教師的課題項目,參與大學生市場分析大賽或者結合大學生創新項目等形式確定調研主題,明確調查目的、調查對象和調查范圍,設計調查方案。無論對于教師還是學生,新的科研項目的立項都會面對很多的新問題。在教學過程中,全體師生圍繞共同感興趣的科研課題展開教學與科研活動,形成一個學習型的教與學的團隊。提高學生自主學習與實踐的意識。師生在教學與科研活動中會有新的發現,達到教學相長的目的。
(三)課程成績評定方案的優化
由于《市場調查與預測》的課程加強了實踐環節,所以在最終課程的成績評定中,學生實踐環節的占比要相應的提高。我校傳統課程考核中,綜合成績=平時成績+期末成績。平時成績和期末成績分別占30%和70%。現計劃調整為:綜合成績=實踐成績+期末成績。其中實踐成績和期末成績各占50%。由于實踐環節都是分小組進行,調研報告和最終的匯報只能區分不同小組的最終表現,很難區分小組成員的實踐表現。為了防止小組成員在團隊作業中出現搭便車的現象,所以學生個人實踐成績=小組實踐成績70%+個人平時成績30%。小組實踐成績的評定在匯報過程中采取小組互評和老師評定相結合的方式,其中小組互評占30%,由其他小組評定的平均分計算得來,老師評定占70%,按照課題選題的難易程度及完成的工作量大小來確定。個人平時成績=組長評分30%+老師評分70%,組長評分根據組員的參與度及完成情況決定,老師評分根據小組分工的完成情況決定。這種成績評定結構盡可能的做到客觀公正,讓學生切身體會到自覺參與實踐鍛煉的重要性,促進學生積極投入到實踐鍛煉中,并在提高自身綜合素質的基礎上提高學生對教師教學的滿意度。
四、課程改革與專業特色
由于課程采用課題式教學與分組合作學習的形式,不僅鍛煉了學生的實踐能力和創新能力,而且對學生團隊溝通與合作能力也是一種提升。通過這種教學模式的實踐也可以為市場營銷專業特色的建立指明方向。
(一)以就業為導向
市場營銷專業的學生將來很可能從事市場調研工作,因此如果能在學習的基礎上考取相關證書可以很大程度提高就業率,比如可以鼓勵學生考取中級調查分析師證書。中級調查分析師證書考核的內容主要包括五個模塊:消費者行為學、調查概論、市場調查實務、抽樣技術和調查數據分析。學生可以側重以“消費者行為”為課題開展市場調查,不僅使學生掌握了市場調查的基本理論知識,而且也掌握了市場調查的實務,提高了數據分析的能力,實現了大數據時代企業對新的人才需求的無縫銜接。
(二)以專業競賽為導向
該課程的實踐環節也可以以專業大賽為依托,比如學生的選題可以先以校級大學生創新項目為基礎組織教學實踐,既完成了教學任務,又可以為參加更高層次的專業大賽奠定一定的基礎。在現有課題的基礎上選拔比較好的項目銜接省級大學生創新項目、全國及海峽兩岸大學生市場調查分析大賽等。這種模式既可以加強與全國高校的交流,也可以緊追市場調研實踐教學模式的前沿,拓寬任課教師的思路,促進教學質量的提升,提高教學滿意度。
總之,《市場調查與預測》課程的改革不僅順應了大數據時代的發展,同時也能體現出以市場調研為依托的專業特色。但是我校《市場調查與預測》課程的改革并非一蹴而就,也是一個循序漸進的過程。課程的改革不僅和現有師資水平有關,而且與學校的各種軟硬件配置以及實驗室建設也存在很大的關系。目前我校在《市場調查與預測》教學方面的軟硬件還存在很大的欠缺。如何提高實驗室的利用效率,加強實驗室軟硬件建設,實現SPSS操作課程與理論課程的無縫銜接也是需要我們通過調研來逐步改善的。同時,課程的建O需要長期的投入和努力,我們在提高學生的市場調研實踐能力,增強學生將來融入社會的適應能力的過程中還要不斷摸索和提升,緊跟時展的步伐。
參考文獻:
[1] 段曉梅.基于SPSS軟件的《市場調查與預測》實驗課程教學研究[J].教育教學論壇,2014(9)58~60
[2] 李紅梅.市場調研課程實踐性教學模式研究[J].教育教學論壇,2015(12)107~109
[3] 陳成棟,劉曉云.“市場調查與預測“課程教學改革實證研究[J].中國市場,2012(35)26~28
[4] 趙磊,朱娜.“大數據”時代農業高職院校財經類專業市場調查與預測人才培養方法探討與研究[J].經濟研究導刊,2014(27)187~188
關鍵詞:財務分析;大數據;教學改革
作者簡介:王暉(1973-),女,黑龍江雞西人,北京信息科技大學經濟管理學院,講師;段文軍(1969-),女,山東蓬萊人,北京信息科技大學經濟管理學院,副教授。(北京 100192)
基金項目:本文系北京信息科技大學教學提高-專業建設項目(項目編號:5028023501)的研究成果。
中圖分類號:G642.0 文獻標識碼:A 文章編號:1007-0079(2013)25-0111-02
當今時代不斷涌現各種新型信息方式,例如博客、社交網絡等;不斷興起各種新技術,例如云計算、物聯網等。數據的產生不受任何的限制,數據以前所未有的速度不斷增長和累積,大數據時代已經來到。[1]《華爾街日報》認為大數據時代是引領未來繁榮的三大技術變革之一。麥肯錫公司在一份報告中提出數據是一種生產資料。企業每天面對海量的財務數據,如超市的銷售記錄、銀行的交易記錄、淘寶網站數千萬筆交易記錄(產生量超過50TB,存儲量40PB①)。企業如能利用這些巨大的數據集挖掘出有價值的信息,那么企業就能掌控下一個創新、競爭和生產力提高的關鍵。大數據時代,尤其是財務大數據時代,呼喚創新型人才。[2]呼喚具備綜合財務分析能力的人才,利用財務大數據為企業創造財富。
如何培養財務分析人才?在財經類高校本科,一般都開設“財務分析”課程,該課程教學目的是培養學生對真實企業進行綜合財務分析,并能獨立撰寫財務分析報告的能力。[3]本文以北京信息科技大學(以下簡稱“我校”)為例,探討大數據時代下財務分析人才的需求特點,對高校“財務分析”課程設置的影響,并提出改進“財務分析”課程教學的建議。
一、大數據時代下財務分析人才需求特點
相較于其他類型數據,財務數據更大、更復雜,蘊藏著更多寶貴信息。麥肯錫公司2011年報告推測,利用大數據分析,零售商可增加運營利潤60%,制造業設備裝配成本會減少50%。[2]在財務大數據環境下,如何整理與統計這些雜亂無章的數據?如何讓財務數據開口說話為企業管理者經營決策提供科學依據?朱東華(2013)認為,大數據時代下,傳統的數據分析方法已經不再適應當前的數據環境,同時,各種企業對數據的依賴與日俱增,甚至定量分析方法將逐步取代定性分析方法。[4]財務大數據和大量的財務數據分析需求助長了企業對統計和數學背景的人才需求。
可見,大數據時代下財務分析人才應該具備扎實的統計學和數學功底,能夠熟練運用定量分析方法分析數據以獲取信息,撰寫分析報告為企業相關利益人決策提供依據。
二、“財務分析”課程教學現狀
張先治(2007)認為,財務分析是財務分析主體為實現財務分析目標,以財務信息及其他相關信息為基礎,運用財務分析技術,對分析對象的財務活動的可靠性和有效性進行分析,為經營決策、管理控制及監督管理提供依據的一門具有獨立性、邊緣性、綜合性的經濟應用學科。[5]財務分析課程是為我校經濟管理學院財務管理專業本科三年級開設的一門專業必修課。學生前期已經學過數學、經濟學、會計學、財務管理、統計學等課程。財務分析課程正是在學生掌握前期所學各門課程的基礎上,培養學生綜合運用所學專業知識,分析判斷企業的財務狀況,并根據數據分析結果找出企業存在的問題,提出解決方案。[6]為了更好地實現“財務分析”課程教學目的,課程組的老師們經過討論,決定修改2008級財務管理專業教學計劃,將原來課堂教學的方式改為1/2的學時用于課堂教授基本理論,1/2學時用于實踐教學。筆者自2011年開始,按照新的教學計劃給三屆學生講授了“財務分析”課程。
1.理論教學部分
教材選用東北財經大學出版社出版,張先治和陳友邦主編的《財務分析》(第五版)。該教材體系完整,內容豐富,全書以一家虛擬的ZTE公司為例,演示財務報告分析、財務效率分析和財務綜合分析。每章設有案例和復習思考題,該書還有配套的習題集。在課堂教學中,以教材為主線,突出介紹各種財務分析方法的使用,以及根據分析結果得出結論,提出解決方案。
2.實踐教學部分
一人一企,邊學邊分析。每位學生選擇一家上市公司作為分析對象,利用學校購買的金融數據庫以及相應網絡資源,結合所學財務分析理論知識進行上機實驗,在Excel內完成數據分析,并將分析結果形成財務分析報告。學生分析判斷和決策能力在實戰中得以鍛煉,教學效果得到改善。
但是,隨著大數據時代的來臨,外部環境對數據分析能力要求的提升,僅僅學會利用Excel進行水平分析、垂直分析、趨勢分析、比率分析和因素分析,已經遠遠不能滿足市場對財務分析人才的需求,學生就業的競爭力無從談起。結合前面大數據時代下財務分析人才需求特點,我校學生財務分析能力的培養存在著以下問題:
1.學生數據收集、整理和分析能力弱
定量分析方法應用的基礎是數據,財務分析人員必須學會從海量的網絡資源中搜集并篩選與自己的分析對象和分析目的相關性較強的資料信息,[7]這些資料信息可能是結構化數據,例如金融數據庫等;也可能是非結構化數據,例如網頁等。從實踐教學環節反映出學生數據收集和整理能力弱,分析其原因主要是:
(1)學生不熟悉對財務分析有幫助的網絡資源。搜集有價值的數據需要一定的技巧,其中最為重要的是熟悉一些重要的網站,知道相應的數據應該在哪里找到的概率比較大,做到有的放矢。
(2)學生無法將非結構數據快速地轉換成所需的數據形式。類似金融數據庫這樣的結構數據,學生基本能夠篩選出所需信息。但是,對于類似網頁這樣的非結構數據,他們就只能運用最原始的復制粘貼的方法提煉數據信息,耗時且耗力。2013年2月1日,人保財險執行副總裁王和在中國第七屆“保險業管理信息化高峰論壇”上指出,在過去的兩三年里,結構和非結構數據發生了本質性的逆轉。過去就整個社會來講,絕大多數的數據是結構數據,而現在非結構數據正呈快速增長的趨勢,現在以及未來,非結構數據將占到95%,甚至更多。
“財務分析”課程講授的基本方法主要是比率分析和因素分析法等。目前,無論是學術界還是業界,研究人員大量使用統計模型進行財務數據分析,例如聚類分析、多元回歸、因子分析、時間序列預測法等。因而,我校學生數據分析能力急需加強,尤其是統計學和數學的基礎要扎實。
2.學生財務分析報告撰寫水平有待提高
財務分析的結果是以財務分析報告的形式展示給企業利益相關人,為其進行財務預測、財務決策、財務控制和財務評價等提供可靠信息。財務分析報告是對企業經營狀況、資金運作的綜合概括和高度反映。李寶智(2012)認為,報告應具備八要素:準確、完整、可比、用戶導向、相關、問題的解決方案、及時和易用。[8]從我校學生提交的財務分析報告看,與上述要求還有很大差距。
三、“財務分析”課程教學改革建議
1.培訓網絡資源使用
重點介紹幾個數據庫的使用:
(1)金融數據庫。我校購買了兩款金融數據庫,北京聚源銳思數據科技有限公司金融數據庫(http://)和深圳市國泰安信息技術有限公司CSMAR財經系列研究數據庫(http://)。登陸金融數據庫后,輸入查詢條件即可下載上市公司財務數據,速度快且數據量大,數據格式可以任意選擇。
(2)中國資訊行(國際)有限公司高校財經數據庫(http://),INFOBANK于1995年在香港成立,是一家專門收集、處理及傳播中國商業、經濟信息的香港高科技企業,信息范圍涵蓋19個領域、197個行業。
(3)國務院發展研究中心信息網(國研網)(http://.cn)。國研網已建成了內容豐富、檢索便捷、功能齊全的大型經濟信息數據庫集群,包括:六十幾個文獻類數據庫、四十多個統計類數據庫等。
網站資源:中國證券監督管理委員會(http://)、上海證券交易所(http://.cn)、深圳證券交易所網站(http://)、巨潮資訊網(http://.cn)和相關協會網站等。
2.培養數據預處理和建模能力
收集到數據之后,需要對數據進行預處理,利用統計學的理論和方法將數據轉換成一個分析模型。[9]學生在統計學、計量經濟學課程中,已經完成基本模型理論、SPSS或者Eviews三分析軟件的學習。但是,若想實現對大數據的整理和分析,應該掌握R或者Matlab統計分析軟件,同時,還要掌握一種編程語言,例如C++、JAVA、C#等。利用編程語言調用統計分析軟件,從而實現大數據的分析。另外,建議學生了解Perl語言編程,該語言擅長處理非結構數據。
3.培養文獻閱讀及財務分析報告撰寫能力
數據分析之后,需要撰寫財務分析報告,為各方利益相關者的決策提供依據。不同財務分析的目的,形成的財務分析報告具體要求會有所差異,但是撰寫財務分析報告的基本步驟相同。首先查閱文獻,閱讀相關學術文章、財務分析師分析報告、評級機構報告等;其次,模仿寫作,組織財務分析結果,形成報告。此中沒有捷徑,需多看、多寫。
注釋:
①1TB 等于1000GB,1PB 等于1000TB。
參考文獻:
[1]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013,(1).
[2]鄔賀銓.大數據時代的機遇與挑戰[J].求是,2013,(4).
[3]張肖飛.財經類高校《財務分析》課程案例教學改革研究[J].商業會計,2013,(1).
[4]朱東華,張嶷,汪雪鋒,等.大數據環境下技術創新管理方法研究[J].科學學與科學技術管理,2013,(4).
[5]張先治.財務分析理論發展與定位研究[J].財經問題研究,
2007,(4).
[6]陳衛軍,徐文學,陳平.基于上市公司網上資源的《財務分析》實訓教學探討[J].財會通訊,2012,(2).
[7]王楨.網絡環境下財務分析案例教學方法的改進[J].中國教育信息化,2012,(1).
電信運營商擁有多年的數據積累,擁有諸如財務收入、業務發展量等結構化數據,也會涉及到圖片、文本、音頻、視頻等非結構化數據。從數據來源看,電信運營商的數據來自于涉及移動語音、固定電話、固網接入和無線上網等所有業務,也會涉及公眾客戶、政企客戶和家庭客戶,同時也會收集到實體渠道、電子渠道、直銷渠道等所有類型渠道的接觸信息。整體來看,電信運營商大數據發展仍處在探索階段。
大數據在電信行業應用的總體情況
目前國內運營商運用大數據主要有五方面:(1)網絡管理和優化,包括基礎設施建設優化和網絡運營管理和優化;(2)市場與精準營銷,包括客戶畫像、關系鏈研究、精準營銷、實時營銷和個性化推薦;(3)客戶關系管理,包括客服中心優化和客戶生命周期管理;(4)企業運營管理,包括業務運營監控和經營分析;(5)數據商業化指數據對外商業化,單獨盈利。
第一方面:網絡管理和優化。此方向包括對基礎設施建設的優化和網絡運營管理及優化。
(1)基礎設施建設的優化。如利用大數據實現基站和熱點的選址以及資源的分配。運營商可以通過分析話單和信令中用戶的流量在時間周期和位置特征方面的分布,對2G、3G的高流量區域設計4G基站和WLAN熱點;同時,運營商還可以對建立評估模型對已有基站的效率和成本進行評估,發現基站建設的資源浪費問題,如某些地區為了完成基站建設指標將基站建設在人際罕至的地方等。
(2)網絡運營管理及優化。在網絡運營層面,運營商可以通過大數據分析網絡的流量、流向變化趨勢,及時調整資源配置,同時還可以分析網絡日志,進行全網絡優化,不斷提升網絡質量和網絡利用率。
利用大數據技術實時采集處理網絡信令數據,監控網絡狀況,識別價值小區和業務熱點小區,更精準的指導網絡優化,實現網絡、應用和用戶的智能指配。由于用戶群的不同,不同小區對運營商的貢獻也不同。運營商可以將小區的數據進行多維度數據綜合分析,通過對小區VIP用戶分布,收入分布,及相關的分布模型得到不同小區的價值,再和網絡質量分析結合起來,兩者疊加一起,就有可能發現某個小區價值高,但是網絡覆蓋需要進一步提升,進而先設定網絡優化的優先級,提高投資效率。
德國電信建立預測城市里面的各區域無線資源占用模型,根據預測結果,靈活的提前配置無線資源,如在白天給CBD地區多分配無線資源,在晚上,則給酒吧地區多分配無線資源,使得無線網絡的運行效率和利用率更高。
法國電信通過分析發現某段網絡上的掉話率持續過高,借助大數據手段診斷出通話中斷產生的原因是網絡負荷過重造成,并根據分析結果優化網絡布局,為客戶提供了更好的體驗,獲得了更多的客戶以及業務增長;
第二方面,市場與精準營銷。此方向包括客戶畫像、關系鏈研究、精準營銷、實時營銷和個性化推薦。
(1)客戶畫像。運營商可以基于客戶終端信息、位置信息、通話行為、手機上網行為軌跡等豐富的數據,為每個客戶打上人口統計學特征、消費行為、上網行為和興趣愛好標簽,并借助數據挖掘技術(如分類、聚類、RFM等)進行客戶分群,完善客戶的360度畫像,幫助運營商深入了解客戶行為偏好和需求特征。
(2)關系鏈研究。運營商可以通過分析客戶通訊錄、通話行為、網絡社交行以及客戶資料等數據,開展交往圈分析。尤其是利用各種聯系記錄形成社交網絡來豐富對用戶的洞察,并進一步利用圖挖掘的方法來發現各種圈子,發現圈子中的關鍵人員,以及識別家庭和政企客戶;或者分析社交圈子尋找營銷機會。如在一個行為同質化圈子里面,如果這個圈子大多數為高流量用戶,并在這個圈子中發現異網的用戶,我們可以推測該用戶也是高流量的情況,便可以通過營銷的活動把異網高流量的用戶引導到自己的網絡上,對其推廣4G套餐,提升營銷轉化率。總之,我們可以利用社交圈子提高營銷效率,改進服務,低成本擴大產品的影響力。
(3)精準營銷和實時營銷。運營商在客戶畫像的基礎上對客戶特征的深入理解,建立客戶與業務、資費套餐、終端類型、在用網絡的精準匹配,并在在推送渠道、推送時機、推送方式上滿足客戶的需求,實現精準營銷。如我們可以利用大數據分析用戶的終端偏好和消費能力,預測用戶的換機時間尤其是合約機到期時間,并捕捉用戶最近的特征事件,從而預測用戶購買終端的真正需求,通過短信、呼叫中心、營業廳等多種渠道推送相關的營銷信息到用戶手中。
(4)個性化推薦。利用客戶畫像信息、客戶終端信息、客戶行為習慣偏好等,運營商可以為客戶提供定制化的服務,優化產品、流量套餐和定價機制,實現個性化營銷和服務,提升客戶體驗與感知;或者在應用商城實現個性化推薦,在電商平臺實現個性化推薦,在社交網絡推薦感興趣的好友。
第三方面,客戶關系管理。此方面包括客服中心優化和客戶生命周期管理。
(1)客服中心優化。客服中心是運營商和客戶接觸較為頻繁的通道,因此客服中心擁有大量的客戶呼叫行為和需求數據。我們可以利用大數據技術可以深入分析客服熱線呼入客戶的行為特征、選擇路徑、等候時長,并關聯客戶歷史接觸信息、客戶套餐消費情況、客戶人口統計學特征、客戶機型等數據,建立客服熱線智能路徑模型,預測下次客戶呼入的需求、投訴風險以及相應的路徑和節點,這樣便可縮短客服呼入處理時間,識別投訴風險,有助于提升客服滿意度;另外,也可以通過語義分析,對客服熱線的問題進行分類,識別熱點問題和客戶情緒,對于發生量較大且嚴重的問題,要及時預警相關部門進行優化。
(2)客戶關懷與客戶生命周期管理。客戶生命周期管理包括新客戶獲取、客戶成長、客戶成熟、客戶衰退和客戶離開等五個階段的管理。在客戶獲取階段,我們可以通過算法挖掘和發現高潛客戶;在客戶成長階段,通過關聯規則等算法進行交叉銷售,提升客戶人均消費額;在客戶成熟期,可以通過大數據方法進行客戶分群(RFM、聚類等)并進行精準推薦,同時對不同客戶實時忠誠計劃;在客戶衰退期,需要進行流失預警,提前發現高流失風險客戶,并作相應的客戶關懷;在客戶離開階段,我們可以通過大數據挖掘高潛回流客戶。國內外運營商在客戶生命周期管理方面應用的案例都比較多。如SK電訊新成立一家公司SK Planet,專門處理與大數據相關的業務,通過分析用戶的使用行為,在用戶做出離開決定之前,推出符合用戶興趣的業務,防止用戶流失;而T-Mobile通過集成數據綜合分析客戶流失的原因,在一個季度內將流失率減半。
第四方面,企業運營管理。可以分為業務運營監控和經營分析。
(1)業務運營監控分可以基于大數據分析從網絡、業務、用戶和業務量、業務質量、終端等多個維度為運營商監控管道和客戶運營情況。構建靈活可定制的指標模塊,構建QoE/KQI/KPI等指標體系,以及異動智能監控體系,從宏觀到微觀全方位快速準確地掌控運營及異動原因。
(2)經營分析和市場監測。我們可以通過數據分析對業務和市場經營狀況進行總結和分析,主要分為經營日報、周報、月報、季報以及專題分析等。過去,這些報告都是分析師來撰寫。在大數據時代,這些經營報告和專題分析報告均可以自動化生成網頁或者APP形式,通過機器來完成。數據來源則是企業內部的業務和用戶數據,以及通過大數據手段采集的外部社交網絡數據、技術和市場數據。分析師轉變為報告產品經理,制定報告框架、分析和統計維度,剩下的工作交給機器來完成。
第五方面,數據商業化。數據商業化指通過企業自身擁有的大數據資產進行對外商業化,獲取收益。國內外運營商的數據商業化都處于探索階段,但相對來說,國外運營商在這方面發展的更快一些。
(1)對外提供營銷洞察和精準廣告投放。
營銷洞察:美國電信運營商Verizon成立了精準營銷部門Precision Marketing Division。該部門提供精準營銷洞察(Precision Market Insights),提供商業數據分析服務。如在美國,棒球和籃球比賽是商家最為看中的營銷場合,此前在超級碗和NBA的比賽中,Verizon針對觀眾的來源地進行了精確數據分析,球隊得以了解觀眾對贊助商的喜好等;美國電信運營商Sprint則利用大數據為行業客戶提供消費者和市場洞察,包括人口特征、行為特征以及季節性分析等方面。
精準廣告投放:Verizon的精準營銷部門基于營銷洞察還提供精準廣告投放服務;AT&T提供Alert業務,當用戶距離商家很近時,就有可能收到該商家提供的折扣很大的電子優惠券。
(2)基于大數據監測和決策支撐服務。
客流和選址:西班牙電信于2012年10月成立了動態洞察部門DynamicInsights開展大數據業務,為客戶提供數據分析打包服務。該部門與市場研究機構GFK進行合作,在英國、巴西推出了首款產品名為智慧足跡(Smart Steps)。智慧足跡基于完全匿名和聚合的移動網絡數據,幫助零售商分析顧客來源和各商鋪、展位的人流情況以及消費者特征和消費能力,并將洞察結果面向政企客戶提供客流分析和零售店選址服務。
為適應社會經濟發展需要,本專業堅持以培養素質優良的復合型、創新型、應用型人才為中心,培養面向我國特別是河北省經濟社會發展需要,德、智、體全面發展,具備扎實的經濟學理論、西方經濟學理論以及現代管理學理論,具有良好的數學素養,掌握統計學的基本理論和方法,能熟練地運用計算機進行數據管理與分析,能在企事業單位和經濟管理部門從事統計調查、統計信息管理與分析等工作的應用型合格畢業生。其培養的學生具有人文素養,熟知和掌握統計學基礎知識、基本理論、基本方法和技能,受到應用基礎和技術開發方面的科學思維和科學實驗訓練,具有較強的開拓創新能力、溝通協調能力和預測決策能力;具有系統、扎實的科學文化知識和全面的身心健康素養,能夠在工作中科學地采集各類信息數據,并能夠運用現代技術手段建立統計模型,綜合分析解決相關領域實際問題。
二、統計學專業學生素質拓展結構分析
為了實現學生實踐能力培養的目標,使統計學專業畢業生掌握多種專業核心技能,按照、教育部、全國學聯出臺的《關于實施“大學生素質拓展計劃”的意見》,在思想政治與道德素養、社會實踐與志愿服務、科學技術與創新創業、文體藝術與身心發展、社團活動與社會工作、技能培訓等六個方面引導和幫助廣大學生完善智能結構。在課程設置上,把第一課堂的教育與第二課堂的活動有效結合,按照“平臺+模塊”的模式,構建以第一課堂教育課程為基礎的“大學生素質拓展課程化建設體系”,實現大學生素質拓展模塊化、項目化、課程化、體系化。
以第一課堂為基礎,改善以提高學生綜合素質與應用能力為目標的課程體系,劃分多個模塊,分項實施,全方面提升學生素質與能力。第一課堂的模塊主要包括基本技能模塊、專業技能模塊、專業技能拓展與創新能力培養模塊。將大學生第二課堂的各項活動分為思想道德素養、身心健康素養、科學文化素養、社會實踐與志愿服務、社團活動與社會工作、技能培訓與創新創業等六個功能模塊,加強第二課堂教育中的實踐環節,整合提升第二課堂中有助于提高大學生綜合素質的各項活動和工作項目,有針對性的進行工作設置,全面發展學生的綜合素質與應用能力的培養。
1、基本技能模塊
基本技能模塊主要包括思想道德教育、身心健康教育等內容,主要是通過思想政治課、大學生職業規劃課、法律、體育和語言、計算機及數據庫等課程展開,從人的基本素養方面著手培養學生的基本技能。語言模塊具體包括外語、大學語文及應用文寫作等內容。計算機及數據庫操作模塊具體包括計算機基本知識、基本操作與應用管理、數據庫的建立與管理等內容。
2、專業技能模塊
(1)專業基礎技能模塊
專業基礎技能模塊主要包括經濟理論、管理理論、會計與財務理論以及統計基本理論等內容。經濟理論部分主要包括政治經濟學、微觀經濟學、宏觀經濟學以及相關的經濟學分支等內容,其目標是讓學生掌握基本經濟理論及其分析方法,能夠運用經濟理論于實際問題的分析,并做出初步判斷。管理理論部分主要包括管理學、現代企業管理、人力資源管理及市場營銷學等內容,其目標是讓學生熟知各種管理理論,掌握控制、組織、計劃等管理環節的基本知識;掌握經典的管理研究方法、熟悉市場營銷的基本理論以及人力資源、組織設計等相關知識。會計與財務理論部分主要包括會計基本理論、財務理論、稅收籌劃等內容,其目的是讓學生熟悉會計和財務基本知識,了解納稅申報和稅收籌劃等相關知識。統計基本理論主要包括數理統計理論、描述統計、推斷統計等內容,其目的是讓學生理解數理統計的基本知識、掌握統計學基本原理,為專業核心技能的學習與掌握打下堅實基礎。
(2)專業核心技能模塊
專業核心技能模塊主要包括統計分析方法、經濟模型構建、經濟分析與決策、統計學軟件應用等內容。統計分析方法主要包括多元統計分析、時間序列分析、抽樣技術、非參數統計等課程,其目的是讓學生掌握基本的數據分析方法,為實際工作及進一步的深造創造有利的條件。經濟模型主要包括數理經濟學和計量經濟分析等內容,其目的是讓學生掌握計量經濟分析的基本原理與實際應用,以及把經濟模型與實際問題結合進行理論構建及各種檢驗的方法。經濟分析與決策主要包括經濟社會統計、國民經濟統計、統計預測與決策等課程,其目的是培養學生對經濟社會現象進行數據收集和統計分析的基本技能,并以此為基礎對經濟社會的運行進行必要的預測與決策,為經濟管理提供必要的智力支持。統計學軟件應用,這是一個對實踐能力要求較高的層次,主要是通過對常用統計軟件的掌握,為專業基礎技能、統計分析方法、經濟模型分析以及統計預測與決策等技能的實現創造便捷的條件,這一部分主要通過統計實驗進行,是一個理論聯系實踐的關鍵環節,為使這一環節通暢、順達,以有利于綜合素質和應用能力的全面提升,故必須在各種課程設置中加強實驗的比重,強化實驗的掌握。
(3)綜合技能模塊
綜合技能模塊主要包括各種應用調查方法、統計數據收集與整理、數據分析方法的綜合應用,這一模塊主要是通過引導學生參加各種社會實踐、參與教師的科研調查以及各類型比賽實現。其目的是培養學生綜合運用統計學知識,進行統計設計、統計調查、統計整理、統計分析的意識和能力,并能夠熟練運用統計分析方法進行統計報告的撰寫與演示等工作。
3、專業技能拓展與創新能力培養模塊
專業技能拓展與創新能力培養模塊主要包括經濟形勢分析與預測、團隊組織和管理技能、項目評估和專業資格認證體系等內容。其目的是加強統計學基本知識與相關專業的結合,以滿足學生不同發展需要。經濟形勢分析與預測模塊主要由經濟問題報告及相關學術沙龍組成,使學生能夠熟練運用經濟學理論對宏觀、區域、行業經濟形勢進行分析和預測,提出相應政策性建議的方法。經濟管理研究方法模塊主要由學生參與的相關科研與教學培訓構成,其目的是加強科研訓練,熟悉科學研究的一般程序、方法和基本流程,熟練運用各種研究方法,為實際工作和進一步深造奠定良好基礎。項目評估模塊主要是針對各類實際項目進行經濟、社會與財務評價,通過項目評估、財務規劃和稅收籌劃等理論知識的運用,讓學生熟悉和掌握各種評估方法及可行性論證分析過程,擴大統計學專業的就業領域。與統計學專業聯系緊密的資格認證有調查分析師、統計軟件認證以及數據庫分析等,專業資格認證體系模塊主要是為學生的資格認證提供培訓或相關輔導,通過學生的資格認證強化學生能力,增強就業競爭力。
三、以社會調查為平臺的實踐教學方案設計
這些新的技術、新興應用和對應的IT發展趨勢,使得IT人必須了解甚至掌握最新的IT技能。另一方面,云計算和大數據乃至其他助推各個行業發展的IT基礎設施的新一輪部署與運維,都將帶來更多的IT職位和相關技能技術的要求。
毫無疑問,這些新趨勢的到來,會誕生一批新的工作崗位,比如數據挖掘專家、移動應用開發和測試、算法工程師,商業智能分析師等,同時,也會強化原有崗位的新生命力,比如網絡工程師、系統架構師、咨詢顧問、數據庫管理與開發等等。下面分別為大家介紹著十大IT技能所體現的工作崗位:
一、算法工程師
何萬青博士曾經介紹把一件事做快做好的三種方法,其中就提到過“提高流水線效率、更好的算法和更短的代碼關鍵路徑。”可以看出算法在系統效率中的重要地位。算法是讓機器按照人類設想的方式去解決問題,算法很大程度上取決于問題類型和工程師對機器編程的理解,其效率的高低與算法息息相關。
在數學和計算機科學之中,算法(Algorithm)為一個計算的具體步驟,常用于計算、數據處理和自動推理。在大數據時代,算法的功能和作用得到進一步凸顯。比如針對公司搜索業務,開發搜索相關性算法、排序算法。對公司海量用戶行為數據和用戶意圖,設計數據挖掘算法。
算法工程師,根據研究領域來分主要有音頻/視頻算法處理、圖像技術方面的二維信息算法處理和通信物理層、雷達信號處理、生物醫學信號處理等領域的一維信息算法處理。另外數據挖掘、互聯網搜索算法這些體現大數據發展方向的算法,在近幾年越來越流行,而且算法工程師也逐漸朝向人工智能的方向發展。
二、商業智能分析師
算法工程師延伸出來的商業智能,尤其是在大數據領域變得更加火熱。IT職業與咨詢服務公司Bluewolf曾經報告指出,IT職位需求增長最快的是移動、數據、云服務和面向用戶的技術人員,其中具體的職位則包括有商業智能分析師一項。
商業智能分析師往往需要精通數據庫知識和統計分析的能力,能夠使用商業智能工具,識別或監控現有的和潛在的客戶。收集商業情報數據,提供行業報告,分析技術的發展趨勢,確定市場未來的產品開發策略或改進現有產品的銷售。
商業智能和邏輯分析技能在大數據時代顯得特別重要,擁有商業知識以及強大的數據和數學分析背景的IT人才,在將來的IT職場上更能獲得大型企業的青睞。不過這些技能并不是一般人都能掌握的,一些公司目前正在招聘統計學家并教授他們有關技術和商業的知識。
三、數據挖掘工程師
數據挖掘工程師,也可以叫做“數據挖掘專家”。數據挖掘是通過分析每個數據,從大量數據中尋找其規律的技術。數據挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統計學、數據庫、可視化技術等,高度自動化地分析企業的數據,做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,做出正確的決策。
數據挖掘專家或者說數據挖掘工程師掌握的技能,能夠為其快速創造財富。當年亞馬遜的首位數據挖掘工程師大衛·賽林格(David Selinger)創辦的數據挖掘公司,將類似于亞馬遜的產品推薦引擎系統銷售給在線零售和廣告銷售商,而這種產品推薦引擎系統,也成為亞馬遜有史以來最賺錢的工具。數據挖掘的價值由此可見一斑。
四、咨詢顧問(專家)
任何業務部門和任何行業企業,都有IT系統在背后默默無聞地支撐著。在云計算大數據時代,業務面臨的挑戰和機遇也會給IT系統帶來更多要求。在這種情況下,IT系統的規劃部署和運維,都要有更為精通的專業人士才能勝任,并滿足面向未來大數據分析、云計算服務應用的需要。
紐約蒙特法沃醫療中心(montefioremedical center)的副主席杰克-沃夫(JackWolf)曾經表示,他尋求不僅會建立和使用系統而且還會給予其他員工技術支持的新員工,他說:”新的系統意味著你必須有更多的咨詢臺來處理更多的咨詢量。”當然,這里體現的主要是某個系統的技術支持的功能,但管中規豹我們不難發現,無論是部署初期的物料采購還是運維過程中的金玉良言,都凸顯出這種技術咨詢顧問的重要性。
五、網絡工程師
網絡工程師可以說是一個“綠色長青”的職業,網絡技術一直以來就處于急需之中,美國人力資源公司羅勃海佛國際(Robert Half International)第三季度IT招聘指數和技能報告指出,網絡管理占總需求技能排名中的第二位。對于云計算時代來說,網絡在云資源池中(計算、存儲、網絡)更是扮演著更為重要的作用。
另一方面,IPv6標準、物聯網、移動互聯等蓬勃發展,使得對于網絡工程師尤其是新型網絡工程師(移動、IPv6、云計算方向)的人才和技能要求也越來越多。網絡工程師也因此而可以細分成多個發展方向,相應的技能要求其側重也有所不同。比如網絡安全、網絡存儲、架構設計、移動網絡等等。
六、移動應用開發工程師
移動應用開發,會隨著移動互聯網時代的到來變得更受追捧。截至2012年底我國已經有10億手機用戶,移動智能終端用戶超過4億,在移動支付、移動購物、移動旅游、移動社交等方面涌現了大量的移動互聯網游戲、應用和創業公司。
移動平臺智能系統較多,但真正有影響力的也不外乎iOS、Android、WP、Blackberry等。大量原來PC和互聯網上的信息化應用、互聯網應用均已出現在手機平臺上,一些前所未見的新奇應用也開始出現,并日漸增多。
移動應用開發,由于存有多個平臺系統,因此不同的平臺開發者其所面臨的機遇和挑戰也不盡相同。一個很明顯的例子就是,當初由Google公司和開放手機聯盟領導及開發的基于Linux的安卓系統,在開源之后就給廣大開發者(商)帶來巨大商機,而堅定選擇iOS平臺的的開發工程師,也通過蘋果生態系統的不斷擴建和智能設備的高市場占有,使得較早的一批開發者都賺得盆滿缽滿。不過在國內由于用戶習慣、產業環境和版權保護的問題,移動應用開發者并沒有因此而獲得相應的收益。
七、軟件工程設計師
近年IT業界逐漸涌現出一股軟件定義網絡(SDN)、軟件定義數據中心、軟件定義存儲(SDS)和軟件定義服務器(MoonShot)等浪潮,大有軟件定義未來一切IT基礎設施的趨勢。
PaaS、SaaS、數據挖掘和分析、數據管理和監控、虛擬化、應用開發等等,都是軟件工程師大展身手的好舞臺。相應的,這些技術領域也對軟件工程師的要求會更高,尤其是虛擬化和面向BYOD、云計算、大數據等應用的開發和管理,都需要有更高深的技術支撐。
和算法工程師有點類似的地方在于,軟件工程師也需要注重設計模式的使用,一位優秀的工程師通常能識別并利用模式,而不是受制于模式。工程師不應讓系統去適應某種模式,而是需要發現在系統中使用模式的時機。
八、數據庫開發和管理
細心的球迷一定會留意到這樣一個細節:NBA比賽進行中,球隊的助理教練總是坐在場邊,手中拿著一塊書寫板記錄著什么。他們的確是在記錄數據,但那絕非是得分或籃板這樣的“初級數據”。他們記錄的是球員在油漆區的觸球次數、每回合傳球次數、內傳外的三分投籃次數、間接助攻(真正助攻前發生的那次傳球)、造犯規次數等。這一系列數據雖然跟比賽密切相關,可在任何傳統意義上的數據統計單上,你都無法查詢到相關數據。
這些用紙筆記錄下的數據雖然重要,但都無法跟多個NBA球館天花板上空所懸掛的那些微型攝像機所記錄的相媲美。這些攝像機,是被稱為Sport VU的系統的一部分,它有巨大的潛力改變我們對于NBA數據分析的一切認知。
Sport VU能告訴我們,在NBA當中,哪個球員的速度是最快的。它告訴我們的不是誰得分最多,而是誰每次觸球得分最多。它能告訴我們每場比賽誰的運球次數最多,與他們投籃出手次數相比,誰的運球次數最多,這一切,其實只是顯性的東西。
如果你質疑這套系統的權威性,那么你只要了解一點:Sport VU誕生于2005年,它由以色列科學家麥基·塔米爾發明,此人是導彈追蹤以及高端光學識別方面的專家。塔米爾后來用其中的技術試著去追蹤了以色列的一些足球賽,分析其中的數據,后來他將這項技術用在了追蹤NBA及其他比賽。
2008年,美國的STATS公司收購了Sport VU,并且將精力集中在了籃球數據分析上面。2009-10賽季,STATS公司戰略和發展副總裁科普找到了幾支技術悟性最高的NBA球隊,試圖說服他們加入試驗。最終,小牛、火箭、雷霆和馬刺成為該系統的“小白鼠”。接下來的一年,凱爾特人和勇士也加入到了這個行列。
到了本賽季,已經有15支球隊用上了Sport VU,他們分別是:尼克斯、魔術、凱爾特人、奇才、雄鹿、猛龍、76人、騎士、小牛、雷霆、森林狼、勇士、火箭、馬刺和太陽,各支球隊為此大概每年要花費十萬美元。
這套系統究竟是如何運轉的?每座球館天花板上空都懸掛有六個跟計算機連通的攝像頭,每個半場設置三個。這些攝像頭跟復雜的、從XYZ定位系統中提取數據的計算公式同步,每秒能抓取25幅圖片。每張圖片都記錄有時間,并自動由電腦處理。電腦跟比賽實況報道(play-by-play)數據相連,一個回合90秒之內就能發出報告。這一點是STATS公司員工最為自豪的一點,他們在軟件中所使用的計算公式是他們的專利,被他們稱之為ICE平臺。幾乎是同步,想要查閱數據的教練和數據研究人員就能在他們的電腦、iPad上查看這些信息,有時候他們并不知道如何使用這些數據,但起碼,他們擁有這些數據。
凱爾特人主帥里弗斯曾問過球隊數據分析師扎倫一個問題:當朗多每個回合持球時間超過五秒時,凱爾特人的進攻效率如何。在使用這套數據系統前,扎倫被問的啞口無言無法回答,而如今,他可以大聲響亮的告訴里弗斯答案了。因為Sport VU能夠追蹤每一個球員每個動作、每次傳球、每次投籃、每次觸球,一切的一切。
事實上,這套系統能夠追蹤的信息,比各支球隊了解的多得多。每個總經理都表示,他們所使用的這套數據系統提供的數據,只是該系統提供的數據的一小部分。不過他們均認可,這套系統,是高端籃球數據分析的未來。
“我們需要30支球隊對這些數據形成一種真正的度量標準,”森林狼籃球運營助理,同時也是Sport VU工作人員的波萊羅說道,“等到30支球隊全部加入,我們依然認為我們只能使用這套系統5%-10%的內容,這套系統真的會改變比賽,但是在我們到達那一步之前,這只是美好的設想。”
至于這套系統給教練、觀察家們帶來了哪些具體利好,我們只需要看看這套系統的一些實際應用就好了。
籃球精算師
有些球隊才剛開始用Sport VU,而那些更早接觸到它的球隊已經走在了前面。不過這15支球隊一直都對他們是如何使用這些數據遮遮掩掩,但是有一支球隊——多倫多猛龍——在斯隆管理學院體育分析年會,向公眾揭開它的冰山一角。
猛龍的數據分析團隊寫出了無比復雜的代碼,把錄下的比賽中每一秒的X-Y坐標全部轉化成了可以看的視頻資料。被還原的場面之一是今年2月23日猛龍主場戰勝尼克斯的比賽的第一節,賈森·基德利用卡梅隆·安東尼的擋拆投中了一記三分球。這段視頻里,尼克斯球員用藍色顯示,傳遞著小黃球,多倫多球員被則是白色顯示。它看起來很簡單,但是轉換的過程需要很多人,包括三名多倫多管理層的雇員,花掉很多時間。
這些代碼可以識別所有的東西——什么時候發生了擋拆,在哪里發生的,掩護是否真的擋到了防守球員,以及執行戰術時場上十名球員的位置。
Sport VU還可以識別每個球員的技能的能力,所以它明白克里斯·保羅在中距離位置遠比拉簡·朗多要危險,還有羅伊·希伯特比埃爾·霍福德要高。這部分內容對猛龍研究出來的最有用的部分至關重要:視頻里穿著猛龍球員相同號碼的透明的小圈圈,它們是“影子球員”,它們跑的是多倫多教練組和分析團隊認為球員在一套戰術中應該做的。猛龍分析團隊可以用這個期望值系統,拋開多倫多的計劃,構建一個“理想化”的防守。這么說吧,在對手的一次進攻中,凱爾·科沃爾投出底角空位三分的期望值比約什·史密斯在防守下投出六米開外的跳投的期望值要高得多。當然,得出結論也未必管用,因為教練組的一些人對于這些新的數字和電腦程序的價值還有所疑慮。
“你需要執教方的視角。我們還在找哪些規則錯了——哪些地方系統的數據與我們在場上實際做的不符。”猛龍分析團隊的主管阿利克斯·魯克爾說。
比方說,影子球員在協防上一般比真正的猛龍球員更有侵略性。看看猛龍同尼克斯比賽中一次進攻的初始形態,雷蒙德·菲爾頓和泰森·錢德勒在右翼擋拆時,影子德羅贊處在油漆區中央,以阻攔任何給錢德勒的傳球,同時影子菲爾茲的在弱側區域防守著安東尼和基德。
影子菲爾茲比實際比賽里更靠近位于地角的基德,原因是程序知道底角三分的期望值更高,這也是為什么影子蓋伊往菲爾茲那邊挪了一點,而現實版本中兩名球員都更靠近自己原來盯防的球員。
尼克斯最后重新調整,把球交給了安東尼跟錢德勒打檔拆。再看看錢德勒切入籃下時的影子德羅贊和真實的德羅贊都是怎樣做的。
影子德羅贊很早就離開了基德去補防錢德勒,而且比真正的德羅贊站位更高。因為安東尼正朝著右翼運球,左翼成了“弱側”,在幾乎所有的NBA防守中,協防切向的大個子(錢德勒)都是弱側防守者的責任。德羅贊這么做了,但他做的太晚了;早點的話可以更早阻止錢德勒,可以讓他和瓦蘭修納斯更容易地回去防守自己對位的球員。
根據分析團隊得出的結論,球隊理想防守中的影子球員總是比真正的球員更兇猛地協防,而且幾乎整個聯盟中都是這樣。球隊要么就還沒有意識到他們應該更多地補防中區和強側,要么就還沒有說服球員這么做。
關鍵問題在于,要讓球員改變他們的防守習慣很難,讓他們離開自己原本盯防的球員如此之遠就更困難了。“球員不希望受到指責,或是在電視上看見自己沒能防到一次扣籃或是空位三分。”麥卡·諾里說,他是猛龍的助理教練,與魯克爾的團隊關系密切,“盡管籃球是五個人防守一個球,你很難讓球員擺脫掉‘這個人屬于我’的觀念。”
侵略性十足的協防需要球員們異常努力,類似尼克斯球員在傳球的時候影子德羅贊所跑的距離,就不像是真實的球員能做到的。所以聯盟中惟一一支在防守端能夠經常打出與自己影子重合的球隊只有熱火,這絕非巧合。邁阿密有聯盟最好的側翼防守者之三——巴蒂爾、詹姆斯和韋德,后兩位也位于全聯盟運動能力最好的球員之列。“勒布朗基本上就是這個系統的‘天敵’。”魯克爾說,“他做了很多大部分球員完全做不到的事情。”
熱火的協防堪稱是聯盟中做得最好的,猛龍在這方面有很多不足,多倫多分析團隊用Sport VU舉出另外一個例子。
本賽季步行者同猛龍的一場比賽中,喬治·希爾和大衛·韋斯特在球場左側的一次擋拆。這里發生了兩件事,而且兩樣都是防守中最容易出現的典型錯誤。第一個:阿米爾·約翰遜追希爾追到了中區,讓自己離他的影子(正確的防守位置)相差很遠。約翰遜很擅長在三分線外追趕持球人,但在這里他并不需要走這么遠,因為希爾只是往遠離籃筐的方向運球,因此并沒有威脅。
Sport VU還記錄下蓋伊犯的另一個錯誤:韋斯特拿到了球,而約翰遜離他很遠,影子球員看到了球隊潛在危機,而這是真實球員注意不到的。影子瓦蘭修納斯拋棄了希伯特跑向韋斯特,前者完全可以這么做,因為他知道影子蓋伊會離開喬治以在補防希伯特。真實比賽發生的情況是,瓦蘭修納斯和蓋伊都沒動,韋斯特簡單地投中一記中距離。
回到前面所說的,影子球員在防守中的移動是基于對方進攻中的期望值,隨著進攻的推移,每秒計算好幾次;影子蓋伊會輪轉過來,部分因為程序知道讓喬治處于空位比德羅贊離開埋伏在底角的射手所帶來的傷害要小得多。
進階之路
通過比賽中具體發生的例子,人們初步知道了Sport VU在某一方面的作用,這當然要感謝猛龍隊的慷慨。不過,雖然猛龍很早就啟用Sport VU,但即使是接受能力最強的教練,看起來也只是把它當作一個主要用來證實他們已經想到和知道的事情。“這是對你親眼所見的證實,它可能也會為別的東西提供靈感。”猛龍主教練凱西說,“但是你不能只基于這個做決定,它無法測量大心臟、化學反應和性格。”
雖然很多教練會說Sport VU的分析證實了他們的想法,他們會做出一些改變,但真實的情況并非這樣。例如:分析團隊一致同意且不停強調,所有球隊都應該投更多的三分球——包括猛龍。以同一場猛龍與步行者比賽中的某次進攻為例:分析團隊希望一個生涯低于聯盟平均水準且本賽季表現并不算好的三分投手蓋伊投出一記防守下的三分球——此時計時器上顯示猛龍還剩下約六秒進攻時間。取而代之的是蓋伊傳給了底角的德羅贊,一個更差的三分投手,然后德羅贊試圖傳出一記難度極大的突破分球給切入的蓋伊,卻被喬治·希爾破壞出底線,計時器上只剩下了不到一秒。
對于魯克爾和他的團隊,這是由投籃的價值、計時器的影響及教練如何執教球員的引出來的問題。“當你問教練28%的三分命中率和42%的中距離哪個好,他們會說42%的那個。這顯然是不對的。”魯克爾說。
想讓教練們接受這種快樂扔三分的哲學并不簡單。“你可以想投多少三分就投多少。”凱西說,“但是如果你投不進的話,這個理論就要被扔出窗外了。數據分析可能給你一個數字,但是你不能靠那個數字過活。”
凱西說德羅贊的三分不好,這肯定沒錯。但是分析團隊爭辯說,即使是低于35%的三分手也應該投出更多的三分,教練們應該花更多的時間把低于平均水平的三分手變成接均水準的投手。“一個球員的三分命中率從25%長到30%遠比中距離從35%提到40%更有意義。”魯克爾說。在分析團隊看來,就算爵士球員米爾薩普職業生涯的三分線命中率只有27.7%(112投31中),但還是要讓他更多的三分球,把訓練時間的一部分分出來——努力提升此前并不屬于他的技能。
當然,猛龍的數據分析團隊更關心自家球員,瓦蘭修納斯當然是他們本賽季的頭號目標,而這也引發了他們和教練組之間的緊張關系。像很多的新秀一樣,瓦蘭修納斯會忘記輪轉、協防過度,還會在防守上犯簡單的站位錯誤。教練組痛恨這些,他們經常在關鍵時刻把立陶宛人摁在板凳上,重用阿隆·格雷——一個基礎不錯但缺少運動能力的球員。
分析團隊和教練組的矛盾還會繼續,但他們不會互相掐來掐去或是威脅說自己要辭職。部分原因是Sport VU的數據做出了很多最聰明的NBA工作人員長時間以來都在做的事:把比賽與先進的統計學結合。理解體育不是非此即彼;它兩者兼有,而這些攝像機代表了這次聯姻中最先進的現實化效果。