時間:2023-06-27 15:55:25
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內心深處的真相,好投稿為您帶來了七篇數據分析方向范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創作。
根據不完全統計,2016年1D6月,全球大數據領域共計發生157起投融資事件,其中中國發生了97起,超過總量的一半,其次為美國,發生41起,其他國家在大數據領域的投融資事件數量遠遠落后于中國和美國。
2016年1D6月,中國大數據領域投融資金額規模達到503.70億元,排名第二的美國,投融資金額規模為111.38億元。其他上億元投資的國家分別為以色列5.35億元、英國4.32億元、德國2.24億元、加拿大1.06億元。
中美大數據領域投融資對比
從2016年上半年的整體投融資狀況來看,中國和美國的投融資事件占全球絕大多數的比例,中美兩國大數據業務的發展基本代表了大數據在全球的發展狀況。深入對比中美大數據領域的投資,對掌握大數據的應用方向和技術方向具有較大的意義。
從圖3可以看出,在大數據行業應用方面,中美都有涉及的行業有醫療、營銷、物流、娛樂、體育和教育。其中,醫療領域是2016年上半年行業中發生投融資事件最多的領域,中國發生18起,美國發生5起;其次為營銷領域,中國發生6起,美國發生3起。
相比美國,大數據的應用行業在中國更加廣泛和活躍,2016年上半年中國有大數據投資而美國尚未涉及的領域比較多,如媒體、交通、金融、汽車、物聯網、藝術、招聘、旅游、農業和租房等領域。其中媒體行業發生10起投融資事件,交通行業發生6起,金融行業發生6起。
在大數據技術應用方面,2016年上半年涉及的投融資方向有數據分析、數據應用、數據安全和數據工具。其中數據分析方向投融資事件最多,美國15起,中國14起;其次為數據工具方向,美國8起,中國5起;數據應用方向,中國6起,美國3起;數據安全方向,中國5起,美國3起。
從投融資的金額規模上看,2016年上半年,中國和美國的側重點各不相同,中國偏重于大數據行業領域的應用,而美國側重于大數據技術領域的應用。2016年上半年中國在大數據行業應用的投資總規模達到485.1億元,在大數據技術應用領域只有18.6億元;美國在大數據行業應用領域的總投資規模為26.9億元,在大數據技術應用領域達到84.4億元。
中國投融資規模的TOP3均為行業領域,分別為交通、物流和醫療,投融資規模分別為305.4億元、105.0億元和50.7億元。而美國投融資規模的TOP3中有兩個為技術領域,分別為數據工具44.2億元、數據分析31.3億元;有一個為行業領域――醫療16.6億元。在行業應用方面,中美投資事件最多的均為醫療領域。
中美數據分析領域投融資市場對比
可以看出,美國比較側重發展大數據的技術應用,而數據分析是大數據技術應用領域投融資最多的技術方向。2016年上半年,中國在數據分析方向的投融資事件達到14起,美國15起,高于中國。在金額方面美國更是遠遠超過中國,投融資金額高達31.3億元,而中國只有7.3億元。
2016年上半年,數據分析領域的投融資事件主要集中在分析平臺、用戶分析和商業智能方向,分別發生投融資事件12起、10起和3起,各自占比為41%、35%和10%;其他幾個方向的占比都比較小。從金額分布上看,分析平臺占比最大,達到61%,其次為用戶分析16%,可視化分析13%。
關鍵詞:大數據;數據倉庫;數據分析;校園卡;教務
中圖分類號:G434 文獻標志碼:B 文章編號:1673-8454(2015)10-0013-03
隨著大數據時代的到來,各行各業都在利用大數據推動本領域的發展。常熟理工學院自2009年開展教育信息化建設以來,在數據分析方面進行了不斷地探索與實踐,目前廣泛應用于教學和管理中。
一、數據分析的必要性和可行性
高校內部一般都建有:教務系統、科研系統、學工管理系統、人事管理系統、資產管理系統等獨立業務系統。這些系統都各自記錄著學校方方面面的數據,卻都靜靜地躺在服務器硬盤里,猶如埋藏在地下的金礦,不能為高校全局決策提供支撐。
數據分析的目的就是要讓數據發聲,通過直觀的數據圖表來為高校管理提供輔助決策。例如:對教師的專業與學校開設專業的統計分析可以為人才引進提供參考;對學生的校園卡使用記錄和校內上網認證記錄結合起來,可以為判斷學生的行為指明方向;對各二級學院的資產數據統計分析有助于學校對二級學院進行成本核算。
二、數據倉庫的建立
數據庫是數據分析的源頭,數據倉庫的建立是數據分析的基礎。
建設過程中,首先要統一數據標準,只有準確的數據才是有價值的,如果各系統的數據標準不統一,就會造成不準確的數據分析結果,也就無法為高校管理提供真實有效的統計數據;
其次要建立公共數據平臺,公共數據平臺是指實現校園內各種信息系統的互通互連和數據共享,包括多個系統業務數據集中存儲、備份、數據共享和數據管理的公共平臺,為學校各應用系統提供基礎數據;
三是要規范數據流程,把各業務系統中形形的數據按標準定期抽取到學校公共數據平臺中。確保任何業務系統的添加和修改不影響其他系統的正常運行,同時新建應用系統應建立在統一的數據規范基礎和統一身份認證基礎上,調用公共數據平臺的基礎數據(如部門、教工、學生等基礎信息),應用系統產生的數據也應成為公共數據平臺的基礎數據,可供數據平臺共享訪問。確保提供反映學校全面情況的數據信息,為整個學校提供決策支持所需的數據信息,為今后應用系統的建設和信息服務奠定良好的數據基礎。
圖1為數據架構圖,最底層的是各業務系統,他們產生的數據按編碼標準經過抽取、轉換、加載到數據中心,數據中心再按需要把相關數據同步給相應的應用數據庫或各數據集市,最后形成各類主題數據分析或綜合決策系統。
三、基于數據倉庫的數據分析
在統一數據倉庫的基礎上,我們利用數據倉庫技術(ETL、OLAP、REPORT)和數據挖掘技術,對多種數據集市進行數據分析,建立了校情綜合統計分析系統。該系統從學校基本情況、教職工信息、學生信息、教學信息、科研信息、資產與設備信息、圖書資料信息與師生消費等方面進行統計分析,為學校管理提供輔助決策支撐數據。
該系統從學校全局出發,通過多元主題展開分析,以文字、報表、圖表等多種形式展現分析成果。
該系統的推出實現了教學質量、學生學習、生活行為等各種信息的監控與分析,對高校資源配置優化、提高高校管理科學化等方面具有不可估量的重要意義。這里筆者將以校園卡和教務數據分析功能為例進行闡述。隨著校園卡在校園生活中使用范圍的日益擴大,在應用過程中產生了大量數據。校園卡僅僅一年的交易數據就有大約1000萬條記錄。
校園卡數據分析主要實現以下五大類的分析功能:
(1)各時間段消費情況分析
①從“月、季度、半年、年”的角度來查詢消費總額、消費用戶數和人均消費等,反映出用戶消費支出的趨勢,也可反映出物價的變化情況。
②從“幾點幾分”的角度查詢消費人數可反映用戶在時間點上的消費習慣,對于各營業部門來說可以合理地調整工作時間、工作人員等,以加強服務。還可根據教職工就餐時間點來分析他們是否嚴格遵守學校作息時間。
③從“早、中、晚”的角度統計分析學生早餐、中餐、晚餐的就餐率。
(2)各類消費人群消費情況分析
①對于學生工作管理層來說,從“個人、班級、院系”的角度來查詢消費金額作為發放貧困補助的依據。
②通過查詢一個時間周期內(三天)學生消費人數,起到了解學生是否在校的危機預警作用。
③從學生所屬院系、專業、年級等角度來查詢消費人數、消費金額和分布情況。
④從學生性別、來源地區(省、市、區)、年齡等人的自然屬性來查詢消費人數、消費金額和分布情況。
⑤分析教職工的消費水平。
(3)各營業單位消費情況分析
從各個營業單位角度來查詢校園用戶消費人數,消費金額和分布情況。
(4)各交易類型消費情況
從消費類型角度來查詢用餐、購物、上網、上機、水電消費等情況。
(5)工作站、終端個數統計
為直觀反映上述消費數據,我們除用表格形式將分析結果展現在用戶終端外,還提供了柱狀圖、餅圖、曲線圖、點圖等形式來展現。圖2展示了我校2010年至2014年學生早、中、晚三餐平均價格,呈逐年穩步上升狀態,這給餐飲部門提供準確統計數據的同時,也穩定了學生就餐消費水平的承受心理。
高校教學信息化建設積累了豐富的業務數據,根據需求,教務數據分析功能主要包括三大類:教學任務、學生成績和教學評價。圖3為教務數據分析數據源視圖,圍繞教師的教學工作量、學生取得的成績以及學生對教師的評價等,我們做了一系列的報表。例如:教學場地信息、學生情況、任課教師情況、各學期教學任務情況、成績信息、教學評價、歷年各專業招生人數、各學院歷年教學情況、各學院歷年學生對教師評價。
另外,為滿足各二級學院要求,做了學業預警方面相關報表,各二級學院可根據年級、專業,通過總學分排行、課程門數排行來關注排在后面的學生情況。
數據分析表明,教師平均教學任務逐年增多,教師總體比較年輕,平均年齡男教師比女教師高,年齡在30-39之間的教師平均課時最多。管理學院歷年招生數比其它學院明顯高出很多,其中財務管理專業的學生數百分比最高。我校學生的成績也完全符合正態分布曲線要求。
四、結束語
大數據分析是一種發展趨勢,我們目前也僅僅就單項主題進行了逐個分析,如果把這些主題串起來,進行關聯分析,將會得出更有趣更有價值的結果,這也是將來我們努力的方向。
參考文獻:
[1]戴紅芳,馮翔,先曉兵等.商業智能在校園一卡通中的研究與實踐[J].微電子學與計算機,2012,29(7):175-179.
[2]戴紅芳.基于多維數據模型的校園卡數據分析[D].上海:華東理工大學,2011.
基本的大數據的處理流程可以分成數據采集、數據處理與集成、數據分析和數據解釋4個階段。首先獲取數據源的數據,因為在數據源端的數據包含各種各樣的結構,需要使用某種方法將其進行預處理,使數據成為某種可以用一種算法分析的統一數據格式,接著需要找到這種數據分析的算法,將預處理過的數據進行算法特定的分析,并將分析的結果用可視化等手段呈現至用戶端。
1.1數據采集
大數據的采集是整個流程的基礎,隨著互聯網技術和應用的發展以及各種終端設備的普及,使得數據的生產者范圍越來越大,數據的產量也越來越多,數據之間的關聯也越來越復雜,這也是大數據中“大”的體現,所以需要提高數據采集速度和精度要求。
1.2數據處理與集成
數據的處理與集成主要是對前一步采集到的大量數據進行適當的預處理,包括格式化、去噪以及進一步集成存儲。因為數據采集步驟采集到的數據各種各樣,其數據結構也并不統一,不利于之后的數據分析,而且,一些數據屬于無效數據,需要去除,否則會影響數據分析的精度和可靠性,所以,需要將數據統一格式并且去除無效數據。通常會設計一些過濾器來完成這一任務。
1.3數據分析
在完成了數據的采集和處理后,需要對數據進行分析,因為在進行數據分析后才能體現所有大數據的重要價值。數據分析的對象是上一步數據的處理與集成后的統一格式數據,需要根據所需數據的應用需求和價值體現方向對這些原始樣本數據進一步地處理和分析。現有的數據分析通常指采用數據倉庫和數據挖掘工具對集中存儲的數據進行分析,數據分析服務與傳統數據分析的差別在于其面向的對象不是數據,而是數據服務。
1.4數據解釋
數據解釋是對大數據分析結果的解釋與展現,在數據處理流程中,數據結果的解釋步驟是大數據分析的用戶直接面對成果的步驟,傳統的數據顯示方式是用文本形式體現的,但是,隨著數據量的加大,其分析結果也更復雜,傳統的數據顯示方法已經不足以滿足數據分析結果輸出的需求,因此,數據分析企業會引入“數據可視化技術”作為數據解釋方式。通過可視化結果分析,可以形象地向用戶展示數據分析結果。
2云計算與大數據分析的關系
云計算是基于互聯網的相關服務的增加、使用和交付模式,通常涉及通過互聯網來提供動態易擴展且經常是虛擬化的資源,是一種按使用量付費的模式。這種模式提供可用的、便捷的、按需的網絡訪問,進入可配置的計算資源共享池(資源包括網絡、服務器、存儲、應用軟件、服務),這些資源能夠被快速提供,只需投入很少的管理工作,或與服務供應商進行很少的交互。目前,國內外已經有不少成熟的云計算的應用服務。數據分析是整個大數據處理流程里最核心的部分。數據分析是以數據的價值分析為目的的活動,而基于大數據的數據分析通常表現為對已獲取的海量數據的分析,其數據來源可能是企業數據也可能是企業數據與互聯網數據的融合。從目前的趨勢來看,云計算是大數據的IT基礎,是大數據分析的支撐平臺,不斷增長的數據量需要性能更高的數據分析平臺承載。所以,云計算技術的不斷發展可以為大數據分析提供更為靈活、迅速的部署方案,使得大數據分析的結果更加精確。另一方面,云計算的出現為大數據分析提供了擴展性更強,使用成本更低的存儲資源和計算資源,使得中小企業也可以通過云計算來實現屬于自己的大數據分析產品。大數據技術本身也是云計算技術的一種延伸。大數據技術涵蓋了從數據的海量存儲、處理到應用多方面的技術,包括海量分布式文件系統、并行計算框架、數據庫、實時流數據處理以及智能分析技術,如模式識別、自然語言理解、應用知識庫等等。但是,大數據分析要走向云計算還要賴于數據通信帶寬的提高和云資源的建設,需要確保原始數據能遷移到云環境以及資源池可以隨需彈性擴展。
3基于云計算環境的Hadoop
為了給大數據處理分析提供一個性能更高、可靠性更好的平臺,研究者基于MapReduce開發了一個基于云計算環境的開源平臺Hadoop。Hadoop是一個以MapReduce算法為分布式計算框架,包括分布式文件系統(HDFS)、分布式數據庫(Hbase、Cassandra)等功能模塊在內的完整生態系統,已經成為當前最流行的大數據處理平臺,并被廣泛認可和開發應用。基于Hadoop,用戶可編寫處理海量數據的分布式并行程序,并將其運行于由成百上千個節點組成的大規模計算機集群上。
4實例分析
本節以電信運營商為例,說明在云計算環境中基于Hadoop的大數據分析給大數據用戶帶來的價值。當前傳統語音和短信業務量下滑,智能終端快速增長,移動互聯網業務發展迅速,大數據分析可以為運營商帶來新的機會,幫助運營商更好地轉型。本文數據分析樣本來自于某運營商的個人語音和數據業務清單,通過Hadoop2.6.0在Ubuntu12.04系統中模擬了一個大數據分析平臺來處理獲得的樣本。希望通過對樣本數據的分析與挖掘,掌握樣本本身的一些信息。以上分析只是一些很基本的簡單分析,實際上樣本數據中所蘊含的價值要遠遠大于本文體現的。以上舉例意在說明基于云計算的大數據分析可以在數據分析上體現出良好的性能,為企業帶來更豐富更有效率的信息提取、分類,并從中獲益。
5結束語
關鍵詞:數據分析;移動電子商務;數據獲取;發展
一、移動電子商務的定義
移動電子商務(M-Commerce)是由電子商務(E-Commerce)衍生出的新生概念。隨著互聯網的不斷發展,移動電子商務正在全世界范圍內的普及和發展。移動電子商務本質上是電子商務技術的一種創新,基于移動無線網絡,依托手機等個人移動通信設備,使用戶能夠減少時間和空間的限制并進行活動,是電子商務的一種新形式,并改變了電子商務的傳統格局。
據艾瑞咨詢最新統計數據顯示,2016年移動購物市場交易規模約3.3萬億元,占網絡購物總交易規模的70.2%,繼2015年超過PC端之后,成為電子商務的主流渠道。同時,根據最新的一季度報告預測,2017年第三季度左右,全球移動電子用戶將達50億左右。
二、移動電子商務中的數據分析與應用
數據分析是移動電子商務重要的組成部分,同時也為產品決策提供重要參考。針對移動產品,數據分析就是利用挖掘數據的分析方法與技術手段,在手機用戶大量的交易數據中總結產品流量和顧客轉化率之間的規律和特點,分析消費者的消費特點。具體則是通過網絡和交易信息提取客戶、市場、產品環節的數據,然后建立相關模型,在更加動態化的商業環境下,能夠更有效的優化產品及商業模式。
1.數據挖掘
通過自動化或半自動化的工具,數據挖掘可以挖掘出數據內部隱含的模式,并從中發掘信息或知識,同時從已有的數據中提取模式,提高已有數據的內在價值,并且把數據提煉,轉化成為知識。在移動電子商務的運營之中,針對大量繁雜的客戶消費及使用稻藎需要應用多種數據挖掘技術來分析客戶特征,獲取用戶關注點,培養用戶忠誠度,并在此基礎上制定有效的營銷計劃來吸引優質用戶。
在數據挖掘中最常使用的四種分析法:分類分析,關聯分析,序列模式分析和聚類分析:
(1)分類分析可以定義區分數據類或概念的模型和函數,以便能夠使用模型預測未知類標記的對象類。
(2)關聯分析通常利用數據關聯規則進行數據挖掘,其目的是挖掘隱藏在數據間的相互關系。
(3)序列模式分析同樣也是為了挖掘數據之間的聯系,但側重于分析數據間的前后序列關系。
(4)聚類分析,是指根據“物以類聚”的原理,將本身未有類別的樣本聚合成不同的簇,并對每一個簇進行描述的過程。
2.數據處理
(1)數據收集
一款移動電子商務產品的分析團隊在處理數據前,首先要解決的問題是數據源的收集。數據收集可以分為二大類。第一類是直接能獲取的數據,通常為內部數據。第二類則稱為外部數據,是需經過加工整理后才能得到的數據,如手機應用平臺的下載數據。
(2)數據清洗
數據清洗是數據處理中的重要部分,通過工具或編程,如Excel,Python,對數據進行篩選、清除、補充、糾正,其目的是從大量雜亂無章、難以理解的數據中抽取并推導出對解決問題有價值、有意義的數據。清洗后保留真正有價值的數據,為數據分析減少障礙。
(3)數據對比
對比,是數據分析的切入點。如果參照缺失,數據則無法確定定量的評估標準。分析過程通常采用二點切入法進行數據對比分析:橫向對比與縱向對比
①橫向對比,是與行業平均數據,以及競爭對手的數據進行比對,以市場為軸心。
②縱向對比,則是和產品自身的歷史數據進行對比,以時間為軸心。
(4)數據細分
數據對比發現了問題后,需要用到數據細分來確定問題數據的范圍,根據移動產品的差異對數據異常的范圍和精度進行分析,隨后進行測試與修正。數據細分通常情況下先分緯度,再分粒度。
三、數據分析
數據分析是指用適當的比較或統計方法對收集來的第一手和第二手資料進行分析,以求最大化地開發出數據資料的功能并發揮數據的作用。為了提取有效信息和形成結論,通過分析手段,可以對數據加以詳細研究和概括總結。在進行正式的數據清洗,確保了數據可靠性與完整性后,可對所獲取的數據進行多層面的具體分析。根據不同的數據分析層面和結果導向分類,在移動電子商務的數據分析中常應用兩種分析類型。
第一種,傳統電子商務營銷管理中的常用分析:SWOT、4P、PEST、5W2H、Userbehavior等;第二種是統計分析:描述統計、假設檢驗、相關分析、方差分析、回歸分析、主成分與因子分析、決策樹等。
1.數據分析方法
對于第一種類型的數據分析,常可以采用比較分析法來確定基本的分析方向以及產品導向。比較分析法分為兩種類型,同比與環比。
為消除數據周期性波動的影響,同比將移動產品本周期內的數據與之前周期中相同時間點的數據進行比較,計算同比增長率。而環比則反應數據連續變化的趨勢,將本期的數據與上一周期的數據進行對比。同環比能為產品整體運營的發展狀況提供有力的參考,但必須建立在一定的基礎上和環境上。
對于統計分析,最常用的是相關分析以及回歸分析。相關分析研究的是現象之間是否相關、相關的方向和密切程度,一般不區別自變量或因變量。而回歸分析則通過分析現象之間相關的具體形式,確定因果關系,并用數學模型來表現其具體關系。舉例來說,對一個移動電子團購平臺的產品來說,從相關分析中可知“質量”和“用戶滿意度”變量密切相關,但只有通過回歸分析方法才能確定這一對變量之間到底是哪個變量受哪個變量的影響,以及影響程度如何。
2.數據分析應用
在移動端電子商務中,APP數據分析對于開發者或運營者都是十分重要的環節,主要數據分為4個方面:用戶來源、用戶屬性、轉化率及用戶忠誠度。
(1)用戶來源
對于移動產品平臺來說,獲取用戶的渠道很多,如CPA廣告、交叉推廣、限時免費等等。開發者從多個維度的數據來對比不同渠道的效果,比如從活躍用戶、次日留存率、使用頻率、使用時長等角度對比不同來源的用戶。通過渠道對比,可以高效地找到最適合產品發展的渠道,以便不斷完善推廣策略。為了追蹤App渠道來源,可以用到兩種不同的方法:
①Android渠道追蹤方法
國內Android市場被數十家應用商店所割據,Android渠道追蹤主要圍繞其中幾種渠道展開。具體來說就是開發者為每一個渠道生成一個渠道安裝包,不同渠道包用不同的渠道ID來標識。當用戶下載了App之后,運營人員就可以通過渠道標識查看各渠道的數據。
②iOS渠道追蹤方法
不同于Android的開放生態,iOS是一個完全封閉的系統。在蘋果的唯一性原則以及嚴格的審核制度下,Android打包的做法在此則無法生效,可以通過Cookie追蹤渠道更為高效的追蹤數據。
(2)用戶屬性分析
在吸引用戶下載使用之后,產品運營及開放方要盡可能地詳細了解用戶的設備型號、網絡及運營商、地域、用戶性別等宏觀層面的用戶特征。這些特征數據可在產品改進、應用推廣和運營策略的制定上提供有力的方向性依據。
①同期群分析是一種基于同期群的核心數據及行為的對比分群方式,按用戶的新增時間將用戶分群,得到的每個群就叫同期群。
②獲取成本分析,是指獲取到一個真實的新用戶所付出的平均成本。同時也要注意用戶回報彌補獲取成本的速度,嘗試不同的渠道并跟蹤用戶的行為,使用如K因子傳播作為降低獲取用戶成本的手段。
③用戶終生價值分析,是指用戶平均會在平臺、產品上貢獻多少價值。最大化用戶營收的方法就是根據用戶頻度制定不同的定價方案,針對高頻用戶通過廣告、精品內容收費,對于低頻用戶則采用單次收M模式。
(3)轉化率
對移動電子商務來說,產品轉化率至關重要,直接關系到開發者的產品收入。如一款移動電子游戲應用,開發者可從道具購買量、關卡和付費人群等多個維度進行交叉分析,從而查看用戶付費行為動機和特征,也可以通過漏斗模型進一步分析關鍵節點的轉化率,提高付費轉化,增加收入。
(4)用戶忠誠度
了解用戶在一個產品應用內做了什么,并確保用戶喜歡該產品,是移動產品優化產品生命周期的根本。開發者可以從留存用戶、使用時長、使用頻率、訪問深度等維度評價用戶粘度,以及RFM(Requency,Frequency,Monetary)來評估用戶系數。例如,通過檢測每月新增用戶在初次使用后某段特定時間內的留存率來對用戶進行評估。
統計留存用戶的時間粒度很細,主要有次日留存、7日留存、30日留存。
四、數據分析對移動電子商務的意義
無論是公司或個人,在這個新時代,具有數據分析思維是一種更高層次的元認知能力。由于移動互聯網的出現,用戶數據大量積累,營銷方案的制定都是基于數據分析結果來決策。作為移動電子商務公司的數據分析師,必須有對繁雜枯燥的數據進行數據分析的本領,更要有商業敏感性。
隨著大數據時代的到來,以數據分析為思維的經營和管理思路將成為移動電子商務市場中消費行為及市場分析的依據,而在這種以數據為主體的決策制定中,企業獲取的分析數據是直觀、動態、及時的,相比咨詢公司或調研公司的滯后分析具有大數據和全樣本的優勢。利用數據來分析用戶的行為習慣,進而揣測用戶的心理,深入挖掘用戶需求,可以精確得出產品定位及活動,進行決策。
參考文獻:
關鍵詞:大數據分析方法;企業檔案管理;檔案數據資源;企業創新決策
Abstract: With the gradually go deep into the research of big data, the enterprise innovation decision-makings are more and more dependent on data analysis, and the enterprise archive data resources provide the data base for enterprise’s these decisions, therefore used of big data analysis in Enterprise Archive Management has important significance. This paper detailed expounds the Data Quality Management, Visualization Analysis, Semantic Engines, Data Mining, Tendency Prediction and so on five big data analysis methods in the application of Enterprise Archive Management and problems that deserve attention.
Keywords: Big data analysis method; Enterprise Archive Management; archives data resources; enterprise innovation decision-making
2015年9月5日,我國政府了《促進大數據發展行動綱要》,旨在促進大數據和云計算、物聯網、移動互聯網等新一代信息技術的融合,探索大數據和傳統產業發展新模式,推動傳統產業轉型升級和新興產業發展。正如大數據專家舍恩伯格所說:大數據正在改變人們的生活和人們理解世界的方式,更多的變化正蓄勢待發,大數據管理分析思維和方法也開始影響到我們企業檔案管理的發展趨勢。
1 大數據分析方法在企業檔案管理中應用的背景
1.1 大數據研究逐漸縱深化。自從2008年science雜志推出Big Data專刊以來,國內外對大數據的研究如火如荼。經過一段時間的探索,“目前大數據領域的研究大致可以分為4個方向:大數據科學、大數據技術、大數據應用和大數據工程。而人們對于大數據技術和應用兩個方面的關注比較多”[1]。正如2012年奧巴馬政府投入2億美元啟動 “大數據研究和發展計劃”的目標所顯示的那樣,目前大數據的研究逐漸向縱深化方向發展,著重從大型復雜的數據中提取知識和觀點,幫助企業實現從“數據分析能力”向“數據決策能力與優勢”的轉化。
1.2 企業創新決策越來越依賴于數據分析。對于企業技術創新者而言,目前更多的企業高層越來越依靠基于數據分析的企業技術創新決策。靠傳統的經驗方法去決策往往是滯后的,因此,大數據分析方法作為先進的定量分析方法,目前出現的一些先進數據分析方法與技術勢必會對企業的運行管理、生產業務流程、管理決策產生飛躍式的影響。大數據分析方法也成為企業檔案數據分析、技術創新決策的有效工具。
1.3 企業檔案為企業創新決策提供數據基礎。對于一個企業而言,使用的數據資源必須具有真實性可靠性。“企業檔案是在企業的各項活動中直接形成并保存備查的各種文獻載體形式的歷史記錄”[2],企業檔案是企業在生產、經營、管理等活動中形成的全部有用數據的總和。除了發揮著憑證參考維護歷史真實面貌的作用之外,企業檔案更“是企業知識資產和信息資源的重要組成部分”[3],具有知識創新性、不可替代性,為企業技術創新決策提供數據基礎。“特別是在當前大數據背景下,企業檔案數據資源的開發與建設對企業經營決策的制定與適應市場競爭環境起到關鍵性作用。”[4]
在上述背景下,將大數據分析方法應用在企業檔案管理中具有重要性意義:不僅拓展企業的管理決策理論,同時幫助企業運用所擁有的檔案數據資源洞察市場環境,發現新的競爭對手,進行自我總結,做出科學決策,使企業緊緊抓住大數據時代帶來的市場機遇。
2 大數據分析方法在企業檔案管理中應用的方式
大數據分析方法在企業檔案管理中的實現方式即是將大數據分析方法運用在企業檔案信息分析挖掘上。它貫穿企業數據處理的整個過程,遵循數據生命周期,廣泛收集數據進行存儲,并對數據進行格式化預處理,采用數據分析模型,依托強大的運行分析算法支撐數據平臺,發掘潛在價值和規律并進行呈現的過程。常見的大數據分析方法“其相關內容包括可視化分析、數據挖掘、預測分析、語義分析及數據質量管理”[5]。
2.1 數據質量管理提升企業檔案數據資源品質。大數據時代企業檔案數據資源呈現出4V特點,這使得企業檔案數據很容易出現不一致、不精確、不完整、過時等數據質量問題。基于數據生命周期對企業檔案數據資源進行數據質量管理分為數據預處理、數據存儲、數據使用三個階段。在數據預處理階段,通過ETL工具即數據經過萃取(Extract)、轉換(Transform)、加載(Load)至目的端這幾個預處理過程達到數據清洗和格式化的目的。目前Oracle公司的Data Integrator和Warehouse Build、微軟的Dynamics Integration及IBM的Data Integrator都是比較常見的ETL工具。在數據存儲與使用階段,針對目前企業檔案大數據呈現出4V的特點,傳統關系型數據庫在數據存儲與數據管理方面已經難以勝任,非關系型數據庫以其高吞吐量、可拓展性、高并發讀寫、實時性等特性能夠滿足數據存儲與管理的要求。目前應用最廣的是并行處理系統MapReduce和非關系型數據庫比如谷歌的Big Table和Hadoop的HBase。將ETL工具移植入云計算平臺系統,將會大大有助于完成數據清洗、重復對象檢測、缺失數據處理、異常數據檢測、邏輯錯誤檢測、不一致數據處理等數據質量處理過程,從而保證企業檔案數據資源的數據質量。
2.2 可視化分析提升企業檔案數據資源可理解性。
“大數據可視分析是指在大數據自動分析挖掘方法的同時,利用支持信息可視化的用戶界面以及支持分析過程的人機交互方式與技術,有效融合計算機的計算能力和人的認知能力,以獲得對于大規模復雜數據集的洞察力。”[6]那么企業檔案數據資源的可視化分析可以理解為借助可視化工具把企業檔案數據資源轉化成直觀、可視、交互形式(如表格、動畫、聲音、文本、視頻、圖形等)的過程,便于企業經營者的理解利用。
以2015年2月15日最新版的“百度遷徙”(全稱“百度地圖春節人口遷徙大數據”)為例,該項目讓我們近距離了解到大數據可視化。它利用百度后臺每天數十億次的LBS定位獲得的數據進行計算分析,全程展現中國人口遷徙軌跡,為政府部門科學決策提供科學依據。受該項目啟發,企業可將擁有不同類型的檔案信息進行可視化,比如進行企業檔案的網絡數據可視化、時空數據可視化、時間序列數據可視化、多維數據可視化、文本數據可視化等[7]。以文本數據可視化為例,目前典型的文本可視化技術標簽云,可以將檔案文本中蘊含的主題聚類、邏輯結構、詞頻與重要度、動態演化規律直觀展示出來,為企業決策提供依據。另外,常見的信息圖表類可視化工具主要有Google chart、 IBM Many Eyes、Tableau、Spotfire、Data-Driven Documents(D3.js)等;時間線類可視化工具主要是Timetoast,、Xtimeline、Timeslide、Dipity等;數據地圖類可視化工具主要有Leaflet、Google fushion tables、Quanum GIS等。這些新技術都為企業檔案數據資源可視化提供了科學工具。
2.3 語義引擎實現企業檔案數據資源的智能提取。大數據時代全球數據存儲量呈激增趨勢,傳統的基于人工分類目錄或關鍵詞匹配的搜索引擎(谷歌、百度等)僅僅能夠進行簡單的關鍵詞匹配,用戶無法得到非常準確的信息,檢索準確率并不高,而且檢索結果相關度較低,檢索結果缺乏引導性。為提供給用戶高質量的檢索結果,改善用戶搜索體驗,提高效率,實現智能提取,語義搜索引擎應運而生。“語義引擎是隨著語義網的發展,采用語義網的語義推理技術實現語義搜索的語義搜索引擎。”[8]它具備從語義理解的角度分析檢索者的檢索請求,能夠理解檢索者的真正意圖,實現信息智能提取。對語義分析可以采取自然語言處理方法進行概念匹配,提供與檢索者需求相同、相近或者相包含的詞語。目前存在基于本體的語義處理技術,它以本體庫作為語義搜索引擎理解和運用語義的基礎。對于企業而言,將語義引擎分析方法與協同過濾關聯規則相結合,可以挖掘用戶的需求,提供個性化的服務。比如亞馬遜公司通過對用戶檢索的語義進行分析推理,結合協同過濾關聯規則,為用戶提供相近需求的產品,提升自己的經濟效益。對于一份人事檔案而言,語義引擎也能分析出該份人事檔案中的某人的職務、級別,從中提取出姓名一職務一級別一時間等關鍵信息,提高檢索準確率和效率,實現智能提取。
2.4 數據挖掘發現企業檔案數據資源的隱性價值。“數據挖掘又稱數據庫中的知識發現”[9]。簡而言之,數據挖掘就是企業從數據集中發現知識模式,根據功能一般分為預測性模式和描述性模式,細分主要有分類與回歸模型、聚類分析模型、關聯規則模型、時間序列模型、偏差檢測模型等。主要挖掘方法有神經網絡方法、機器學習方法數據庫方法和統計方法等。
數據挖掘是大數據分析方法的核心。對于企業而言,數據挖掘的檔案數據資源應該由兩部分組成:一是企業正常運行管理過程中所形成的檔案數據資源,通過運用分類、聚類、關聯規則等方法對企業內部的數據進行挖掘,發現潛在模式,為企業技術創新人員決策提供支持。比如在2004年全球最大的零售商沃爾瑪在分析歷史記錄的顧客消費數據時,發現每次季節性颶風來臨之前,手電筒和蛋撻的數量全部增加。根據這一關聯發現,沃爾瑪公司會在颶風用品的旁邊放上蛋撻,提升了企業的經濟效益;二是企業在運行過程中遺存在互聯網上的數據,通過網絡輿情及時跟蹤可以獲取市場最新動態,為企業調整服務模式、市場策略、降低風險提供依據。比如Farecast公司運用數據挖掘,從網絡抓取數據來預測機票價格以及未來發展趨勢,幫助客戶把握最佳購買時機,獲得較大成功。
2.5 趨勢預測分析實現企業檔案數據資源的價值創造。“預測分析是利用統計、建模、數據挖掘工具對已有數據進行研究以完成預測。”[10]預測分析的方法分為定性與定量分析兩種方法:定性分析如德爾菲法以及近年來人工智能產生的Boos-ting?貝葉斯網絡法等;定量分析法一般從形成的歷史數據中發掘數據模型達到預測效果,如時間序列分析模型、分類與回歸分析模型等。
企業檔案數據資源預測分析是在企業檔案數據資源數據挖掘的基礎之上,發現適合模型,將企業檔案數據輸入該模型使得企業技術創新人員達到預測性的判斷效果,實現價值的創造。一個典型的例子即是市場預測問題,企業技術創新者可以根據檔案數據預測某件產品在未來六個月內的銷售趨勢走向,進而進行生產、物流、營銷等活動安排。具體來講企業可以通過數據時間序列分析模型預測產品銷售旺季和淡季顧客的需求量,從而制定針對獨特的營銷策略,減少生產和銷售的波動性,獲得利潤和競爭優勢。預測分析在大數據時代彰顯出企業檔案數據資源獨特的魅力。
3 大數據分析方法運用于企業檔案管理中應當注意的問題
3.1 成本問題。大數據分析需要依靠分析工具和運算時間,特別是在復雜的企業檔案數據資源中采用相關大數據分析工具的科技成本還是很高的,要以最少運算成本獲得更有價值的數據內容。合理選擇大數據分析工具不光可以節省運算成本而且能夠更快速獲取盈利增長點,同時在大數據分析和企業檔案數據資源的存儲成本方面也要適當的控制在合理的范圍內。既要保證大數據分析質量,又要降低企業檔案存儲成本是大數據分析方法運用到企業檔案管理中的重要原則。
3.2 時效問題。“大數據的動態性強,要求分析處理應快速響應,在動態變化的環境中快速完成分析過程,有些甚至必須實時分析,否則這些結果可能就是過時、無效的”。[11]由此可見,影響大數據分析的重要因素就是時效性問題。“大數據數據分析的核心內容之一是數據建模”,[12]數據分析模型要不斷的更新適應數據的動態變化。如果模型落后于數據的變化,那數據分析只能是失效的。同時由于經濟環境、政治生態、社會文化等因素不斷變革,企業檔案數據的收集也會產生新的問題。只有不斷加強對這些數據的實時監測和有效分析,才能更好的識別出數據變化中的細微之處,建立與之相適應的數據分析新模型。
3.3 情感問題。“大數據的另一個局限性在于它很難表現和描述用戶的感情。”大數據分析方法在處理企業檔案數據方面可以說如魚得水,大數據分析是一種科學的機器運算方法,無法去實現人文價值提取,比如如何從企業檔案數據資源中提取企業文化,這更需要人的情感直覺去實現,而嚴謹的科學數據是無法實現的。因此,我們在熱衷于大數據分析方法的量化結果時,同時也不要忽略在傳統企業檔案管理中的那份人文精神。
關鍵詞:HXN5機車;曲軸箱超壓;數據特點
1 前言
HXN5機車自投入運用以來,頻繁發生曲軸箱超壓故障。僅2011、2012兩年間,因各種原因引起的曲軸箱超壓報警就有220余起,嚴重影響了機車的正常運用。
導致曲軸箱壓力高的原因非常多,大體上可分為機械類、電器類(傳感器、線束等)兩種。因此,快速區分原因類別,確定檢查方向,可以大幅度提高檢修效率。
2 機車數據分析軟件
2.1 數據背景
由于前期GE公司技術保密,未提供分析軟件,無法進行數據分析。判斷故障時,只能憑借經驗,進行整車檢查,費時費力。通過多次溝通后,GE同意提供數據分析軟件drconv.exe,使得運用數據分析方法來判斷故障原因成為可能。
2.2 數據轉換
由于下載的機車數據中,ECU的數據文件(eng文件)不能直接打開,需要使用GE提供的數據分析軟件(drconv.exe)轉換成DRA文件后,才能用EXCELL軟件打開。
2.3 數據樣式
文件打開后,就可以對各相關參數進行具體分析。打開后的文件模型如表1(已做相關性處理):
3 一起典型的機械類曲軸箱超壓故障
3.1 故障描述
HXN50323 機車自2012年9月16日發生曲軸箱超壓以來,現場服務組對其進行了各項檢查,一直未能查出具體原因。10月13日,曲軸箱超壓攻關組與GE工程師一道赴段調查。
3.2 故障處理
首先按照曲軸箱超壓故障作業指導書進行相關檢查,發現一些異常現象。但這些異常現象程度都輕微,都不應是超壓的真正原因。
恢復機車后,對比拆掉機油加油口蓋前后自負荷曲軸箱壓力的變化情況,進行自負荷試驗,試驗結果拆掉機油加油口蓋后曲軸箱壓力遠低于拆除前的值,可見確實存在柴油機機械故障(如動力組竄氣))。我們建議拆動力組做進一步詳查。
3.3 機車下載數據情況
3.3.1 Snp日志文件:
打開snp日志文件,可見9月16日在線上有兩次超壓(表2):
① 01:00:50 機車速度36.963英里/小時,柴油機檔位8檔;
② 04:39:24 機車速度19.179英里/小時,柴油機檔位7檔。
最后一次10月13日19:31:02為攻關組在現場做數據采集時觸發。
3.3.2 Eng數據文件:
3是10月13日自負荷試驗曲軸箱壓力隨功率的變化曲線。可見cop數值5檔時在0.5—1之間波動,柴油機拉6檔,曲軸箱壓力上升觸發報警。柴油機停機后cop迅速回落到0附近。
3.3.3 數據分析情況小結
(1)8檔曲軸箱壓力從9月12日開始一直呈上升趨勢,到9月16日漲至0附近觸發報警。
(2)在段內檢修過程中,多次試驗報警后,cop數值均快速回落。
(3)9月12日至16日曲軸箱壓力緩慢上升的過程中,機油壓力保持穩定,沒有明顯的下降趨勢。
3.4 檢查結果
現場試驗數據分析結果顯示該次超壓為機械類超壓。機車后期返廠解體檢查的結果為:左5缸活塞的鋼頂第一道氣環處存在裂紋,引起燃氣下竄,造成曲軸箱超壓。
3.5 數據特點
通過檢查結果、數據分析情況和工作原理,歸結出機械類故障的數據特點為:觸發報警停機后,曲軸箱壓力迅速(10秒內)回零(0.5英寸水柱以下)。
4 一起典型的電器類曲軸箱超壓故障
4.1 故障描述
2012年9月24日50369機車擔當85310次牽引任務,編組29-2295-34.6,列車23:46分因曲軸箱超壓在扎亥薩拉站1道停車,司機解鎖柴油機處理后0:09分開車,站停23分。之后在線上再次發生曲軸箱超壓報警影響本列運行晚點。
回段后檢查柴油機各部良好,更換曲軸箱壓力傳感器,檢查并試驗正常。
4.2 數據情況
4.2.1 Snp文件:
4.2.2 ENG數據文件
圖4為23日23點42分故障時曲軸箱壓力和柴油機轉速隨時間的變化曲線。可看出從42分45秒開始cop就開始超出報警保護值(1.5 in H2O),至42分55秒觸發停機。此外,隨著柴油機轉速降為0的過程中,曲軸箱一直保持在一個較高的壓力(1.55 in H2O)。
4.2.3 數據分析情況小結:
兩次故障曲軸箱壓力都在柴油機低檔位轉速波動不大的情況下自行上升,且在停機后仍然保持一個較高的數值。
4.3 數據特點
通過檢查結果、數據分析情況和工作原理,歸結出電器類故障的數據特點為:觸發報警停機后,曲軸箱壓力可能不會迅速(10秒內)回零(0.5英寸水柱以下);或者柴油機停機后曲軸箱壓力仍然保持在一個較高值。
5 結論
本文通過介紹HXN50323和50369機車曲軸箱超壓故障的處理經過,對數據分析方法在故障原因判斷過程中的應用進行了研究,由此對不同類型故障數據的特點進行了歸納。機械類故障的數據特點為:觸發報警停機后,曲軸箱壓力迅速(10秒內)回零(0.5英寸水柱以下)。電器類故障的數據特點為:觸發報警停機后,曲軸箱壓力可能不會迅速(10秒內)回零(0.5英寸水柱以下);或者柴油機停機后曲軸箱壓力仍然保持在一個較高值。
由于之前電器的故障率太高,使得段方和現場服務人員在判斷此類故障原因時,有一種先入為主的觀念,容易優先考慮反復更換傳感器、線束、ECU等電器元件,費時費力。依照不同故障類型的數據特點,通過數據分析,在查找一些疑難的超壓原因時,能快速區分原因類別,明確檢查方向,節省檢修時間,從而大幅度提高檢修效率。
參考文獻
[1] 主干線機車維修故障處理手冊,2011
[2] 張松楊. GEVO16型柴油機機體的設計分析. 鐵道機車車輛,2009,(2).
[3] 薛良君,樓狄明,張松楊. 16V280ZJB型柴油機機體應力測試與分析. 內燃機車,
2003,(9).
關鍵詞:道路運輸 大數據分析 決策技術
中圖分類號:U495 文獻標識碼:A 文章編號:1674-098X(2016)12(c)-0147-02
交通運輸業指的是在國民經濟的發展過程中主要負責運送貨物和旅客的社會生產工作,其中包括鐵路運輸、公路運輸、水路運輸以及航空運輸等等。該文主要將城市道路交通運輸作為主要切入點,分析當前大數據分析決策技術在城市道路運輸行業的應用過程中所出現的問題以及所帶來的重要影響。在信息技術高速發展的今天,以數據為核心的大數據技術在交通系統中的應用已經逐漸為城市交通事業的發展提供了新的方向,并打開了新世紀的大門,城市智慧交通的時代已經逐漸到來了。
1 大數據分析決策技術概述
1.1 大數據分析決策技術的概念
大數據,顧名思義是對許多大型數據進行分析、處理和管理的數據集,數據的最大可達到10 TB左右,在大數據的日常工作中具有體量大,數據類別多,數據處理速度快以及數據具有真實性的特點。
而大數據分析決策技術正是在大數據的體量大、數據類別多、數據處理速度快以及數據具有真實性的優勢的基礎上對數據進行分析和決策的一種新興技術。這種技術多應用于公共交通服務、交通引導、物流調度優化等各個方面。大數據分析決策技術能夠通過反饋的各種交通數據和各種資源進行分析、處理、整合,并能夠依托云計算服務平臺為使用者提供更加快捷、便利的出行服務。
1.2 大數據分析決策技術的關鍵
大數據分析決策技術的關鍵在于計算層,而計算層主要指的是利用內存計算中的Spark,并利用R語言和框架來實現專業的統計分析功能,采用圖形的方式展現,以保證分布式的集群和高效存儲方式來加快大數據集上的查詢速度。除此之外,Mahout是一個集數據挖掘、決策支持等算法于一身的工具,其中包含的都是基于Hadoop來實現的經典算法,通常相關人員會使用其作為數據分析的核心算法集來進行參考[1]。
利用大數據進行決策和分析,就必須通過表格和圖表圖形來展示,這樣一來,將使得數據的分類更加詳細,并提高了數據的權威性。另外,Tableau和Pentaho也是進行處理的最佳選擇。
2 大數據分析決策技術在道路運輸業的應用分析
2.1 大數據分析決策技術在道路運輸業的應用現狀
伴隨著信息技術的快速發展和高新技術產業的高速推進,新科技、新技術已經融入到了各行各業的生產活動和運營管理當中,并深入到了人們的生活中,使普通人也能看見科技,摸得著技術,時時刻刻地感受著科學技術為生活帶來的美好[2]。
當前,大數據分析決策技術在道路運輸業應用日漸成熟,使得大數據分析決策技術已經成為了城市智慧交通的重要發展平臺和重要的技術載體,科學穩定的分析決策技術,便捷高效的數據處理技術使得大數據分析決策技術在城市道路運輸業一經應用就得到了迅速的拓展。大數據分析決策技術對城市運輸業所反饋的數據包、日志、資產數據以及諸如漏洞信息、配置信息、身份與訪問信息、用戶行為信息、應用信息、業務信息、外部情報信息等信息的分析、處理和決策帶來了極大的便捷。
2.2 大數據分析決策技術應用面臨的挑戰
2.2.1 行業標準缺乏統一性
行業標準缺乏統一性是大數據分析決策技術應用面臨的挑戰之一,眾所周知,地區經濟發展不平衡是我國經濟發展的重要現狀之一,在這樣的背景下,致使我國道路運輸業發展也存在著地區發展不平衡的問題,這樣一來,很難在全國實行統一的行業標準,致使很多地區的城市運輸數據系統相對獨立,沒有在全國范圍內形成統一、完整的智慧交通系統。
智慧交通運輸系統的不完整,導致了各個城市之間的道路運輸的信息和數據的銜接與配合達不到一定的標準,進而嚴重影響交通數據的收集和處理,并阻礙了城市\輸線路的分析和統計。
2.2.2 基礎設施缺乏穩定性
基礎設施缺乏穩定性也是大數據分析決策技術應用所面臨的挑戰之一,大數據決策分析技術在城市道路運輸業得以應用的目的在于建立完整度和成熟度較高的智慧城市道路交通系統,而這樣智慧交通系統必將是整合度和復雜度較高的系統,如果想要建立這樣的智慧交通系統不僅僅需要成熟的大數據分析技術,更需要完整、穩定的基礎設施作為建立這一系統的平臺。但是,當前在建立這一系統的過程中卻面臨著城市運輸系統硬件設備功能滯后、老化的現狀,這些問題都可能會引起引起數據的泄露,甚至丟失,為大數據的統計和處理帶來了極大的威脅。
2.2.3 數據統計缺乏真實性
數據統計缺乏真實性同樣也是大數據分析決策技術應用所面臨的問題和挑戰。作為數據統計和數據整合的重要技術,數據的真實性和精確性是其存在的最重要的基礎。大數據分析決策技術在道路運輸行業得以應用的重要標準,如果數據的真實出現了問題,將使得智慧交通系統失去其應用價值。目前由于道路運輸設備老化等問題,致使其性能得不到根本的保證,造成了信號獲取的不穩定,由此可能會出現數據統計缺乏真實性的問題。
3 大數據分析決策技術在道路運輸業應用問題的解決措施
3.1 加強交通平臺資源整合,推進數據標準化
為了解決行業標準缺乏統一性的問題,相關人員應當加強交通大數據應用基礎設施建設。正如上文所說的我國經濟發展的不平衡導致了城市交通運輸業發展的不平衡,而交通運輸系統又是極為復雜的系統,如果每個城市之間交通平臺不能形成很好的銜接,將會極大地影響交通運輸業的發展,問題解決措施如下。
首先,需要相關部門建立完整的道路交通運輸標準,對各個城市的交通運輸情況進行嚴格的管理,努力建立一個統一度高、完整度高的現代化、標準化行業標準。
其次,還需要加強對各個交通平臺資源的分配和整合,加強各個地區的兼容性。
最后,還應當實現各個地區各個交通的相互合作,相互聯系,推動交通運輸標準化、統一化的實現。
3.2 加強交通大數據應用基礎設施建設
為了解決基礎設施缺乏穩定性的問題,相關人員應當加強交通大數據應用基礎設施建設。正如上文介紹的我國道路運輸系統的設備因使用時間較長,設備老化度較高,這嚴重影響了大數據決策分析技術的應用,為解決這一問題,應當加強基礎設施建設,及時對設備進行更新和維護,從而實現信息數據的安全有效。
3.3 嚴格控制交通運輸的數據真實度
為了解決數據統計缺乏真實性的問題,相關人員應當嚴格控制交通運輸的數據真實度。
正如上文所介紹的因種種原因大數據決策分析技術的數據真實度有待考證,為了解決這一問題,需要相關人員做到的是通過嚴格的監控措施和測試手段保證數據的真實性和可靠性,嚴禁因人為原因而對數據的真實性造成影響。
4 結語
綜上所述,智慧交通時代的大門已經逐漸向大家打開,在城市化速度不斷加快的今天,城市居民對舒適的交通環境和便捷快速的城市道路運輸有著十分迫切的渴求,而在大數據分析決策技術基礎上智慧交通是大的發展趨勢,將為解決城市道路運輸問題提供新的思路。智慧交通時代是高效便捷運輸的時代,也是現代化的重要標志,通過大量數據匯集融合,能夠有效地解決城市交通存在的問題。現階段,大數據分析決策技術和智慧交通系統發展得還不夠成熟,需要在相關人員的不懈努力下,使城市居民能夠更早地進入便捷的現代生活中,期待那一天的到來。
參考文獻