前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇股票分析報告范文,相信會為您的寫作帶來幫助,發現更多的寫作思路和靈感。

9月28日,SAP全球企業官、 全球高級副總裁、SAP中國研究院總裁孫小群在接受記者采訪時表示:“基于HANA,有些應用場景下,用戶的數據訪問、分析速度增長了一萬倍。有人問‘一萬倍又能怎么樣?’SAP認為,它意義深遠、價值巨大,產業乃至整個社會都將因其而深刻變革?!?/p>
股票分析師將成企業管理者
“做個理想化的類比:現在坐動車從上海到北京需要5小時,如果火車速度能夠增長一萬倍,那么從上海到北京真的可以眨眼即到了,那樣的話,首當其沖的是房地產價格要發生翻天覆地的變化,因為人們不再需要在城中心買房子。它將對整個社會、經濟和生活產生深遠的影響?!睂O小群興致盎然地介紹說,“HANA幫助數據訪問、分析速度增長一萬倍將對企業管理產生怎樣的作用,我們真地需要好好地咀嚼、思考、體會?!?/p>
孫小群用SAP剛剛簽約的合作伙伴的例子向記者展開介紹。該合作伙伴為金融企業股票市場分析師提供金融服務。眾所周知,股票分析師是通過非常復雜的數學算法和模型對大量的市場交易和行情數據做分析,從而做出評估和預測。通過引入HANA,這種復雜的分析運算的數據量和速度都有了驚人的增長?;贖ANA為股市分析提供實時服務將對整個股市產生重大影響?
“以前一個分析師很可能自己去查資料、讀市場分析報告、做研究,自己消化吸收后再運用數學模型算出來,這很可能是幾個星期或者一個月的工作量?,F在,這些工作不用分析師做了,用計算機和互聯網服務來自動化、快速地實現原來需要人工完成的大量工作。在這種趨勢下,隨著股市行情服務的升級,股票分析師們將從行業分析走向企業管理,因為他們對整個行業以及行業內企業的了解和真正的企業管理者是相差不多的?!睂O小群轉述合作伙伴的觀點。
這種趨勢不止會對股票分析師產生影響,也會對所有股民產生影響。HANA的應用將逐漸從To B 的企業級應用走向通過To B To C的方式影響消費者,孫小群認為。
“HANA速度很快,原來做不到的事或者需要用大型機以很高的價格做的事情現在都可以實現了?!?SAP中國研究院高級技術顧問李勇在采訪過程中也以DNA檢測的例子闡明HANA將讓應用從陽春白雪逐步走向大眾可享的范疇。
不只是內存數據庫
關鍵詞:大數據 企業 競爭情報 數據挖掘
中圖分類號: G250.2 文獻標識碼: A 文章編號: 1003-6938(2012)06-0009-06
1 引言
隨著信息技術的不斷發展,互聯網的普及利用,各種終端設備記錄了人類社會復雜頻繁的信息行為從而產生了驚人的數據量。據國際數據公司(IDC)的研究報告稱,2011年全球被創建和被復制的數據總量為1.8ZB,并預測到2020年,全球將擁有35ZB(1ZB=10億TB)的數據量[1]。大數據已經滲透到每一個行業和領域,被視為“未來的新石油” ,逐漸成為重要的生產因素。隨著消費者、企業、各個經濟領域不斷挖掘大數據的潛力,我們正處在一個巨大浪潮的尖峰,這個浪潮就是大數據驅動的技術創新、生產率提高、經濟增長以及新的競爭形勢和新價值的產生[2]。近年來,大數據技術研究和應用迅速發展,許多國家已經意識到了大數據的重要性,并作為戰略性技術大力推動其發展,大數據時代已悄然而至。
2 大數據的含義與特征
目前對大數據還沒有標準的定義,通常認為它是一種數據量很大、數據形式多樣化的非結構化數據。亞馬遜網絡服務、數據科學家John Rauser曾提到一個簡單的定義:大數據是任何超過了一臺計算機處理能力的龐大數據量[3]。維基百科定義為:大數據是指無法在一定時間內用常規軟件工具對其內容進行抓取、管理和處理的數據集合[4]。百度百科定義為:大數據通常用來形容一個公司創造的大量非結構化和半結構化數據,這些數據在下載到關系型數據庫用于分析時會花費過多時間和金錢。從各種各樣類型的數據中快速獲得有價值信息的能力,就是大數據技術[5]。IBM從三個基本特性角度來定義大數據,即:“3V”:體量(Volume),速度(Velocity)和多樣性(Variety)。也有人為大數據包括三個要素,即:大分析(Big Analytic)、大帶寬(Big Bandwidth)和大內容(Big Content)[6]。
概括起來,大數據的特征主要體現在如下幾個方面:
(1)數據總量規模增長巨大。同一類型的數據在快速增長,目前在傳感器網絡、地理信息導航系統、社會網絡(如微博)、即時通訊(如QQ)、電子商務(如淘寶)、數字圖書館、網絡日志等領域都產生了龐大的數據,規模在不斷擴大。如淘寶目前每天活躍數據量已經超過50TB,共有4億條產品信息和2億多名注冊用戶在上面活動。零售巨頭沃爾瑪每小時都要處理100多萬筆客戶交易,數據庫估計超過2500萬億字節——相當于美國國會圖書館書籍數的167倍,而移動互聯網用戶發送和上傳的數據量達到1.3EB[7]。
(2)數據增長的速度呈指數級持續增長。目前很多領域的數據都以驚人的速度增長,根據WinterCorp的調查顯示,最大的數據倉庫中的數據量每兩年增加3倍(年均增長率為173%),其增長速度遠超摩爾定律增長速度。照此計算,2015年最大數據倉庫中的數據量將逼近100PB[8]。大數據的動態性強,要求分析處理應快速響應,在動態變化的環境中快速完成分析過程,有些甚至必須實時分析,否則這些結果可能就是過時、無效的。如導航定位系統、股票分析系統等對數據實時處理有著較高的要求,大數據分析和處理的方法必須能快速地適應相關業務更新頻率加快的需求。
(3)新的數據來源和數據類型在不斷增加。目前產生大數據的領域在不斷增加,數據類型不僅包括普通文本、照片、動畫、音頻與視頻等,還有像位置信息、鏈接信息等新類型的數據。伴隨著社交網絡、移動計算和傳感器等新技術不斷的應用,大數據中有許多是非結構化數據或半結構化數據,沒有特定的描述模型,數據結構是不固定、不完全或不規則的。
(4)數據的價值日益突現。大數據猶如一座富礦,通過海量數據的處理、整合分析,可以發現新的知識,從而創造新的更大的價值。大數據為許多行業帶來新的商機和發展機遇,充分利用大數據可為企業帶來強大的競爭力。大數據分析能從龐大的數據中發現稀疏而有高價值的知識和規律,為預測和決策提供相關支持。如視頻監控的數據量通常十分大,雖然絕大部分可能沒有實際利用價值,但幾秒鏡頭捕捉到某罪犯體貌特征,可能對公安部門而言就是十分珍貴的。大數據分析就是要進行披沙揀金,發現這些珍貴的信息。
綜上所述,對于大數據中“大”的理解,主要有兩個方面,第一是指大量的、快速增長的數據,第二則是數據中所蘊含的價值量較大。可見,大數據之“大”,并不光是指數據的數量之大,它的意義還在于數據的價值之大。
3 大數據對企業競爭情報的影響
情報研究是利用數據和信息提煉出有價值的情報,為決策提供有關方案,也就是對數據進行處理、組織和解釋,以揭示其潛在的知識,轉化為可執行利用的情報。企業競爭情報分析就是從原始的數據中發現關于競爭環境、競爭對手和競爭策略情報的過程,從而形成高附加價值的產品。因此,大數據分析在對象、運用的方法和目標等方面都與企業競爭情報研究有許多交集,大數據的興起必然對企業競爭情報產生深刻的影響。
3.1 企業提升競爭力需要大數據的支持
數據競爭已經成為企業提升核心競爭力的利器。來自各個方面零碎的龐大數據融合在一起,可以構建出企業競爭的全景圖,洞察到競爭環境和競爭對手的細微變化,從而快速響應,制定有效競爭策略。龐大的數據更具有統計意義,能為各種預測模型提供支持,從而能預測未來的發展趨勢,幫助企業獲得先機。相關的數據整合在一起,能不斷產生新的信息和知識,有助于提高生產率、降低經營成本。如2008年初,阿里巴巴平臺上整個買家的詢盤數急劇下滑,自然導致買盤的下降,說明歐美對中國采購量在下滑。海關是賣了貨出去以后再獲得數據,而阿里巴巴提前半年時間就從詢盤上推斷出世界貿易發生變化了[9]。企業的競爭不再只是勞動生產率的競爭,而是知識生產率的競爭。數據是信息的載體,是知識的源泉,是企業創造價值和利潤的原材料,因此,基于知識的競爭將集中體現在基于數據的競爭上。正如馬云所說,未來是數據競爭的時代,誰擁有數據,誰就擁有未來。如今各行各業都出現了以數據分析為競爭力的企業,它們都是在數據分析的基礎上與其他企業展開競爭,以提升核心競爭能力,保持或獲得行業領先地位,如谷歌、寶潔、沃爾瑪等世界知名公司。沃爾瑪就建立了一個超大的數據中心,其存儲能力高達4PB以上,通過大數據分析,沃爾瑪掌握了顧客的購買習慣,不同商品一起購買的概率,購買者在商店所穿行的路線、購買時間和地點,從而確定商品的上架布局以及對分類進行優化;決定對各個商店的不同商品進行增減,以保持最優的庫存,降低成本;洞察銷售全局,瞬間捕獲到各種細微的變化,從而快速響應,制定營銷策略;利用大數據工具對供應鏈進行分析以選擇供應商、優化物流配送方案和進行價格談判等;利用大數據分析工具對熱銷商品品種和庫存的趨勢進行分析,以選定需要補充的商品,分析顧客購買趨勢和季節性購買模式,以確定降價商品,并對其數量和運作做出反應[10]。可見,大數據已經成為企業的核心資產,對數據的掌控可以形成對市場的支配,并且獲取巨大的回報。大數據是企業用于提升核心能力的重要手段,而為提升企業競爭優勢的大數據分析是企業競爭情報研究的重要范疇。
4.2 注重數據的清洗與過濾
大數據時代企業所要處理的數據比較多,但數據的質量往往參差不齊,如有些數據不一致或不準確、數據陳舊以及人為造成的錯誤等,通常被稱之為“臟數據”。由于數據挖掘是數據驅動,因而數據質量顯得十分重要?!芭K數據”往往導致分析結果的不正確,進而影響到決策的準確性。由于大部分的數據庫是動態的,許多數據是不完整的、冗余的、稀疏甚至是錯誤的,這將會給數據的知識發現帶來困難。由于人為因素的影響,如數據的加工處理以及主觀選取數據等,從而使得數據具有某些噪聲,會影響數據分析模式抽取的準確性。大量冗余數據也會影響到分析的準確性和效率。因此,在數據挖掘分析時,首先需要進行數據預處理,也就是要對數據進行凈化和過濾,刪除一些無關的數據。數據清洗是一個減少錯誤和不一致性、解決對象識別的過程[12]。一般通過概率統計等原理查找數值異常的記錄。如在網站的日志文件數據處理中,可以通過檢查URL的后綴刪除認為不相關的數據,可使用一個缺省的后綴名列表幫助刪除文件,去掉一些不能反映用戶行為的記錄,過濾一些請求錯誤和失敗的記錄等。
在大數據時代,不能不計成本盲目的收集各種海量的數據,否則將成為一種嚴重的負擔。數據的體量只是大數據的一個特征,而數據的價值、傳遞速度和持續性才是關鍵。為了達到這些目標,企業競爭情報收集可以采用最小數據集的方法,指通過收集具有代表性的最少的數據,更好地掌握一個觀察對象所有的特點或者一個事件所處狀態,其核心是針對被觀察的對象建立一套精簡實用的數據指標,采用一定取樣標準選擇和過濾相關數據。總之,通過對數據質量的控制和管理,可以提高數據分析的準確性,進一步提高競爭情報工作的效益。
4.3 關注新數據類型的分析方法
在大數據時代,企業無論是日常運營,還是重大戰略決策,都會在各種各樣的信息系統中留下各種數據記錄,這些數據通過技術整合起來,可以再現一個企業的運行軌跡和發展全景。競爭情報研究就是發現有價值的知識和模式,洞察企業競爭環境,預測未來,從而獲得競爭優勢。隨著信息技術的普及應用,新的數據類型不斷產生,下面一些新的數據類型和分析方法值得關注。
(1)實時數據。如微博、短信等大量的動態數據流,是一種十分重要的競爭情報源。數據流挖掘是對數據進行單遍現行掃描,快速處理數據,提供實時近似結果的技術。如窗口技術采用分而治之的策略,將流數據按照特定的需求分配到不同的窗口,進入窗口內的數據才會被處理,以減少分析處理的數據量;而概要數據結構技術將數據流進行概括統計的數據結構代表原始數據,而不是保留數據流中的全部數據,從而減少處理的數據量[13]。在大數據時代,競爭情報分析的數據許多是連續、快速、隨時間變化的,對如此巨大的數據流,企圖存儲或者掃描所有的數據都是不實際的,只有采用動態的數據流挖掘分析技術才能有效解決數據的沖擊,獲得實時近似的結果。數據流挖掘技術能為競爭情報提供實時查詢服務和處理,從而促使企業的“觸角”保持足夠的敏捷性。
(2)動態數據。從時間的維度發現有關變化規律。時間序列分析是指從大量不同時間重復測得的數據中發現前后數據相似或者有規律的模式、趨勢和突變的方法,主要的技術主要是相似模式發現,包括相似模式聚類和相似模式搜索時間序列,采用的主要挖掘方法主要有小波變換法和經驗模態分解法[14]等。在大數據時代,各種數據源源不斷的產生,比如交易數據、網站訪問日志等,從中必然會呈現出時間上的規律,企業希望從積累了大量的歷史數據中分析出一些模式,以便從中發現商業機會,通過趨勢分析,甚至預先發現一些正在新涌現出來的機會,比如企業可以通過數據時間序列分析了解產品銷售的旺季和淡季,制定針對性的營銷策略,減少生產和銷售的波動性,從而獲得利潤和競爭優勢。
(3)關聯數據。關聯數據發現技術是分析數據之間的聯系,將孤立、離散的數據點結合產生數據鏈或者數據圖,隨后從多個數據源中查出匹配給定關聯模式的實例、最后再對匹配的實例評估。目前已應用的主要方法有:圖論的稀有度監測法、圖熵法和基于謂詞的邏輯歸納推理法等[15]。關聯發現技術特別適合于動態的數據發現未知的模式,而大數據中隱含了大量未知、潛在的關系,新模式的發現有利于企業采取“藍海”戰略,搶占先機,從而獲得競爭優勢。
(4)社會網絡數據。社會網絡分析也叫鏈接挖掘,是通過網絡中的關系分析探討網絡的結構及屬性特征,其挖掘重要任務的是基于鏈接的節點排序、基于鏈接節點的分類、節點聚類、鏈接預測、子圖發現等[16]。在大數據時代,大量相關的數據聚合在一起,相互支撐解釋和印證,形成了復雜的數據網絡,數據之間的關系具有非常重要的價值,如通過消費者行為的鏈接數據挖掘能發現傳銷顧客網絡,從而制定找出利潤最大化的顧客群,又如從人際關系的網絡節點的中心度來分析競爭對手,從而制定相關的競爭策略等。
4.4 促進數據分析的可視化
數據可視化技術指的是運用計算機圖形學和圖像處理技術,將數據轉換為圖形或圖像顯示出來,并進行交互處理的方法和技術,其本質是從抽象數據到可視化結構的映射。在大數據時代,數據只是原材料,其真正的價值需要通過知識和情報來實現。企業競爭情報分析的結果必須是可理解的,才能較為容易地轉化為生產力??梢暬梢苑从硵祿恼Z義關系,加快數據的處理速度,使龐大的數據得到充分有效利用;可以在人與數據間實現交互,幫助人們觀察到數據中隱含的問題,為發現和理解有關規律提供有力工具??梢暬垢偁幥閳蟾右子诶斫夂瓦\用。采用一定的分析模型將相關的數據組織在一起,直觀地表達競爭情報和競爭情報之間的邏輯關系,如進行一些關聯分析,以生動形象的方式顯示描繪人物、公司和事件之間的聯系,探索事件、人、地點、產品和組織間潛在關系并預測可能產生的結果,輔助決策過程??梢暬勺鳛橐环N基礎技術嵌入到企業競爭情報分析工具中,人們總是希望看到研究報告中的生動圖像,而不是一大堆枯燥的數據,企業競爭情報研究結果通過可視化方式,采用不同數據維度提供給不同層次的決策者使用,便于理解,支持企業高效運營。因此,可視化技術是大數據時代企業競爭情報研究的有效工具。
4.5 探索大數據新的分析技術和工具的應用
大數據時代企業競爭情報面臨的數據量是無法比擬的,對一些實時性要求較高的決策,分析方法的速度和效率顯得十分重要。傳統的競爭情報分析方法顯然難于處理不斷增長的、龐大的、異構的數據,只有借助新的處理技術才能實現數據提取和清洗、分析和利用。目前大數據相關技術研究已取得一定的進展。如“MapReduce”是一種簡潔的并行計算模型,它在系統層面解決了擴展性、容錯性等問題,通過接受用戶編寫的函數,自動地在可伸縮的大規模集群上并行執行,從而可以處理和分析大規模的數據。“MapReduce”具有簡潔的模型、良好的擴展性、容錯性和并行性,可以進行復雜深入的數據分析,隨著其性能的不斷改進和分析能力的不斷增強,能夠幫助人們從大數據中分析和發現有用的知識[17]。如何提高數據挖掘算法的效率和適應性,使挖掘方法具有一定規模的伸縮性,是數據分析較為突出的問題。應用實時性技術和分布并行算法技術是提高數據挖掘方法效率和實用化的有效途徑。此外,統計分析語言標準化也有助于提高數據分析效果。如R語言是主要用于統計分析、繪圖的語言和操作環境,其功能包括數據存儲和處理系統、數組運算工具、完整連貫的統計分析工具。R語言針對大數據將廣泛使用的統計算法進行了優化,能夠在短暫的時間內從大量的數據中發現有意義的信息[18]。目前業界對大數據的處理分析方法已開始進行了一些探索,并且開發了一些相關的工具。企業競爭情報研究應該針對大數據的特點,吸收和融合數據挖掘分析新的技術方法,不斷創新和發展。
5 結語
企業競爭情報可以幫助企業洞察競爭環境,發現新的競爭對手、判斷競爭的發展性動向,及時做出相關的反應,從而獲得較大的競爭優勢。大數據提供了一個全新的信息生態環境,給企業競爭情報研究帶來了深刻的影響,促使其不斷地創新和變革,以適應企業在大數據時代獲取核心競爭力的需求。大數據時代的企業競爭情報研究將走傳統情報分析方法與大數據技術相結合的發展道路。目前基于大數據的企業競爭情報研究剛剛起步,許多問題仍然需要進一步探討。
參考文獻:
[1]F.Gantz and D.Reinsel.The 2011 Digital Universe Study: Extracting Value from Chaos[EB/OL].[2012-08-18].ww
/collateral/demos/microsites/emc-digitaluniver
se-2011/index.htm.
[2]Big data:the next frontier for innovation,competition and productivity[R].McKinsey Global Institute,2011.
[3]Philip Russom.big data analytics[EB/OL].[2012-08-01].
.
[4]Big data[EB/OL].[2012-08-18].
[6]涂蘭敬.專家觀點:“大數據”與“龐大數據”的區別[J].網絡與信息,2011,(12):37-38.
[7]國金證券.“大數據”行業專題分析報告[EB/OL].[2012-08-01]..
[8]王珊等.架構大數據:挑戰、現狀與展望[J].計算機學報,2011,34(10):15-16.
[9]國金證券.“大數據”行業專題分析報告[EB/OL].[2012-08-01]..
[10]涂子沛.大數據[M].廣西師范大學出版社,2012:161,
304-306.
[11]畢強.網絡信息集成服務研究綜述[J].情報理論與實踐,2004,(1):21-25.
[12]郭志懋.數據質量和數據清洗研究綜述[J].軟件學報.2012,12(11):22-28.
[13]JiaweiHan Micheline Kamber.范明,孟小峰譯.數據挖掘概念與技術[M].北京:機械出版社,2007:306-320.
[14]倪志偉等.動態數據挖掘[M].北京:科學出版社,2010:31,232.
[15]張公讓.商務智能與數據挖掘[M].北京:北京大學出版社,2010:151-159.
[16]約翰·斯科特.劉軍譯.社會網絡分析法[M].重慶:重慶大學出版社,2007:1-6.
[17]覃雄派等.大數據分析——RDBMS 與MapReduce 的競爭與共生[J].軟件學報,2012,2(1):33-42.