㈠ 哪種行業可以在數據倉庫中保有最過時的信息,但仍有效
證券行業屬於數據密集型企業,在日常的工作中積累了大量交易、財務、財經數據。這些海量的數據長期處於無價值狀態,如何充分利用這些數據,從這些數據中發 現有價值的信息呢?建立數據倉庫是證券公司一個不錯的選擇。利用數據倉庫提供的強大數據分析能力,能使證券公司在提升客戶服務、提高資產質量、降低成本上 起到非常重要的作用。
㈡ 數據分析部門與數據倉庫部門之間的職責劃分應該是怎樣
那麼究竟數據倉庫的「行」在何處:它可以為我們帶來什麼?為什麼「不行」:它的應用為什麼不能達到其預期的效果?怎樣才能使數據倉庫從「不行」的模式轉到到「行」的模式?本文試對此進行探討,並認為數據的集中統一是數據倉庫應用的基礎;確立合理的數據模型是數據倉庫應用的核心;高效的應用系統是數據倉庫應用的動力;良好的外部環境是數據倉庫成功應用的外部保障。 數據倉庫的「行」 這里所說的數據倉庫的「行」主要是指數據倉庫可以做什麼,它的使用能為證券業帶來哪些好處,為什麼對券商來說是一個行之有效的工具。 數據倉庫(Data Warehouse)是在資料庫基礎上發展而來的,是一個面向主題的、集成的、穩定的、不同時期的數據集合,用以支持企業經營管理中的決策過程。它通常由三個部分構成:數據倉庫、聯機分析處理及數據挖掘,它們之間具有極強的互補關系。數據倉庫用來對大量的數據按一定的結構進行組織存儲;聯機分析處理則可進行靈活豐富的多維分析與查詢,可以從不同的角度去分析企業的運作情況,並對未來進行預測;數據挖掘則是對現有數據進行深層次的研究分析,從中找出對經營管理有用的結論。 由上述對數據倉庫的敘述,不難看出特別是對券商這種數據密集型的企業而言,數據倉庫技術的應用在以下三個方面有其得天獨厚之處和現實的意義: 提升客戶服務 雖然大部分券商已積累了大量的客戶信息和交易數據,但現在還沒有辦法對客戶的貢獻度、盈虧情況、持倉情況及操作習慣等進行統計和分析,為客戶提供針對其個人習慣的投資組合建議。而通過建立數據倉庫,為客戶資料的統計分析提供基本的信息源和輔助工具,已成為券商提高市場競爭能力和客戶服務水平的關鍵。提高資產質量 數據倉庫中強大的分析和預測功能為此提供了有力的支持,可根據股市行情走勢、上市公司的資料以及宏觀微觀經濟數據等對未來市場進行預測,為客戶和自有資產的經營管理提供合理的建議,從而有效地提高資產質量、防範經營風險。降低成本 數據倉庫的建立可使券商更加及時、准確地掌握自身的經營狀況、資金情況、利潤情況、客戶群分布等重要的信息,從而能有效地提高管理水平、降低經營成本,使整個證券公司的經營管理更加高效、科學、規范。數據倉庫的「不行」 雖然從理論上說數據倉庫技術的應用可以為券商帶來很大的收益,但實際情況卻並不盡如人意,完全意義上的數據倉庫的應用在證券業中還鮮有成功的案例,這也使得相當部分券商對它「望而卻步」,為什麼數據倉庫從「行」變成了「不行」,不能有效發揮其應有的作用呢?究其主要原因就是數據倉庫技術沒有做到與證券業務的有機融合 。系統平台不統一 目前大部分券商所用的業務系統平台並不統一,如交易系統用一種軟體,清算系統又用另一種軟體,還有的證券公司中各家營業部所採用的業務系統的平台也不一樣,而且大部分採用的都是分布的管理模式,這種情況造成了數據的分散、數據結構的多樣。而數據倉庫的基礎是大量集中的、豐富的、按統一規則組織存放的數據,分散的、結構不同的數據使得數據採集困難,數據倉庫不能有效地發揮其作用。技術與業務部門欠協調 數據倉庫的提出和應用通常都是技術部門在其中扮演重要角色,業務部門參與得較少,但實際上沒有業務部門與技術部門之間的很好協調,數據倉庫是不可能應用成功的。因為數據倉庫技術是管理科學、計算機科學、網路科學和分析手段的大融合,從技術上來說資料庫技術的發展已使數據倉庫的實現並不困難,而關鍵在於怎樣使用它。數據倉庫的成功使用離不開管理思想和業務經驗的完美結合,在有了相應的技術支持以後,只有同時具備豐富的業務經驗和先進的管理思想的使用者才能成功使用數據倉庫,得到有用的信息。缺乏管理經驗 數據倉庫不乏失敗的案例,如美國在對越戰爭中根據越軍對美軍攻擊的時間和次數而得出了一個「越軍在有月亮的晚上最易展開攻擊」的無用結論。數據倉庫使用時一個重要問題是建立模型,數據倉庫的產品一般可使用多種建模方法,如關聯法、依賴法、時序法、神經網路以及利用統計分析等等,然後利用模型去對問題進行分析得出相應結論,建立在數據倉庫之上的系統都是決策支持系統。而要進行決策,針對一個具體的問題怎樣分析,從什麼角度進行分析,何種因素是主要的、何種因素是次要的,採用何種方法建模以及怎樣建模都要依使用者的經驗而定,這就要求使用者對相關的業務非常熟悉並具備相應的管理和分析能力,否則得出的結論就很可能是無用的。而對我國大部分券商而言,缺少的恰好就是這種經驗,而且券商經營管理中的不規范也為數據倉庫的成功應用增加了難度。受政策影響較大 人們將市場對經濟的自動調節比喻為「一隻看不見的手」,而股市則是反映經濟情況的晴雨表,經濟學家一直試圖通過對市場的研究找出經濟發展的規律,數據倉庫的主要效用之一也就是通過對已有數據的分析藉以揭示市場內在的發展規律,從而得出市場可能的走向。但縱觀中國證券市場十多年的風風雨雨,國家政策與宏觀調控這只「看得見的手」在其中起了舉足輕重的作用,當然這是由於我國證券市場先天基礎不好,發展不規范使得國家不得不採取措施加以調整,但這也使得證券市場無可避免地打上了國家政策的烙印。這種情況下,單純根據市場規律,用數據倉庫進行分析得到的預測結果與實際情況就會有所偏差。從「不行」到「行」 如何將數據倉庫的「不行」變為「行」,使其在我國的證券業發展中發揮巨大的作用,是廣大券商普遍關心的一個問題 。那麼在找出「不行」的原因之後我們就可「對症下葯」採取相應的措施了。 數據的集中統一是數據倉庫應用的基礎。首先要統一券商所用信息系統的平台,各營業部均應採用統一的系統平台,同時各業務系統也採用統一的平台,統一數據結構。並採用集中的經營管理模式,使所有的數據都按相同的結構集中存放在一起,方便數據採集,做好數據倉庫應用的基礎工作。 確立合理的數據模型是數據倉庫應用的核心。電腦技術人員知道數據倉庫可以「做什麼」,業務人員則知道具體的分析要「怎麼做」,為此應將技術部門與相關的業務部門進行很好的協調,充分發揮技術人員和業務人員的優勢,根據證券業和本公司的具體情況選用合適的方法建立模型,這些模型經過檢驗正確後就可作為整個數據倉庫的核心,為經營管理提供決策建議。 高效的應用系統是數據倉庫應用的動力。數據模型建好以後,要使其發揮應有的作用就應在其上建立相應的應用系統,包括客戶關系管理系統、市場分析和風險控制系統等等,只有當建立於數據倉庫基礎之上的應用系統在券商的發展中起了很好的作用以後,證券公司的老總們才能充分意識到數據倉庫的重要性,這就是數據倉庫應用發展的動力所在。 良好的外部環境是數據倉庫成功應用的外部保障。令人欣慰的是國家已意識到證券市場健康穩定的重要性,證監會等領導機構對券商和上市公司的要求越來越嚴格,監管力度不斷加強,這一切都促使中國股市朝健康穩定的方向發展。我們有理由相信隨著我國證券市場的逐步規范,股市也必將按市場規律進行發展,數據倉庫就會發揮越來越大的作用。 結束語 數據倉庫的應用在國外取得了很大的成功,但中國與外國在數據倉庫的應用環境方面有很大的區別,所以數據倉庫在中國的應用成功的案例並不多。為了促進這項技術在證券業的成功應用,除了證監會等領導機構對證券市場進行規范為其創造良好的外部環境之外,更重要的是各證券公司注意業務系統平台的集中統一和技術與業務的有機融合,做好數據倉庫應用的准備,勇敢面對加入WTO所帶來的挑戰。
-
㈢ 哪裡可以看券基持倉
用大智慧、指南針、同花順的贏富數據版軟體就可以了。不過一年要23000。免費的就上網看,頂牛網、兔馬窩、股參網等等都可以查詢。不過圖形不好看而已。
贏富:是上海證券交易所信息服務的品牌名。上證所於2005年建設完成目前國內金融行業數據容量最大的數據倉庫,該數據倉庫涵蓋了上證所成立以來所有的歷史數據及最新增量數據,范圍包括交易核心數據、交易相關數據和上市公司數據等,數據類型則包含結構化數據和非結構化數據,是一個涵蓋從數據清洗、存儲、整合、查詢、統計分析運用到高端分析、挖掘和預測的企業智能信息平台。
TopView(贏富)信息正是基於上證所數據倉庫海量、權威的信息資源,特別為滿足廣大投資者、上市公司、證券經營機構和所有市場參與者的需求而精心設計開發的。TopView(贏富)品牌旗下系列服務包含:盤中交易統計服務、盤後交易統計服務、上市公司個性化信息服務、證券機構個性化信息服務等。
「不股票我要說的是,你的信息好像也太之後了,沒有停水贏富數據元月1號就停掉了么?上證的贏富數據都停了,你說的哪幾家哪裡還有贏富數據的產品呢?」——
——你說清楚點,我看不懂。
㈣ 如何建立企業級數據倉庫
隨著計算機應用的深入,大量數據存儲在計算機中,信息的存儲、管理、使用和維護顯得越來越重要,而傳統的資料庫管理系統很難滿足其要求。為了解決大數據量、異構數據集成以及訪問數據的響應速度問題,採用數據倉庫技術,為最終用戶處理所需的決策信息提供有效方法。
1 數據倉庫
數據倉庫是為管理人員進行決策提供支持的一種面向主題的、集成的、非易失的並隨時間而變化的數據集合。數據倉庫是一種作為決策支持系統和聯機分析應用數據源的結構化數據環境。
從目前數據倉庫的發展來講,數據可以存放於不同類型的資料庫中,數據倉庫是將異種數據源在單個站點以統一的模型組織的存儲,以支持管理決策。數據倉庫技術包括數據清理、數據集成、聯機分析處理(OLAP)和數據挖掘(DM)。OLAP是多維查詢和分析工具,支持決策者圍繞決策主題對數據進行多角度、多層次的分析。OLAP側重於交互性、快速的響應速度及提供數據的多維視圖,而DM則注重自動發現隱藏在數據中的模式和有用信息。OLAP的分析結果可以給DM提供分析信息,作為挖掘的依據;DM可以拓展OLAP分析的深度,可以發現OLAP所不能發現的更為復雜、細致的信息。OLAP是聯機分析處理,DM是通過對資料庫、數據倉庫中的數據進行分析而獲得知識的方法和技術,即通過建立模型來發現隱藏在組織機構資料庫中的模式和關系。這兩者結合起來可滿足企業對數據整理和信息提取的要求,幫助企業高層做出決策。在歐美發達國家,以數據倉庫為基礎的在線分析處理和數據挖掘應用,首先在金融、保險、證券、電信等傳統數據密集型行業取得成功。IBM、oracle、Teradata、Microsoft、Netezza和SAS等有實力的公司相繼推出了數據倉庫解決方案。
近幾年開始流行「分布式數據倉庫」,是在多個物理位置應用全局邏輯模型。數據被邏輯地分成多個域,但不同位置不會有重復的數據。這種分布式方法可以為不同的物理數據創建安全區域,或為全球不同時區的用戶提供全天候的服務。此外,有由Kognitio發起數據倉庫託管服務,即DBMS廠商為客戶開發和運行數據倉庫。這種最初出現在業務部門,業務部門購買託管服務,而不是使用企業內IT部門提供的數據倉庫。
2 數據挖掘技術
數據挖掘(DataMining),又稱資料庫中的知識發現(KnoWledge Discoveryin Database,KDD),是指從大型資料庫或數據倉庫中提取隱含的、未知的、非平凡的及有潛在應用價值並最終可為用戶理解的模式過程。它是資料庫研究中的很有應用價值的新領域,是人工智慧、機器學習、數理統計學和神經元網路等技術在特定的數據倉庫領域中的應用。數據挖掘的核心模塊技術歷經數十年的發展,其中包括數理統計、人工智慧、機器學習。從技術角度看,數據挖掘是從大量的、不完全的、有雜訊的、模糊的、隨機的實際數據中,提取隱含在其中的、人們所不知道的、但又是潛在有用的信息和知識的過程。從商業應用角度看,數據挖掘是嶄新的商業信息處理技術,其主要特點是對商業資料庫中的大量業務數據進行抽取、轉化、分析和模式化處理,從中提取輔助商業決策的關鍵知識。
從技術角度講,數據挖掘可應用於以下方面:
(1)關聯規則發現是在給定的事物集合中發現滿足一定條件的關聯規則,簡單來講,就是挖掘出隱藏在數據間的相互關系,為業務主題提供指導。
(2)序列模式分析和關聯規則發現相似,但其側重點在於分析數據間的前後關系。模式是按時間有序的。序列模式發現是在與時間有關的事物資料庫中發現滿足用戶給定的最小支持度域值的所有有序序列。
(3)分類分析與聚類分析,分類規則的挖掘實際上是根據分類模型從數據對象中發現共性,並把它們分成不同的類的過程。聚類時間是將d維空間的n個數據對象,劃分到k個類中,使得一個類內的數據對象間的相似度高於其他類中數據對象。聚類分析可以發現沒有類別標記的一組數據對象的特性,總結出一個類別的特徵。
(4)自動趨勢預測,數據挖掘能自動在大型資料庫裡面尋找潛在的預測信息。一個典型的利用數據挖掘進行預測的例子就是目標營銷。數據挖掘工具可以根據過去郵件推銷中的大量數據找出其中最有可能對將來的郵件推銷作出反應的客戶。
3 聯機分析(OLAP)處理技術
聯機分析(OLAP)是數據倉庫實現為決策提供支持的重要工具,是共享多維信息,針對特定問題的聯機數據訪問和分析的快速軟體技術。是使分析人員、管理人員或執行人員能夠從多種角度對從原始數據中轉化出來,能夠真正為用戶所理解,並真實反映企業維特性的信息進行快速、一致、交互地存取,從而獲得對數據的更深入了解的一類軟體技術(OLAP委員會的定義)。OLAP的特性包括:①快速性:系統應能在5s內對用戶的大部分分析要求做出反應;②可分析性:能處理與應用有關的任何邏輯分析和統計分析;⑨多維性:多維性是OLAP的關鍵屬性。系統必須提供對數據的多維視圖和分析,包括對層次維和多重層次維的完全支持;④信息性:系統應能及時獲得信息,並能管理大容量信息。
OLAP的數據結構是多維,目前存在方式:①超立方結構(Hypercube),指用三維或更多的維數來描述一個對象,每個維彼此垂直。數據的測量值發生在維的交叉點上,數據空間的各部分都有相同的維屬性(收縮超立方結構。這種結構的數據密度更大,數據的維數更少,並可加入額外的分析維);②多立方結構(Multicube),即將超立方結構變為子立方結構。面向某特定應用對維分割,它具有強靈活性,提高了數據(特別是稀疏數據)的分析效率。分析方法包括:切片、切塊、旋轉、鑽取等。
OLAP也被稱為共享的多維數據的快速分析FASMI,應用在數據密集型行業,如市場和銷售分析、電子商務的分析、基於歷史數據的營銷、預算、財務報告與整合、管理報告、利益率、質量分析等。
4 小 結
採用數據倉庫的數據挖掘及聯機分析技術實現的決策支持系統,是彌補傳統輔助決策系統能力不足的有效途徑,具有重要的現實意義。
㈤ 國內券商(證券行業)IT發展現狀及問題分析
1992年—1994年,國內誕生了櫃台系統和電話委託系統,股民可以通過電話進行股票交易。1998年,誕生了網上委託業務,有條件的股民可以通過網路進行交易。2003年,誕生了集中交易系統,所有交易不必在營業部進行,直接在券商總部集中進行交易。2005年可以通過手機進行炒股,在手機普及的中國,廣大股民又多了一條方便炒股的途徑。
2006年,為了保證客戶資金安全,在監管要求下誕生了三方存管系統,券商接受的客戶資金必須保存在銀行,這樣避免了券商挪用客戶資金的情況發生。2004年—2008年,隨著證券業務種類多樣化,誕生了集合理財系統、投行系統、固定收益系統、以及目前正在建設當中的股指期貨系統和融資融券系統。短短20年時間,伴隨著券商業務模式的變革,國內券商的IT系統發生了巨大的變化。目前很多券商90%以上的收益來自於經紀業務,而經紀業務中超過70%的收益來自於網上交易,而不是傳統的營業部終端交易或電話委託交易,網上交易系統的重要性不言而喻。由此可見,核心IT系統能否安全穩定運行直接決定券商業務是否能夠正常開展,直接關繫到廣大股民的利益。
雖然券商的IT建設在短時間內取得了巨大發展,但是當前仍然存在著一些重要的不足制約券商業務的創新和發展,主要表現在以下幾個方面。
一、國內券商的IT側重在IT運維,主要精力投入在保障系統安全穩定運行方面,而忽略了自主開發的能力的培養,在支持業務創新方面能力明顯不足,某種程度上限制了業務發展;
二、重要業務系統建設如集中交易系統、行情系統等被幾家供應商壟斷,券商選擇的餘地不大。券商缺乏對於供應商的掌控能力;
三、管理層更多關心業務發展,對IT了解較少,對IT在公司發展中的作用認識不夠充分,缺乏IT治理的能力,沒有有效的利用IT的價值;
四、IT發展戰略不明確,缺少IT規劃。IT架構相對落後;
五、IT與業務溝通存在障礙,互相不能理解對方的語言;
六、IT缺乏精細化管理;
七、IT員工的能力有待進一步提高。
相比而言,台灣的證券公司IT應用發展水平明顯高於大陸。以CRM為例,在國內很多證券公司建立了CRM系統,其僅僅是作為解答客戶疑問的幫助平台;而在台灣,富邦證券也建立了CRM系統,但其發揮作用遠不僅是一個回答客戶問題的幫助台。富邦證券成立之初,面臨的情況和現在大陸券商類似:建立了CRM系統,僅用於解答客戶問題。當時大部分業務部門均以各自產品為導向,獨立發展,缺乏跨業務部門的公司層面的CRM策略。客戶信息分散在各個子公司的客戶資料庫中,他們在進行客戶分析和營銷活動計劃時無法對客戶進行整體性評價,缺乏對客戶的研究,客戶服務水平一般。各子公司進行客戶管理和客戶營銷時,各自為戰,對一個客戶多次進行產品營銷,甚至出現各子公司爭搶客戶,導致內部資源的浪費和客戶忠誠度降低。富邦證券意識到了這個問題,建立了公司統一的數據倉庫,整合所有子公司的客戶資料,並在此基礎上建設CRM系統將客戶信息、營銷流程以及銷售渠道進行整合以支持公司的交叉銷售策略。
CRM系統建設過程中,將營銷系統與Call Center、個人理財和客戶經理系統等銷售渠道進行整合,以形成端到端的CRM環路,如直郵(Direct Mail)、Call Center(包括Auto-dialer、SMS、FAX、E-mail)、Internet、客戶經理系統等。經過前端渠道處理過的信息(客戶反饋信息),再通過整合的信息交互渠道,傳回CRM系統進行進一步的分析和決策,達到分析型CRM系統與操作型CRM系統的無縫整合。使得客戶感受到了無縫隙的服務,展現在客戶面前的是一個整合的富邦證券,而不是以前的富邦證券的經紀業務部門、投資咨詢部門等等獨立的個體,真正實現了IT引領業務發展。
通過整合銷售渠道,將數據分析、營銷管理人員與銷售渠道聯結起來,不僅提高了營銷的效率,縮短了反饋周期,而且真正利用CRM系統主動服務於客戶,大大優化了客戶體驗,贏得了良好的口碑,也為公司帶來了巨大的經濟效益。
證券公司應該根據自己在行業內的定位,結合公司發展戰略,選擇適合自己的發展道路。如果要成為行業的領先者,要以更好的為客戶提供服務為中心,要制定清晰務實的戰略方向,根據業務戰略制定出IT發展目標和IT實施規劃,通過提高自主研發能力增強對IT系統供應商的控制力和談判籌碼,深度挖掘IT的價值,促進IT與業務的融合,將IT這個戰略工具牢牢把握在自己手裡。另外由於監管部門在對券商評級時對信息安全和IT治理方面提出了明確的要求,因此各券商在這兩個方面也要給予足夠的重視和投入。
當前國內券商無論是業務還是IT都到了一個轉型的時期,中登公司最新的數據,截止2009年06月19日,滬深兩市共有A股賬戶12,773.72萬戶,B股賬戶242.74萬戶;有效賬戶10,974.49萬戶。這個數字對於證券公司來講不一定是好事,說明市場可能已經接近飽和,雖然股民開戶數已經突破一億戶,但是活動賬戶大概只有3000萬戶,這意味各券商只能從現有的這些交易活躍股民中去和其他券商爭搶客戶,才能保證公司效益,彼此競爭將更加激烈。國內證券公司的交易系統,行情系統,CRM系統都大同小異,如果要吸引客戶來本公司開戶,必須通過提供差異化的增值服務,形成公司的品牌和特色。在這個過程中,IT起到至關重要的作用。目前國信證券和招商證券在這方面走在前列。
從去年開始,國內一些證券公司組織中層以上公司的骨幹去台灣、美國和歐洲的金融機構學習其先進的經驗,其中也包括如何更有效的利用IT為公司創造更多價值。這表明一些先知先覺的人已經意識到現在到了必須做出變革的時候,不能像以前一樣靠天吃飯,否則被淘汰只是早晚的事情。
伴隨著創業板的上市,股指期貨以及融資融券業務的推出,未來國內資本市場將會愈加繁榮。各種新的業務產品及衍生品將會層出不窮。國內券商的IT能否跟上業務發展的腳步,這對廣大券商的CIO們來說是一個需要思考的現實問題。
㈥ 企業如何更好的搭建數據倉庫
0 引 言
隨著計算機應用的深入,大量數據存儲在計算機中,信息的存儲、管理、使用和維護顯得越來越重要,而傳統的資料庫管理系統很難滿足其要求。為了解決大數據量、異構數據集成以及訪問數據的響應速度問題,採用數據倉庫技術,為最終用戶處理所需的決策信息提供有效方法。
1 數據倉庫
數據倉庫是為管理人員進行決策提供支持的一種面向主題的、集成的、非易失的並隨時間而變化的數據集合。數據倉庫是一種作為決策支持系統和聯機分析應用數據源的結構化數據環境。
從目前數據倉庫的發展來講,數據可以存放於不同類型的資料庫中,數據倉庫是將異種數據源在單個站點以統一的模型組織的存儲,以支持管理決策。數據倉庫技術包括數據清理、數據集成、聯機分析處理(OLAP)和數據挖掘(DM)。OLAP是多維查詢和分析工具,支持決策者圍繞決策主題對數據進行多角度、多層次的分析。OLAP側重於交互性、快速的響應速度及提供數據的多維視圖,而DM則注重自動發現隱藏在數據中的模式和有用信息。OLAP的分析結果可以給DM提供分析信息,作為挖掘的依據;DM可以拓展OLAP分析的深度,可以發現OLAP所不能發現的更為復雜、細致的信息。OLAP是聯機分析處理,DM是通過對資料庫、數據倉庫中的數據進行分析而獲得知識的方法和技術,即通過建立模型來發現隱藏在組織機構資料庫中的模式和關系。這兩者結合起來可滿足企業對數據整理和信息提取的要求,幫助企業高層做出決策。在歐美發達國家,以數據倉庫為基礎的在線分析處理和數據挖掘應用,首先在金融、保險、證券、電信等傳統數據密集型行業取得成功。IBM、oracle、Teradata、Microsoft、Netezza和SAS等有實力的公司相繼推出了數據倉庫解決方案。
近幾年開始流行「分布式數據倉庫」,是在多個物理位置應用全局邏輯模型。數據被邏輯地分成多個域,但不同位置不會有重復的數據。這種分布式方法可以為不同的物理數據創建安全區域,或為全球不同時區的用戶提供全天候的服務。此外,有由Kognitio發起數據倉庫託管服務,即DBMS廠商為客戶開發和運行數據倉庫。這種最初出現在業務部門,業務部門購買託管服務,而不是使用企業內IT部門提供的數據倉庫。
2 數據挖掘技術
數據挖掘(DataMining),又稱資料庫中的知識發現(KnoWledge Discoveryin Database,KDD),是指從大型資料庫或數據倉庫中提取隱含的、未知的、非平凡的及有潛在應用價值並最終可為用戶理解的模式過程。它是資料庫研究中的很有應用價值的新領域,是人工智慧、機器學習、數理統計學和神經元網路等技術在特定的數據倉庫領域中的應用。數據挖掘的核心模塊技術歷經數十年的發展,其中包括數理統計、人工智慧、機器學習。從技術角度看,數據挖掘是從大量的、不完全的、有雜訊的、模糊的、隨機的實際數據中,提取隱含在其中的、人們所不知道的、但又是潛在有用的信息和知識的過程。從商業應用角度看,數據挖掘是嶄新的商業信息處理技術,其主要特點是對商業資料庫中的大量業務數據進行抽取、轉化、分析和模式化處理,從中提取輔助商業決策的關鍵知識。
從技術角度講,數據挖掘可應用於以下方面:
(1)關聯規則發現是在給定的事物集合中發現滿足一定條件的關聯規則,簡單來講,就是挖掘出隱藏在數據間的相互關系,為業務主題提供指導。
(2)序列模式分析和關聯規則發現相似,但其側重點在於分析數據間的前後關系。模式是按時間有序的。序列模式發現是在與時間有關的事物資料庫中發現滿足用戶給定的最小支持度域值的所有有序序列。
(3)分類分析與聚類分析,分類規則的挖掘實際上是根據分類模型從數據對象中發現共性,並把它們分成不同的類的過程。聚類時間是將d維空間的n個數據對象,劃分到k個類中,使得一個類內的數據對象間的相似度高於其他類中數據對象。聚類分析可以發現沒有類別標記的一組數據對象的特性,總結出一個類別的特徵。
(4)自動趨勢預測,數據挖掘能自動在大型資料庫裡面尋找潛在的預測信息。一個典型的利用數據挖掘進行預測的例子就是目標營銷。數據挖掘工具可以根據過去郵件推銷中的大量數據找出其中最有可能對將來的郵件推銷作出反應的客戶。
3 聯機分析(OLAP)處理技術
聯機分析(OLAP)是數據倉庫實現為決策提供支持的重要工具,是共享多維信息,針對特定問題的聯機數據訪問和分析的快速軟體技術。是使分析人員、管理人員或執行人員能夠從多種角度對從原始數據中轉化出來,能夠真正為用戶所理解,並真實反映企業維特性的信息進行快速、一致、交互地存取,從而獲得對數據的更深入了解的一類軟體技術(OLAP委員會的定義)。OLAP的特性包括:①快速性:系統應能在5s內對用戶的大部分分析要求做出反應;②可分析性:能處理與應用有關的任何邏輯分析和統計分析;⑨多維性:多維性是OLAP的關鍵屬性。系統必須提供對數據的多維視圖和分析,包括對層次維和多重層次維的完全支持;④信息性:系統應能及時獲得信息,並能管理大容量信息。
OLAP的數據結構是多維,目前存在方式:①超立方結構(Hypercube),指用三維或更多的維數來描述一個對象,每個維彼此垂直。數據的測量值發生在維的交叉點上,數據空間的各部分都有相同的維屬性(收縮超立方結構。這種結構的數據密度更大,數據的維數更少,並可加入額外的分析維);②多立方結構(Multicube),即將超立方結構變為子立方結構。面向某特定應用對維分割,它具有強靈活性,提高了數據(特別是稀疏數據)的分析效率。分析方法包括:切片、切塊、旋轉、鑽取等。
OLAP也被稱為共享的多維數據的快速分析FASMI,應用在數據密集型行業,如市場和銷售分析、電子商務的分析、基於歷史數據的營銷、預算、財務報告與整合、管理報告、利益率、質量分析等。
4 小 結
採用數據倉庫的數據挖掘及聯機分析技術實現的決策支持系統,是彌補傳統輔助決策系統能力不足的有效途徑,具有重要的現實意義。
㈦ 哪些商業應用在數據倉庫中即使擁有過期的數據也依然有效
在大數據成為趨勢,成為國家戰略的今天,如何最大限度發揮大數據的價值成為人們思考的問題。無論是對於互聯網企業、電信運營商還是數量眾多的初創企業而言,大數據的變現顯得尤為重要。誰最先一步找到密碼,誰就能夠搶占市場,贏得發展。在探索大數據商業模式的同時,大數據正加速在各行各業的應用,大數據不僅為人們的購物、出行、交友提供了幫助,甚至還在高考這樣重要的事件中發揮作用。大數據產業具有無污染、生態友好、低投入高附加值特點,對於我國轉變過去資源因素型經濟增長方式、推進「互聯網+」行動計劃、實現國家製造業30年發展目標有戰略意義。前幾年,國內大數據產業討論較多、落地較少,商業模式處於初探期,行業處於兩種極端:一種是過熱的浮躁帶來了一定的泡沫和產業風險;一種是懷疑大數據只是炒作,依然堅持傳統管理理念、經營模式。但是進入2015年之後,大數據產業告別了泡沫,進入更務實的發展階段,從產業萌芽期進入了成長期。當前,如何將大數據變現成為業界探索的重要方向。B2B大數據交易所國內外均有企業在推動大數據交易。目前,我國正在探索「國家隊」性質的B2B大數據交易所模式。2014年2月20日,國內首個面向數據交易的產業組織—中關村大數據交易產業聯盟成立,同日,中關村數海大數據交易平台啟動,定位大數據的交易服務平台。2015年4月15日,貴陽大數據交易所正式掛牌運營並完成首批大數據交易。貴陽大數據交易所完成的首批數據交易賣方為深圳市騰訊計算機系統有限公司、廣東省數字廣東研究院,買方為京東雲平台、中金數據系統有限公司。2015年5月26日,在2015貴陽國際大數據產業博覽會暨全球大數據時代貴陽峰會上,貴陽大數據交易所推出《2015年中國大數據交易白皮書》和《貴陽大數據交易所702公約》,為大數據交易所的性質、目的、交易標的、信息隱私保護等指明了方向,奠定了大數據金礦變現的產業基礎。咨詢研究報告國內咨詢報告的數據大多來源於國家統計局等各部委的統計數據,由專業的研究員對數據加以分析、挖掘,找出各行業的定量特點進而得出定性結論,常見於「市場調研分析及發展咨詢報告」,如「2015~2020年中國通信設備行業市場調研分析及發展咨詢報告」、「2015~2020年中國手機行業銷售狀況分析及發展策略」、「2015年光纖市場分析報告」等,這些咨詢報告面向社會銷售,其實就是O2O的大數據交易模式。各行各業的分析報告為行業內的大量企業提供了智力成果、企業運營和市場營銷的數據參考,有利於市場優化供應鏈,避免產能過剩,維持市場穩定。這些都是以統計部門的結構化數據和非結構化數據為基礎的專業研究,這就是傳統的一對多的行業大數據商業模式。數據挖掘雲計算軟體雲計算的出現為中小企業分析海量數據提供了廉價的解決方案,SaaS模式是雲計算的最大魅力所在。雲計算服務中SaaS軟體可以提供數據挖掘、數據清洗的第三方軟體和插件。業內曾有專家指出,大數據=海量數據+分析軟體+挖掘過程,通過強大的各有千秋的分析軟體來提供多樣性的數據挖掘服務就是其盈利模式。國內已經有大數據公司開發了這些架構在雲端的大數據分析軟體:它集統計分析、數據挖掘和商務智能於一體,用戶只需要將數據導入該平台,就可以利用該平台提供的豐富演算法和模型,進行數據處理、基礎統計、高級統計、數據挖掘、數據制圖和結果輸出等。數據由系統統一進行管理,能夠區分私有和公有數據,可以保證私有數據只供持有者使用,同時支持多樣數據源接入,適合分析各行各業的數據,易學好用、操作界面簡易直觀,普通用戶稍做了解即可使用,同時也適合高端用戶自己建模進行二次開發。大數據咨詢分析服務機構及企業規模越大其擁有的數據量就越大,但是很少有企業像大型互聯網公司那樣有自己的大數據分析團隊,因此必然存在一些專業型的大數據咨詢公司,這些公司提供基於管理咨詢的大數據建模、大數據分析、商業模式轉型、市場營銷策劃等,有了大數據作為依據,咨詢公司的結論和咨詢成果更加有說服力,這也是傳統咨詢公司的轉型方向。比如某國外大型IT研究與顧問咨詢公司的副總裁在公開場合曾表示,大數據能使貴州農業節省60%的投入,同時增加80%的產出。該公司能做出這樣的論斷當然是基於其對貴州農業、天氣、土壤等數據的日積月累以及其建模分析能力。政府決策咨詢智庫黨的十八屆三中全會通過的《中共中央關於全面深化改革若乾重大問題的決定》明確提出,加強中國特色新型智庫建設,建立健全決策咨詢制度。這是中共中央文件首次提出「智庫」概念。近幾年,一批以建設現代化智庫為導向、以服務國家發展戰略為目標的智庫迅速成立,中國智庫數量從2008年的全球第12位躍居當前第2位。大數據是智庫的核心,沒有了數據,智庫的預測和分析將為無源之水。在海量信息甚至泛濫的情況下,智庫要提升梳理、整合信息的能力必然需要依靠大數據分析。研究認為,93%的行為是可以預測的,如果將事件數字化、公式化、模型化,其實多麼復雜的事件都是有其可以預知的規律可循,事態的發展走向是極易被預測的。可見,大數據的應用將不斷提高政府的決策效率和決策科學性。自有平台大數據分析隨著大數據的價值被各行各業逐漸認可,擁有廣大客戶群的大中型企業也開始開發、建設自有平台來分析大數據,並嵌入到企業內部的ERP系統信息流,由數據來引導企業內部決策、運營、現金流管理、市場開拓等,起到了企業內部價值鏈增值的作用。在分析1.0時代,數據倉庫被視作分析的基礎。2.0時代,公司主要依靠Hadoop集群和NoSQL資料庫。3.0時代的新型「敏捷」分析方法和機器學習技術正在以更快的速度來提供分析結果。的企業將在其戰略部門設置首席分析官,組織跨部門、跨學科、知識結構豐富、營銷經驗豐富的人員進行各種類型數據的混合分析。大數據投資工具證券市場行為、各類指數與投資者的分析、判斷以及情緒都有很大關系。2002年諾貝爾經濟學獎授予了行為經濟學家卡尼曼和實驗經濟學家史密斯,行為經濟學開始被主流經濟學所接受,行為金融理論將心理學尤其是行為科學理論融入金融中。現實生活中擁有大量用戶數據的互聯網公司將其論壇、博客、新聞報道、文章、網民用戶情緒、投資行為與股票行情對接,研究的是互聯網的行為數據,關注熱點及市場情緒,動態調整投資組合,開發出大數據投資工具,比如大數據類基金等。這些投資工具直接將大數據轉化為投資理財產品。定向采購線上交易平台數據分析結果很多時候是其他行業的業務基礎,國內目前對實體經濟的電子商務化已經做到了B2C、C2C、B2B等,甚至目前O2O也越來越流行,但是對於數據這種虛擬商品而言,目前還沒有具體的線上交易平台。比如服裝製造企業針對某個省份的市場,需要該市場客戶的身高、體重的中位數和平均數數據,那麼醫院體檢部門、專業體檢機構就是這些數據的供給方。通過獲取這些數據,服裝企業將可以開展精細化生產,以更低的成本生產出貼合市場需求的服裝。假想一下,如果有這樣一個「大數據定向采購平台」,就像淘寶購物一樣,可以發起買方需求,也可以推出賣方產品,通過這樣的模式,外加第三方支付平台,「數據分析結論」這種商品就會悄然而生,這種商品不佔用物流資源、不污染環境、快速響應,但是卻有「供」和「需」雙方巨大的市場。而且通過這種平台可以保障基礎數據安全,大數據定向采購服務平台交易的不是底層的基礎數據,而是通過清洗建模出來的數據結果。所有賣方、買方都要實名認證,建立誠信檔案機制並與國家信用體系打通。非營利性數據徵信評價機構在國家將公民信息保護納入刑法范圍之前,公民個人信息經常被明碼標價公開出售,並且形成了一個「灰色產業」。為此,2009年2月28日通過的刑法修正案(七)中新增了出售、非法提供公民個人信息罪,非法獲取公民個人信息罪。該法條中特指國家機關或者金融、電信、交通、教育、醫療等單位的工作人員,不得將公民個人信息出售或非法提供給他人。而公民的信息在各種考試中介機構、房產中介、釣魚網站、網站論壇依然在出售,詐騙電話、騷擾電話、推銷電話在增加運營商話務量的同時也在破壞整個社會的信用體系和公民的安全感。雖然數據交易之前是交易所規定的經過數據清洗的數據,但是交易所員工從本質上是無法監控全國海量的數據的。數據清洗只是對不符合格式要求的數據進行清洗,主要有不完整的數據、錯誤的數據、重復的數據三大類。因此,建立非營利性數據徵信評價機構是非常有必要的,將數據徵信納入企業及個人徵信系統,作為全國徵信系統的一部分,避免黑市交易變成市場的正常行為。除了徵信評價機構之外,未來國家公共安全部門也許會成立數據安全局,納入網路警察范疇,重點打擊將侵犯企業商業秘密、公民隱私的基礎數據進行數據販賣的行為。結語:大數據已經從論壇串場、浮躁的觀點逐步走向國家治理體系建設、營銷管理、生產管理、證券市場等方面,其商業模式也多種多樣。市場經驗表明,存在買賣就存在商品經濟,具體哪種商業模式佔主流將由市場決定。而最終的事實將證明,大數據交易商品經濟必然成為「互聯網+」的重要組成部分。
㈧ 數據倉庫在證券業如何應用
那麼究竟數據倉庫的「行」在何處:它可以為我們帶來什麼?為什麼「不行」:它的應用為什麼不能達到其預期的效果?怎樣才能使數據倉庫從「不行」的模式轉到到「行」的模式?本文試對此進行探討,並認為數據的集中統一是數據倉庫應用的基礎;確立合理的數據模型是數據倉庫應用的核心;高效的應用系統是數據倉庫應用的動力;良好的外部環境是數據倉庫成功應用的外部保障。 數據倉庫的「行」 這里所說的數據倉庫的「行」主要是指數據倉庫可以做什麼,它的使用能為證券業帶來哪些好處,為什麼對券商來說是一個行之有效的工具。 數據倉庫(Data Warehouse)是在資料庫基礎上發展而來的,是一個面向主題的、集成的、穩定的、不同時期的數據集合,用以支持企業經營管理中的決策過程。它通常由三個部分構成:數據倉庫、聯機分析處理及數據挖掘,它們之間具有極強的互補關系。數據倉庫用來對大量的數據按一定的結構進行組織存儲;聯機分析處理則可進行靈活豐富的多維分析與查詢,可以從不同的角度去分析企業的運作情況,並對未來進行預測;數據挖掘則是對現有數據進行深層次的研究分析,從中找出對經營管理有用的結論。 由上述對數據倉庫的敘述,不難看出特別是對券商這種數據密集型的企業而言,數據倉庫技術的應用在以下三個方面有其得天獨厚之處和現實的意義: 提升客戶服務 雖然大部分券商已積累了大量的客戶信息和交易數據,但現在還沒有辦法對客戶的貢獻度、盈虧情況、持倉情況及操作習慣等進行統計和分析,為客戶提供針對其個人習慣的投資組合建議。而通過建立數據倉庫,為客戶資料的統計分析提供基本的信息源和輔助工具,已成為券商提高市場競爭能力和客戶服務水平的關鍵。 提高資產質量 數據倉庫中強大的分析和預測功能為此提供了有力的支持,可根據股市行情走勢、上市公司的資料以及宏觀微觀經濟數據等對未來市場進行預測,為客戶和自有資產的經營管理提供合理的建議,從而有效地提高資產質量、防範經營風險。 降低成本 數據倉庫的建立可使券商更加及時、准確地掌握自身的經營狀況、資金情況、利潤情況、客戶群分布等重要的信息,從而能有效地提高管理水平、降低經營成本,使整個證券公司的經營管理更加高效、科學、規范。 數據倉庫的「不行」 雖然從理論上說數據倉庫技術的應用可以為券商帶來很大的收益,但實際情況卻並不盡如人意,完全意義上的數據倉庫的應用在證券業中還鮮有成功的案例,這也使得相當部分券商對它「望而卻步」,為什麼數據倉庫從「行」變成了「不行」,不能有效發揮其應有的作用呢?究其主要原因就是數據倉庫技術沒有做到與證券業務的有機融合 。 系統平台不統一 目前大部分券商所用的業務系統平台並不統一,如交易系統用一種軟體,清算系統又用另一種軟體,還有的證券公司中各家營業部所採用的業務系統的平台也不一樣,而且大部分採用的都是分布的管理模式,這種情況造成了數據的分散、數據結構的多樣。而數據倉庫的基礎是大量集中的、豐富的、按統一規則組織存放的數據,分散的、結構不同的數據使得數據採集困難,數據倉庫不能有效地發揮其作用。 技術與業務部門欠協調 數據倉庫的提出和應用通常都是技術部門在其中扮演重要角色,業務部門參與得較少,但實際上沒有業務部門與技術部門之間的很好協調,數據倉庫是不可能應用成功的。因為數據倉庫技術是管理科學、計算機科學、網路科學和分析手段的大融合,從技術上來說資料庫技術的發展已使數據倉庫的實現並不困難,而關鍵在於怎樣使用它。數據倉庫的成功使用離不開管理思想和業務經驗的完美結合,在有了相應的技術支持以後,只有同時具備豐富的業務經驗和先進的管理思想的使用者才能成功使用數據倉庫,得到有用的信息。 缺乏管理經驗 數據倉庫不乏失敗的案例,如美國在對越戰爭中根據越軍對美軍攻擊的時間和次數而得出了一個「越軍在有月亮的晚上最易展開攻擊」的無用結論。數據倉庫使用時一個重要問題是建立模型,數據倉庫的產品一般可使用多種建模方法,如關聯法、依賴法、時序法、神經網路以及利用統計分析等等,然後利用模型去對問題進行分析得出相應結論,建立在數據倉庫之上的系統都是決策支持系統。而要進行決策,針對一個具體的問題怎樣分析,從什麼角度進行分析,何種因素是主要的、何種因素是次要的,採用何種方法建模以及怎樣建模都要依使用者的經驗而定,這就要求使用者對相關的業務非常熟悉並具備相應的管理和分析能力,否則得出的結論就很可能是無用的。而對我國大部分券商而言,缺少的恰好就是這種經驗,而且券商經營管理中的不規范也為數據倉庫的成功應用增加了難度。 受政策影響較大 人們將市場對經濟的自動調節比喻為「一隻看不見的手」,而股市則是反映經濟情況的晴雨表,經濟學家一直試圖通過對市場的研究找出經濟發展的規律,數據倉庫的主要效用之一也就是通過對已有數據的分析藉以揭示市場內在的發展規律,從而得出市場可能的走向。但縱觀中國證券市場十多年的風風雨雨,國家政策與宏觀調控這只「看得見的手」在其中起了舉足輕重的作用,當然這是由於我國證券市場先天基礎不好,發展不規范使得國家不得不採取措施加以調整,但這也使得證券市場無可避免地打上了國家政策的烙印。這種情況下,單純根據市場規律,用數據倉庫進行分析得到的預測結果與實際情況就會有所偏差。 從「不行」到「行」 如何將數據倉庫的「不行」變為「行」,使其在我國的證券業發展中發揮巨大的作用,是廣大券商普遍關心的一個問題 。那麼在找出「不行」的原因之後我們就可「對症下葯」採取相應的措施了。 數據的集中統一是數據倉庫應用的基礎。首先要統一券商所用信息系統的平台,各營業部均應採用統一的系統平台,同時各業務系統也採用統一的平台,統一數據結構。並採用集中的經營管理模式,使所有的數據都按相同的結構集中存放在一起,方便數據採集,做好數據倉庫應用的基礎工作。 確立合理的數據模型是數據倉庫應用的核心。電腦技術人員知道數據倉庫可以「做什麼」,業務人員則知道具體的分析要「怎麼做」,為此應將技術部門與相關的業務部門進行很好的協調,充分發揮技術人員和業務人員的優勢,根據證券業和本公司的具體情況選用合適的方法建立模型,這些模型經過檢驗正確後就可作為整個數據倉庫的核心,為經營管理提供決策建議。 高效的應用系統是數據倉庫應用的動力。數據模型建好以後,要使其發揮應有的作用就應在其上建立相應的應用系統,包括客戶關系管理系統、市場分析和風險控制系統等等,只有當建立於數據倉庫基礎之上的應用系統在券商的發展中起了很好的作用以後,證券公司的老總們才能充分意識到數據倉庫的重要性,這就是數據倉庫應用發展的動力所在。 良好的外部環境是數據倉庫成功應用的外部保障。令人欣慰的是國家已意識到證券市場健康穩定的重要性,證監會等領導機構對券商和上市公司的要求越來越嚴格,監管力度不斷加強,這一切都促使中國股市朝健康穩定的方向發展。我們有理由相信隨著我國證券市場的逐步規范,股市也必將按市場規律進行發展,數據倉庫就會發揮越來越大的作用。 結束語 數據倉庫的應用在國外取得了很大的成功,但中國與外國在數據倉庫的應用環境方面有很大的區別,所以數據倉庫在中國的應用成功的案例並不多。為了促進這項技術在證券業的成功應用,除了證監會等領導機構對證券市場進行規范為其創造良好的外部環境之外,更重要的是各證券公司注意業務系統平台的集中統一和技術與業務的有機融合,做好數據倉庫應用的准備,勇敢面對加入WTO所帶來的挑戰。
㈨ 為什麼說數據倉庫的開發是一個不斷循環,逐步提升的開發過程
這位朋友: 一、目前,能使用數據倉庫的行業比較多,但是重點的可以歸納一下幾個:電信,電力,銀行,證券,金融,保險,政府,稅務,製造,酒店餐飲,零售,物流,醫療,其他。就目前的現狀而言,電信,銀行,證券,金融,保險,這幾個行業的信息化比較早,所以基本上有自己的DW或者BI了,電力,政府,稅務,製造,酒店餐飲,零售,物流,醫療這些都屬於剛剛起步的行業,或者說ERP等已經有很好的使用和數據積累,但是BIDW還在剛發展中,我個人覺得就市場而言,電力屬於壟斷比較強的,就算要做BIDW也是業內的幾家公司做。政府,稅務這樣的企業,安裝銷售的話來說,水太深,莫不到底。而我覺得比較好開發的市場應該是製造,零售,而餐飲酒店和醫療等,比較分散,數據難集中。 二、資料庫可以分為三個層次,第一是基礎的構架,其次是報表和統計,最後的境界就是分析和挖掘,目前我認為,大部分都是處於報表的展現和數據的統計上,當然也有分析和挖掘的項目,但是這些項目都是一些很簡單的分析挖掘,還沒有達到較高的水準,分析和挖掘其實需要的是懂業務的和懂技術演算法的人來操作,而不是簡單的看看報表就可以完事的。比如我們經常會注意一個指標比同期下降了,但是如果要用數據化的東西來說明為什麼下降了,你可以做到嗎?怎麼樣去找一些對於這些指標的關鍵元素,怎麼樣去找這些指標的關系元素,等等之類的,都還是需要我們好好的琢磨,不是簡簡單單的用幾個維度來表示就可以了,有的時候關鍵元素,甚至和這些指標沒有直接的元素,但是確確實實存在。 三、偉大的建築來自一磚一石的堆砌;豐富的經驗源於一點一滴數據的積累。所以說數據倉庫的開發是一個不斷循環,逐步提升的開發過程。 上述觀點是否滿意,僅供參考。