日誌標籤'數據倉庫'
2010年11月22日
因為近期工作的變更,一直在忙一些雜七雜八的東西,工作交接、離職手續及對新工作的思路整理,目前還處在這個階段,所以可能近期沒有比較新的內容跟大家分享,最近的幾篇文章會以一些總結的內容為主,主要是對之前的工作中的一些感想。 但相信之後會有更加豐富的數據分析相關的內容向大家呈上,因為我相信我要去的新公司是一個朝氣蓬勃、充滿創意和挑戰的地方,而最重要的是他們對數據的重視和理解。 看到文章標題,相信大家已經知...... »閱讀更多: BI應用中的三大矛盾 2010年11月16日
又是一篇關於商務智能(BI)方面的文章,前面有幾篇文章介紹了數據倉庫、多維模型和OLAP方面的知識。 這篇文章主要總結了OLAP具備的一些基本特徵,以及其在數據的處理、展示和分析中體現的優勢。 其實我們大部分時間是在模仿,參考書本或者他人的範例,而當我們去實現這些東西的時候,我們又會有自己的體驗,我們需要將這些體驗記錄下來,當我們能夠自己去總結整個實現過程的時候,其實可以認為我們已經掌握了這個知識或技能。 而正是...... »閱讀更多: OLAP的基本特徵 2010年10月27日
博客之前的兩篇文章:數據倉庫的多維模型和數據立方體與OLAP中分別對多維模型和OLAP的一些基本概念進行了介紹,這篇文章是基於那兩篇文章的深入擴展,主要介紹的是多維OLAP中兩個重要構成元素——維和立方的結構和組成。 可能內容會偏向於模型構建方面,對那方面不太感興趣的同學可以直接跳過。 ;-) 維(Dimension) 維是用於從不同角度描述事物特徵的,一般維都會有多層(Level),每個Level都會包含一些共有的或特...... »閱讀更多:維(Dimension)和立方(Cube) 2010年8月29日
前面的一篇文章——數據倉庫的多維數據模型中已經簡單介紹過多維模型的定義和結構,以及事實表(Fact Table)和維表(Dimension Table)的概念。 多維數據模型作為一種新的邏輯模型賦予了數據新的組織和存儲形式,而真正體現其在分析上的優勢還需要基於模型的有效的操作和處理,也就是OLAP(On-line Analytical Processing,聯機分析處理)。 數據立方體關於數據立方體(Data Cube),這裡必須注意的是數據立方體只是多維模型的一...... »閱讀更多:數據立方體與OLAP 2010年8月17日
可能很多人理解的數據倉庫就是基於多維數據模型構建,用於OLAP的數據平台,通過上一篇文章——數據倉庫的基本架構,我們已經看到數據倉庫的應用可能遠不止這些。 但不得不承認多維數據模型是數據倉庫的一大特點,也是數據倉庫應用和實現的一個重要的方面,通過在數據的組織和存儲上的優化,使其更適用於分析型的數據查詢和獲取。 多維數據模型的定義和作用多維數據模型是為了滿足用戶從多角度多層次進行數據查詢和...... »閱讀更多:數據倉庫的多維數據模型 2010年8月1日
數據倉庫的目的是構建面向分析的集成化數據環境,為企業提供決策支持(Decision Support)。 其實數據倉庫本身並不“生產”任何數據,同時自身也不需要“消費”任何的數據,數據來源於外部,並且開放給外部應用,這也是為什麼叫“倉庫”,而不叫“工廠”的原因。 因此數據倉庫的基本架構主要包含的是數據流入流出的過程,可以分為三層——源數據、數據倉庫、數據應用: 從圖中可以看出數據倉庫的數據來源於不同的源數據,並提供多樣的數...... »閱讀更多:數據倉庫的基本架構 2010年7月20日
數據倉庫中集成了企業幾乎所有的可以獲取到的數據以用於數據分析和決策支持,當然也包括了我在網站分析的數據來源一文中所提到的所有數據。 這些進入到數據倉庫中的數據無外乎三種類型:結構化數據、半結構化數據和非結構化數據,它們經過轉化後以某種形式統一地儲存在數據倉庫中,即通常說的ETL (Extract, Transform, Load,抽取、轉換、裝載)的過程。 下面主要說一下這三種數據類型的區別,它們分別包括哪些源數據以及這...... »閱讀更多:數據倉庫的源數據類型 2010年2月25日
相信大家都了解數據倉庫的4個基本特徵:面向主題的、集成的、相對穩定的、記錄歷史的,而數據倉庫的價值正是基於這4個特徵體現的: 1、高效的數據組織形式面向主題的特性決定了數據倉庫擁有業務數據庫所無法擁有的高效的數據組織形式,更加完整的數據體系,清晰的數據分類和分層機制。 因為所有數據在進入數據倉庫之前都經過清洗和過濾,使原始數據不再雜亂無章,基於優化查詢的組織形式,有效提高數據獲取、統計和分析的效率...... »閱讀更多:數據倉庫的價值