開心樂園

當前位置 /首頁/娛樂八卦/開心樂園/列表

資料視覺化實訓總結

資料視覺化實訓總結。現在科技越來越發達,迎來了資料時代化。資料本身就是可以直觀的去分析,資料視覺化可以直接看出資訊的豐富。接下來一起看看資料視覺化實訓總結吧,希望對大家有所幫助。

資料視覺化實訓總結1

資料視覺化是指將資料間的關係利用圖表直觀地展示出來。通過資料視覺化將大量的資料集構成資料影象,同時將資料的各個屬性值以多維資料的形式表示,可從不同的維度觀察資料,從而對資料進行更深入的觀察和分析。

一、資料分析視覺化常用的圖表型別有如下幾種:

1、表格

2、散點圖

3、折線圖

4、柱狀圖

5、條形圖

二、視覺化分析

2、1想分析購買數量前10名的使用者是否是回頭客還是客單量大?

資料視覺化實訓總結

對該項分析使用 表格 分析,按購買數量排名前10的使用者根據購買日期的次數分析:都是一次性購買,並非回頭客使用者,企業應該想辦法維護這些大客戶群。

2、2 根據2.1分析結果繼而想到那些回頭客購買力度怎麼樣呢?從而再次對後買日期統計,分析購買次數多的使用者:得出本次共分析29944個使用者,回頭客只有25個,佔比0.083%;其中只有1名使用者是購買4次的, 其餘24名使用者只購買2次。商家需要拉些回頭客,考慮是否質量過關,是否活動力度不夠?

使用一個餅狀圖更直接看出回頭客比重之小

2.3 根據商品種類cat_id統計出銷量前10名的商品種類,使用條形圖做了視覺化分析:

2.4 對2013年和2014年總銷量分別按照月度和按照季度做 折線圖 視覺化分析,很明瞭看出銷售變化趨勢如下;11月度銷量最高,第四季度銷量最高。

2.5 分析表2資料,想知道哪個年齡段的兒童服裝銷量比較高?如下分別用 柱形圖 和 散點圖 進行視覺化圖表分析(感覺點狀圖效果稍好一些),可以看出相同年齡段的男女生銷量走勢是一致的,且隨著年齡增長銷量呈下降趨勢。

若以3歲為一個階段,0-3歲為嬰兒期間的銷量最高,淘寶和天貓市場需求量大。

三、作為資料分析職責的思想總結

在此總結下兩篇初步學習資料分析的心得:資料分析首先要掌握常用的資料分析方法,資料分析工具,然後再根據自己公司的產品調整,靈活組合。接下來我要系統學習資料分析知識。資料分析師是一個實踐的職位,要在實際專案中不斷的訓練,才能成為高手。

作為資料分析師我認為的主要職責是要將業務資料清晰、準確、明瞭的呈現給資料使用者和決策者,比如預測使用者的流失,對使用者進行自動分類等。你能提供的價值大了。決策者和管理者能夠根據呈現的資料結果及時合理調整業務活動,以使企業得到利潤最大化。

資料視覺化實訓總結2

  一、資料視覺化的定義

資料視覺化(Data Visualization)是涉及資訊科技、自然科學、統計分析、圖形學、互動、地理資訊等多種學科交叉領域,通過將非數字的資訊進行視覺化以表現抽象或複雜的概念和資訊的技術。簡單的說,這種技術將資料以圖表的方式呈現,用以傳遞資訊。人類有五官,能通過5種渠道感受這個物質世界,那麼為什麼單單要青睞視覺化的方式來傳遞資訊呢?這是因為人類利用視覺獲取的資訊量巨大,人眼結合大腦構成了一臺高頻寬巨量視覺訊號輸入的並行處理器,具有超強模式識別能力,有超過50%功能用於視覺感知相關處理的大腦,大量視覺資訊在潛意識階段就被處理完成,人類對影象的處理速度比文字快6萬倍,所以資料視覺化是一種高頻寬的資訊交流方式。

如果我們的視野再開闊些,資料視覺化從廣義上來說包含了三個分支:科學視覺化(Scientific Visualization),資訊視覺化(Information Visualization)和可視分析學(Visual Analytics)。科學視覺化是跨學科研究與應用領域,關注三維現象的視覺化,在建築學、氣象學、醫學或生物學方面的各種系統中有廣泛的應用,這個領域研究的資料具有天然幾何結構(如磁感線、流體分佈等)。

scientific_data_viz.png

資訊視覺化則研究抽象資料的互動式視覺表示以加強人類認知。抽象資料包括數字和非數字資料,如地理資訊與文字,這個領域研究的資料具有抽象的結構,比如柱狀圖,趨勢圖,流程圖和樹狀圖,這些圖表將抽象的概念轉化成為視覺化資訊,常常以資料面板的形式體現。

info_data_viz.png

可視分析學結合了互動式視覺表示以及基礎分析過程(統計過程、資料探勘技術),執行高級別、複雜的活動(推理、決策)。

viz_analysis.png

  二、在資料科學全過程中的位置

資料科學的主要組成部分包含三個大的階段:資料整理,探索性資料分析和資料視覺化。站在一個更高的位置來看,資料視覺化在資料科學中的位置是比較靠後的,是屬於最後的成果展示階段。如果要從頭說起的話,首先,在資料整理階段,我們的主要任務是資料的獲取和解析,包括一系列對原始資料的`清洗和加工工作,這一塊的知識領域主要涉及電腦科學。緊接著是探索性資料分析階段,這個階段要大量使用統計和資料探勘方面的專業知識,也需要繪製圖表來解釋資料和探索資料,這個階段的主要任務是過濾和挖掘。但這個階段的視覺化分析只是你和資料之間的“對話”,是資料想要告訴你什麼,而資料視覺化則是資料和你的讀者之間的對話,是你通過資料想要告訴讀者什麼,這是它們之間最大的區別。完成了上面兩個階段的內容,才到了我們最後的資料視覺化階段,這是一個多學科交叉的領域,涉及到圖形設計,資訊視覺化和人機互動,我們的主要任務是對資訊進行精煉,然後通過視覺化表示出來,並與讀者產生互動。然而,如果將資料科學的這三個階段理解為按嚴格順序進行的“線性”的模型那就大錯特錯了,它經歷的是一個迭代的,非線性的過程。後面的步驟會讓你更瞭解之前所做的工作,可能到了資料視覺化階段,才意識到還有太多疑點要弄明白,我們需要回到上一步重新進行之前的工作,就像畫家翻來覆去才能最終完成一幅傑作一樣,資料視覺化的過程並不是給資料分析這個剛出爐的蛋糕加點糖霜,,而是有一個反覆迭代,不斷優化的過程。

  三、資料視覺化的技術棧

資料視覺化是一個再典型不過的多學科交叉領域了,可以說資料視覺化所需要用到的知識,就是資料科學龐大知識體系的一個剪影。你會感受到資料科學理性的一面,同樣也會感受到她感性的一面。你可以窮盡自己的一生,在這個浩如煙海的領域中盡情的探索,常學常新,其樂無窮。

  四、資料視覺化過程

資料視覺化的本質,是充分理解業務的基礎上對資料進行深入分析和挖掘,然後將探索資料所得到的資訊和知識以視覺化的形式展現出來。也就是說我們做的工作其實就是從資料空間對映到圖形空間。我們要做的第一步工作是充分的結合業務理解資料,然後採用某些方法選擇合適的圖表型別,這又要求我們先對圖表型別有個比較全面的瞭解。繪製完圖表是不是就完成了呢?其實不是。我們還要對圖表進行優化,優化所針對的物件是各種圖表元素,對此我們有一系列的設計技巧,下面將一步一步的來介紹這些知識。

4.1 結合業務理解資料

離開對業務的理解談資料分析都是耍流氓。這裡介紹一種快速瞭解資料與業務以開展進一步的探索與分析的方法,叫“5W2H法”。步驟一:WHAT,這是關於什麼業務的什麼事?資料所描述的業務主題是什麼?步驟2:HOW,即如何採集的資料?採集規則會影響後續分析,比如如果是後端資料埋點,那麼資料一般是實時的;而如果是前端資料埋點,那麼就要進一步弄清楚資料在什麼網路狀態會上傳?無網路狀態下是如何處理的?這些都會影響最後資料的質量進而影響分析質量。步驟三:WHY,為什麼蒐集此資料?我們想從資料中瞭解什麼?資料分析的目標是什麼?步驟四:WHEN,是何時段內的業務資料?步驟五:WHERE,是何地域範圍內的業務資料?步驟六:WHO,誰蒐集了資料(Who)?在企業內可能更關注是來自哪個業務系統。步驟七:HOW MUCH,各種資料有多大的量,足夠支援分析嗎?資料充足和不足的情況下,分析方法是有所不同的。如果七個問題中有一個答覆不能令人滿意,則表示這方面有改進餘地。

4.2 選擇圖表型別

用簡單的三個步驟就可以選擇合適的圖表型別:一看資料型別,二看資料維度,三看要表達的內容。

我們有兩種資料型別,每種資料型別又有兩個子類別。首先,我們有分類資料定量資料。分類資料用來表示類別,比如蘋果,香蕉,梨子和葡萄,就是水果的4種類別,稱為分類定類;有的分類變數是有一定順序的,比如可以把紅酒的品質分為低,中,高三檔,人的身材有偏瘦,正常和肥胖等等,這種特殊的分類變數稱為分類定序。定量資料也可以進一步分為兩類,一類叫連續值資料,比如人的年齡;一類叫離散值資料,比如貓咪的數量。

TAG標籤:實訓 視覺化 #