作者彙整: Wan

資料視覺化 Data Visualization

不論是想要對資料有基礎的認識、簡易比較資料中各變量關係,或是用清楚明確的方式呈現分析結果都會用到視覺化的技術。透過將重點資料轉換成合適的圖表,可以乾淨俐落的呈現你想表達的重點。

相關文章

2019 年臺北市立大學 Python 資料視覺化

課程資源

學生作品

2018 年全國夏季學院資料科學程式設計

課程資源

學生作品集

敘述統計 Descriptive Statistics

敘述統計是一種量化描述觀察樣本的技術,與推論統計不同,敘述統計的目的在於對一個觀察樣本做出總結,而非根據該樣本對抽樣母體作出推論。

常見方法

  • 透過視覺化數據資料可以直觀了解整體資料分布情形。
  • 計算一些數值以進一步分析各變量的相關性:如平均數、中位數、標準差、眾數、全距等。
  • 數據的次數分配呈現常態分布,常用偏度、峰度來表示數據資料與常態分布偏離的情形。

迴歸分析 Regression Analysis

迴歸分析是統計學上用來檢視兩個或多個變量之間相關性的分析方法。透過了解變數之間的相關性,可以進一步建立數學模型以由自變數預測應變數的期望值。

參考文章

Regression in R

假設檢定 Hypothesis Testing

在推論統計中,我們會想在觀察完一筆資料後對其做出一些結論(推論),這些由分析師觀察出來但未經驗證的推論我們稱之為「虛無假設」,而與虛無假設相反的推論我們稱之為「對立假設」。假設檢定就是一種推翻或驗證這些假設的方式。常見的假設檢定有 Student’s t-test、Z-test、

相關資源

探索式資料分析 Exploratory Data Analysis

探索式資料分析(簡稱 EDA),就是運用視覺化、基本的統計等工具,來「看」一下資料,讓我們在進行複雜或嚴謹的分析之前,能夠對資料有更多的認識。

什麼是 EDA

EDA in R