搜尋結果
常態機率圖 (normal probability plot) 是常用的資料視覺化工具, 運用 Q-Q plot 的方法, 以檢測一筆數據是否符合常態分配。 對應《提綱挈領學統計》, 9 版, 第 11 章, 頁 493-494。 ...more. 常態機率圖 (normal probability plot) 是常用的資料視覺化工具, 運用 Q-Q plot 的方法,...
- 29 分鐘
- 14.3K
- 張翔老師
- Q-Q Plot 教學
- Q-Q Plot 不是直線怎麼辦?判讀不同分配特性
- 常態分佈統計檢定
- 結語
Q-Q Plot全名是 Quantile-Quantile Plot,是一種視覺化比較兩項數據的分佈是否相同的方法。最常見、也是本文要教學的用法,是將某數據與理論上的完美常態分佈比較,從有無差異看出該數據是否為常態分配。判讀方法可用一句話概括: 問題在於:「為什麼」看到直線就是常態分佈?好豪認為,讀懂 Q-Q Plot 的關鍵就在於理解 Quantile: 1. 理解 Quantile 能讓你了解為什麼 Q-Q Plot 用直線判讀常態分佈 2. 理解 Quantile 能讓你學會 Q-Q Plot 製圖 3. 理解 Quantile 更讓你在 Q-Q Plot 呈現非直線的時候,也能看出資料分佈究竟是什麼 以上三點,就在接下來的文章一一說明。
Q-Q Plot 不是只有判斷「是否為直線」或者「是否為常態分配」,即使畫出來的不是直線,還是能看出資料分配的特性,例如,下圖中可以看到 Q-Q Plot 在左偏與右偏分配會呈現的樣子: 但是,如果只給我們圖示下半部的 Q-Q Plot,要馬上看出究竟是什麼分配,好像不太直覺?筆者好豪在此與你分享快速用 Q-Q Plot 判讀分配的小技巧:
講了半天的 Q-Q Plot,它終究是個視覺化的方法,若是讀者覺得用看的不夠可靠,要檢驗常態分配還可以做統計檢定,常用的方法包括: 1. Shapiro-Wilk test 2. Kolmogorov-Smirnov test 3. Anderson-Darling test 這些統計檢定詳細的使用方法與 R 程式碼,可以參考 吳漢銘老師的教學投影片。
學會 Q-Q Plot 後,比起單純用直方圖判斷鐘型曲線,我們有更強的視覺化方法可以看出數據是否為常態分配。如果覺得視覺判斷不夠客觀,我們還能用統計檢定來檢驗常態性。 檢驗是否為常態分佈後,重點在於:如果不是常態分佈對資料分析會有什麼影響?資料不是常態分佈該怎麼辦?筆者未來會在另一篇文章繼續探討。 參考資料: 1. R 語言教材:R 錦囊妙計 2. 好豪的 GitHub:R 語言 Q-Q Plot 教學 3. Youtube: StatQuest 4. YouTube: 張翔老師 如果你正在研讀統計學,推薦你繼續閱讀好豪的統計學知識分享: 1. 四個步驟徹底學習標準誤:它跟標準差到底有什麼不同? 2. 二項式檢定與 P-value 解讀:《天堂 M》手遊機率爭議案例學習 3. 圖解信賴區間,...
#研究所 #統計學 #分位數 #常態機率在統計學中,QQ圖(Q代表分位數Quantile)是一種通過比較兩個概率分布的分位數對這兩個概率分布進行比較的概率 ...
- 33 分鐘
- 4.1K
- 高點線上影音學習
其他人也問了
什麼是常態機率圖?
什麼是機率?
什麼是常態分佈?
什麼是動態定價機制?
什麼是機率的公理化定義?
古典的機率理論是什麼?
常態機率圖,又稱為常態Q-Q圖,可粗略檢視資料是否服從常態分配。 在常態機率圖中,橫軸為理論分位數,縱軸為樣本分位數,若資料點大致落在虛擬的常態直線附近,則可認為該資料分配近似於常態分配。
2020年1月25日 · 通常用來看常態性的工具,可以用直方圖看峰度(Kurtosis)和偏度(skewness),也可以搭配常態機率圖。 基本上SalePrice 有高峰和positive skew,這時候 ...
- Ben Hu
機率與統計(96 下) 單元 27: 常態機率分布 單元 27: 常態機率分布 (課本 x 4.5) 最被廣泛使用的連續機率分布為常態分布, 其 pdf 呈現鐘 型, 正式定義如下. 定義1. Y N ( ; ) ; 1 < < 1 ; > 0 若且 為若機率密度函數 pdf f ( y ) = 1 p 2 e ( y ) 2 2 2; 1 < y < 1 Y
2023年2月27日 · 機率和統計知識是資料科學和機器學習的核心;我們需要統計和機率知識來有效地收集、審查、分析數據。 現實世界中有幾個現象例項被認為是統計性質的(即天氣數據、銷售數據、財務數據等)。 這意味著在某些情況下,我們已經能夠開發出方法來幫助我們透過可以描述數據特徵的數學函式來模擬自然。 “機率分佈是一個數學函式,它給出了實驗中不同可能結果的發生機率。 瞭解數據的分佈有助於更好地模擬我們周圍的世界。...