首頁/ 娛樂/ 正文

在所有人中,你和平均水平“平均”差多少呢?——標準差和期望

這是《機器學習中的數學基礎》系列的第20篇,也是機率與統計的第4篇。

一說起期望值,可能有的人會很陌生;但一說起平均數,可能大部分人都瞭解。其實求期望和求平均之間還是有那麼一些關係的。

期望

我們先來舉個例子,讓你對期望有直觀的理解。

假設我有1個不均勻的六面體,每個面標了一個數字,分別是1、2、3、4、5、6。如果我將此六面體向上丟擲,那麼落地時向上一面的機率如下表所示:

在所有人中,你和平均水平“平均”差多少呢?——標準差和期望

顯然,上述的機率之和為1。那麼此六面體向上一面的期望是什麼呢?

我們是這樣計算期望的:把每個面出現的機率乘以每個面的數字,然後算它們的加和。即:

1·1/6+2·1/3+3·1/6+4·1/12+5·1/12+6·1/6=37/12

因此,上面這個六面體落地時正面朝上的期望就是37/12,換算成整數約等於3。

不均勻的算出來了,那如果是均勻的六面體呢?它落地時向上的一面的期望又是什麼呢?

很簡單,由於是均勻的六面體,那麼每個面朝上的機率都是1/6。因此,總的期望就是1/6(1+2+3+4+5+6)=21/6=3。5。此時,就相當於我們求了1-6的平均數。

換句話說,如果每個數字出現的機率是相等的,那我們就相當於求的平均數;如果每個數字出現的機率是不等的,那我們就在求期望。我們一般用“E”來表示期望。

方差

我們還是來舉例說明什麼是方差。

假設小明期末考試考了6門課,他的成績分別是60,78,77,90,92,83。那麼小明成績的方差該怎麼算呢?

我們需要先算出小明的平均成績:(60+78+77+90+92+83)/6=80。

然後,分別用小明每一門課的成績減去平均成績,求出差的平方,再算出這些平方的平均值。即

[(60-80)^2+(78-80)^2+(77-80)^2+(90-80)^2+(92-80)^2+(83-80)^2]/6=111。

我們把這個結果就叫做方差。把它一般化, 假設有x1、x2。。。xn一共n個數據,它們的均值是μ,那麼方差就可以表示為:

在所有人中,你和平均水平“平均”差多少呢?——標準差和期望

有時候分母的n也會換成n-1,取決於它是樣本資料還是整體資料,不過對我們的結果影響不大。

那麼方差有什麼意義呢?它所表示的是資料的波動程度,更具體的說,它表示的是資料與均值之間的離散程度。方差越大,表明資料越分散,離均值的平均距離遠;方差越小,表明資料大多集中在均值周圍。

標準差

標準差就是方差開方得到的結果,即

在所有人中,你和平均水平“平均”差多少呢?——標準差和期望

那這麼做有什麼意義呢?注意到,我們的方差是求了平方的,如果我們的資料是有單位的話,最後的結果將是單位的平方,對這個結果不是很好解釋。比如上面小明成績的方差是111,單位是“分”的平方。我們就會感到很奇怪。

將方差開方後,單位就變成了原來的單位,那麼結果就很好解釋了。可以得出,小明成績的標準差約為10。5分。也就是說,小明的成績平均與均值相差10。5分。

標準差同樣衡量資料的波動狀況,只不過它的結果很好解釋。

好了,這就是今天的全部內容,歡迎留言討論。

在所有人中,你和平均水平“平均”差多少呢?——標準差和期望

相關文章

頂部