基础统计教学资料41Word文件下载.docx
- 文档编号:3775092
- 上传时间:2023-05-02
- 格式:DOCX
- 页数:12
- 大小:51.54KB
基础统计教学资料41Word文件下载.docx
《基础统计教学资料41Word文件下载.docx》由会员分享,可在线阅读,更多相关《基础统计教学资料41Word文件下载.docx(12页珍藏版)》请在冰点文库上搜索。
10,120
10.2
總計
98120
100.0
資料來源:
【美國統計精粹】,1995年
※好的摘要表須包括:
資料表的主題、資料發生的時間、製表的時間,以
及各項變數的說明(包括單位)。
※比率(百分比)通常比計數更有效傳達訊息。
※注意計算的誤差,如捨入誤差(Roundofferror)。
三、圓形圖(Piechart)及長條圖(Barchart)
(1)適用於展示名目尺度度量之變數的分布。
(2)繪圖的概念:
以面積來表示各分類資料的大小比例。
(3)對圓形圖而言,在同一圓內,以不同的扇形來表示各類資料的計數(比率),此時便以圓心角的大小的區別。
例如:
單身佔19.7﹪,其對應之扇形的圓心角為71度(0.197×
360=71)。
(4)對長條圖而言,因每一長條的寬均相同,故以長條的高來表示各類資料的計數。
(5)由圓形圖及長條圖,能更直接、快速地分辨各類資料的差異。
(6)留意象形圖(Pictogram)的誤導。
四、線圖(Linegraphs)
(1)適用於時間序列資料,時間應標示在橫軸上,而所關注的變數應標示再縱軸上。
線圖可以顯示出變數隨時間所產生的變化。
(2)由線圖可看出:
(a)長期趨勢(Trend):
包括趨勢與循環。
(b)季節變動(Seasonalvariation):
指在固定的時間間隔重複的型態。
(c)不規則波動(Erraticfluctuation):
去除長期趨勢與季節變動後,仍無法解釋的變異。
(3)注意刻度大小
線圖並無所謂正確的刻度,藉由刻度的選擇,相同的圖形很可能會呈現不同的視覺效果,不可輕忽。
五、如何把圖畫好?
(1)不要製造錯誤印象
(2)讓資料醒目
※一個好的圖只畫出能清楚呈現資料意涵的必要部分,絕不多浪費一滴墨水。
六、直方圖(Histogram)
(1)要由圖形來窺視、探究一個數值型變數的分布,最常用的圖形便是直方圖。
以面積來表示各分組資料的次數(比例)。
當代表各組次數之矩形的寬均相同(即等組距)時,即以高代表該組的次數。
(3)繪圖的步驟:
(a)尋找資料中之最大值(
)及最小值(
)
(b)求全距(R)
(c)決定組數(k)及組距(I)
※通常組數可取總次數之平方根的近似值。
(d)決定各組之組下限及組上限
(e)計數每一組中觀測值的次數
(f)繪直方圖
(4)直方圖與長條圖的差異:
(a)直方圖中各長條的底部是有刻度的,故它的寬是有意義的,而長條圖中各長條的寬則無意義。
(b)直方圖中各長條是彼此相鄰接;
而長條圖中各長條間有一定的間隙,以為區別。
七、解釋直方圖
由直方圖,我們要偵測一個變數之分布的一般型態,以及是否有異於一般型態的顯著偏差。
(1)屬區間尺度或比例尺度度量的變數可以直方圖來呈現它的分布。
(2)分布的一般型態
要描述分布的一般型態,首重以下二要素:
(a)找出中心(Center)及離散度(Spread)。
(b)看看有無簡單的形狀吻合資料的分布?
(3)離群值(Outlier)
一組資料之任何圖形的離群值是指落在圖形一般型態之外的觀測值。
※要找出直方圖的一般型態,應把離群值先撇開不看。
(4)對稱分布(Symmetricdistribution)
若分布的圖形之左半部與右半部互為鏡中影像時,則稱該分布為對稱分布。
※若資料之直方圖的左半部與右半部大致上互為鏡中影像時,則我們會認定母體的分布是對稱的。
(5)偏斜分布(Skeweddistribution)
(a)若分布的圖形右邊延伸出去的部分比左邊遠得多,則稱該分布為右偏(Skewtotheright)。
(b)若分布的圖形左邊延伸出去的部分比右邊遠得多,則稱該分布為左偏(Skewtotheleft)。
※判斷母體的分布的偏向,仍是由直方圖來看。
八、莖葉圖(Stem-and-leafplot)
(1)屬區間尺度或比例尺度度量的變數可以莖葉圖來呈現它的分布。
(2)繪製的步驟:
(a)通常以觀測值去除個位數後的數為莖。
(b)以觀測值的個位數為葉,依序寫在莖的右側。
(c)將對應在同一莖後的葉子,由小而大排列。
(3)莖葉圖可視為直方圖的變形,故保有直方圖的特點;
同時,莖葉圖還保有原來觀測值的優點。
九、集中量數
(1)集中量數的功用乃在描述一組資料之分布的中心位置,常見的集中量數有:
平均數(Mean)、中位數(Median)及眾數(Mode)。
(2)平均數
(a)一組觀測值的平均數即為此組資料的算數平均數(Arithmeticaverage)。
(b)設一組資料的有n個觀測值,分別為
,則此組資料的平均數為
。
(c)例子:
求45,62,57,52,48,65,55,60之平均數?
解:
(3)中位數
(a)一組資料的中位數即將此組資料的所有觀測值由小而大排列,其排在最中間者。
,將其由小而大排列,得
,則此組資料的中位數為
求45,62,57,52,48,65,55,60之中位數?
(i)資料由小而大排列得:
45<
48<
52<
55<
57<
60<
62<
65。
(ii)因為n(=8)是偶數,故中位數為
(4)眾數
(a)眾數即一組資料中,岀現最頻繁的觀測值。
(b)例子:
求1,3,3,5,1,2,2,3,4,5,3,1,4,2,2之眾數?
此組資料之次數分布為
觀測值
1
2
3
4
5
合計
次數
15
故眾數Mo=2及3。
※眾數可能不唯一。
(5)對區間尺度及比例尺度度量的資料而言,平均數、中位數及眾數均有意義;
對順序尺度度量的資料,中位數及眾數均有意義;
但對名目尺度度量的資料而言,只有眾數有其意義。
(6)平均數與中位數之比較
(a)平均數與中位數都是描述一組資料之中心位置的合理概念。
(b)當資料的分布為對稱時,平均數與中位數是相等的;
當資料的分布為左偏時,平均數在中位數的左側;
又當資料的分布為右偏時,平均數在中位數的右側。
(c)平均數並不穩健(Robust),容易受到少數幾個極端值的影響,而產生驟變。
實例:
(i)一組資料之觀測值為1,2,3,4,5,則此組資料的平均數與中位數均為3。
(ii)若這組資料再加入另一觀測值6000時,則新資料之平均數為1002.5,而中位數為3.5。
十、離散度
(1)離散度乃在描述一組資料之分散程度,可分為:
離中程度及相對分散程度。
(2)全距(Range)
(a)全距即資料分布的範圍,也就是觀測值中之最大值減最小值。
,則此組資料的全距為
資料45,62,57,52,48,65,55,60之全距為
(d)全距是一種相對分散程度,其值愈大,相對愈分散。
(3)四分位數(Quartile)及四分位距
(a)將資料之觀測值由小而大排列,其排列在四分之一之位置上的值稱為第一四分位數,記為
;
而排列在四分之三之位置上的值稱為第三四分位數,記為
※第一四分位數
乃為中位數左側資料的中位數;
而第三四分位數
則為中位數右側資料的中位數。
(b)四分位距為
(c)例一:
資料16,17,22,24,26,26,26,26,26,26,27,27,28,28,29,29,29,29,30,31,31,36之中位數M=27,第一四分位數
=26,而第三四分位數
=29。
(d)例二:
資料16,17,22,24,26,26,26,26,26,26,27,27,28,28,29,29,29,29,30,31,31,36,36,38,39之中位數M=28,第一四分位數
=30.5。
(e)四分位距是一種相對分散程度,其值愈大,相對愈分散。
(f)盒形圖(Boxplot)
將一組資料的最小值、第一四分位數、中位數、第三四分位數及最大值依序繪出,而中間三數以一盒子表示之圖形稱為盒形圖。
情況如下:
M
※由盒形圖可以判斷資料分布的對稱性。
※
M,
及
合稱五數綜合。
(4)變異數(Variance)及標準差(Standarddeviation)
(a)變異數及標準差是資料分布的一種離中程度的表現,而其中心位置是認定為平均數。
,其平均數為
,則第i個觀測值的離差為
(c)設一組資料的有n個觀測值,分別為
,則此組資料之變異數為
,
而此組資料之標準差為該變異數之正平方根,即s。
(d)變異數及標準差的性質
(i)變異數及標準差是以平均數
為中心的一種離散度度量。
(ii)變異數及標準差之值恆大於或等於0,唯有所有觀測值均相同時,其值方為0。
(iii)變異數及標準差並不穩健,容易受到少數幾個極端值的影響,而產生驟變。
(5)當分布為對稱時,適合以平均數及標準差來描述分布的集中位置與分散程度;
反之,當分布為偏斜時,不宜以平均數及標準差來描述分布的集中位置與分散程度,而應以五數綜合來描述。
十一、常態分布(Normaldistribution)
(1)探究變數之分布的步驟:
(a)先繪直方圖(或莖葉圖)。
(b)尋找整體型態(形狀、中心位置及離散度),以及離群值。
(c)選擇以五數綜合或者以平均數與標準差,來描述中心位置及離散度。
(d)當觀測值夠多時,看看可否以一平滑曲線來描數該變數分布的整體型態。
而該描述分布整體形狀的曲線稱為密度曲線(Densitycurve)。
(2)密度曲線與平均數、中位數、眾數的關係
(a)分布之眾數是密度曲線的「尖峰點」。
(b)分布之中位數是密度曲線與橫軸所夾區域的「等面積點」。
(c)分布之平均數是密度曲線與橫軸所夾區域所形成之均勻實體的「平衡點」。
(3)常態分布
(a)首先由高斯(CarlFriedichGauss)提出,故又稱為高斯分布(Gaussiandistribution)。
(b)常態分布之密度曲線呈對稱的鐘形,由平均數及標準差唯一確定之,其中平均數決定中心位置,而標準差決定曲線的形狀(指高狹或低闊)。
(c)常態分布之密度曲線是對稱於平均數的。
同時,平均數、中位數及眾數是三合一的。
(d)因為常以常態分布來描述量度的誤差之分布,故又稱為「誤差曲線」(Errorcurve)。
(e)68-95-99.7經驗法則
在任何常態分布中,都會有以下狀況:
(i)大約有68﹪的觀測值會落在距平均數一個標準差的範圍內。
(ii)大約有95﹪的觀測值會落在距平均數兩個標準差的範圍內。
(iii)大約有99.7﹪的觀測值會落在距平均數三個標準差的範圍內。
(4)標準計分(Standardscore)
(a)以平均數為零點,將觀測值以標準差為單位表示出來,而得到的數值稱為「標準計分」。
任何觀測值的標準計分為
標準計分=(觀測值-平均數)÷
標準差
※標準計分可以用來比較不同分布中之觀測值的大小。
※通常把將觀測值減平均數,再除以標準差的動作稱為「標準化」。
(b)實例:
某次考試成績狀況如下:
數學
英文
平均數
45
54
標準差
8
10
某甲數學考57分,英文考68分,試問某甲那一科考得較佳?
(i)數學的標準分數=(57-45)÷
8=1.5
(ii)英文的標準分數=(68-54)÷
10=1.4<1.5
故數學考得較佳。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基础 统计 教学 资料 41