統計學(xué) 各種應用條件、校正條件
應用檢驗方法必須符合其適用條件,不同設計的數據應選用不同檢驗方法。 一、第五章 參數估計 P74 總體均數的置信區間 1.正態(tài)近似法:
總體標準差σ已知,或σ未知但n>50時(shí) 2. t分布法
總體標準差σ未知,且n≤50時(shí)
二、第六章 計量資料兩組均數t檢驗P93、P99 (一)t 檢驗的應用條件
適用于計量資料(單樣本、兩配對樣本、兩獨立樣本),并要求: 1. 樣本來(lái)自正態(tài)分布的總體。W檢驗(n≤50時(shí)),H0:樣本來(lái)自正態(tài)總體,P>0.05時(shí)尚不能認為兩組資料的分布非正態(tài);
2. 兩獨立樣本均數比較時(shí),兩總體方差齊性。Levene檢驗,H0:方差相等。P>0.05時(shí)尚不能認為兩組資料方差不齊。
(二)方差不齊或非正態(tài)時(shí),兩計量資料均數的比較方法 方法1. 僅方差不齊時(shí),可采用近似t檢驗,即 t′檢驗。 方法2. 變量變換:對數變換、平方根變換、倒數變換等
方法3. 非參數檢驗:Wilcoxon符號秩檢驗(兩相關(guān)樣本P142);Wilcoxon秩和檢驗、Mann-Whiney-U檢驗(兩獨立樣本 P145)等
三、第七章 計量資料多組均數的比較-方差分析 (一)方差分析流程 P109
1、多個(gè)樣本均數比較。若P2、作多重比較:LSD-t檢驗、Dunnett-t檢驗(多個(gè)實(shí)驗組與一個(gè)對照組比較)、SNK-q檢驗(多個(gè)均數間全面比較)
(二)方差分析的應用條件 P114
1、各樣本相互獨立,服從正態(tài)分布;W檢驗 2、各樣本方差齊性。Levene檢驗
四、分類(lèi)資料(計數資料)的比較-
原發(fā)布者:婷婷_709
醫學(xué)統計學(xué)各種資料比較選擇方法小結來(lái)源:桑苗的日志一、兩組或多組計量資料的比較1.兩組資料:1)大樣本資料或服從正態(tài)分布的小樣本資料(1)若方差齊性,則作成組t檢驗(2)若方差不齊,則作t'檢驗或用成組的Wilcoxon秩和檢驗2)小樣本偏態(tài)分布資料,則用成組的Wilcoxon秩和檢驗2.多組資料:1)若大樣本資料或服從正態(tài)分布,并且方差齊性,則作完全隨機的方差分析。如果方差分析的統計檢驗為有統計學(xué)意義,則進(jìn)一步作統計分析:選擇合適的方法(如:LSD檢驗,Bonferroni檢驗等)進(jìn)行兩兩比較。2)如果小樣本的偏態(tài)分布資料或方差不齊,則作KruskalWallis的統計檢驗。如果KruskalWallis的統計檢驗為有統計學(xué)意義,則進(jìn)一步作統計分析:選擇合適的方法(如:用成組的Wilcoxon秩和檢驗,但用Bonferroni方法校正P值等)進(jìn)行兩兩比較。二、分類(lèi)資料的統計分析1.單樣本資料與總體比較1)二分類(lèi)資料:(1)小樣本時(shí):用二項分布進(jìn)行確切概率法檢驗;(2)大樣本時(shí):用U檢驗。2)多分類(lèi)資料:用Pearsonc2檢驗(又稱(chēng)擬合優(yōu)度檢驗)。2.四格表資料1)n>40并且所以理論數大于5,則用Pearsonc22)n>40并且所以理論數大于1并且至少存在一個(gè)理論數<5,則用校正c2或用Fisher's確切概率法檢驗3)n£40或存在理論數<1,則用Fisher's檢驗3.2*C表資料的統計分析1)列變量為效應指標,并且為有序多分類(lèi)變量,行變量為分組變量,則行評分的CMHc2或成組的Wilcoxon秩和檢驗2)列變量為效應指標并且為二分類(lèi),列變
一、描述性統計
描述性統計是一類(lèi)統計方法的匯總,揭示了數據分布特性。它主要包括數據的頻數分析、數據的集中趨勢分析、數據離散程度分析、數據的分布以及一些基本的統計圖形。
1、缺失值填充:常用方法有剔除法、均值法、決策樹(shù)法。
2、正態(tài)性檢驗:很多統計方法都要求數值服從或近似服從正態(tài)分布,所以在做數據分析之前需要進(jìn)行正態(tài)性檢驗。常用方法:非參數檢驗的K-量檢驗、P-P圖、Q-Q圖、W檢驗、動(dòng)差法。
二、回歸分析
回歸分析是應用極其廣泛的數據分析方法之一。它基于觀(guān)測數據建立變量間適當的依賴(lài)關(guān)系,以分析數據內在規律。
1. 一元線(xiàn)性分析
只有一個(gè)自變量X與因變量Y有關(guān),X與Y都必須是連續型變量,因變量Y或其殘差必須服從正態(tài)分布。
2. 多元線(xiàn)性回歸分析
使用條件:分析多個(gè)自變量X與因變量Y的關(guān)系,X與Y都必須是連續型變量,因變量Y或其殘差必須服從正態(tài)分布。
3.Logistic回歸分析
線(xiàn)性回歸模型要求因變量是連續的正態(tài)分布變量,且自變量和因變量呈線(xiàn)性關(guān)系,而Logistic回歸模型對因變量的分布沒(méi)有要求,一般用于因變量是離散時(shí)的情況。
4. 其他回歸方法:非線(xiàn)性回歸、有序回歸、Probit回歸、加權回歸等。
三、方差分析
使用條件:各樣本須是相互獨立的隨機樣本;各樣本來(lái)自正態(tài)分布總體;各總體方差相等。
1. 單因素方差分析:一項試驗只有一個(gè)影響因素,或者存在多個(gè)影響因素時(shí),只分析一個(gè)因素與響應變量的關(guān)系。
2. 多因素有交互方差分析:一頊實(shí)驗有多個(gè)影響因素,分析多個(gè)影響因素與響應變量的關(guān)系,同時(shí)考慮多個(gè)影響因素之間的關(guān)系
3. 多因素無(wú)交互方差分析:分析多個(gè)影響因素與響應變量的關(guān)系,但是影響因素之間沒(méi)有影響關(guān)系或忽略影響關(guān)系
4. 協(xié)方差分祈:傳統的方差分析存在明顯的弊端,無(wú)法控制分析中存在的某些隨機因素,降低了分析結果的準確度。協(xié)方差分析主要是在排除了協(xié)變量的影響后再對修正后的主效應進(jìn)行方差分析,是將線(xiàn)性回歸與方差分析結合起來(lái)的一種分析方法。
四、假設檢驗
1. 參數檢驗
參數檢驗是在已知總體分布的條件下(一股要求總體服從正態(tài)分布)對一些主要的參數(如均值、百分數、方差、相關(guān)系數等)進(jìn)行的檢驗 。
2. 非參數檢驗
非參數檢驗則不考慮總體分布是否已知,常常也不是針對總體參數,而是針對總體的某些一般性假設(如總體分布的位罝是否相同,總體分布是否正態(tài))進(jìn)行檢驗。
適用情況:順序類(lèi)型的數據資料,這類(lèi)數據的分布形態(tài)一般是未知的。
1)雖然是連續數據,但總體分布形態(tài)未知或者非正態(tài);
2)總體分布雖然正態(tài),數據也是連續類(lèi)型,但樣本容量極小,如10以下;
主要方法包括:卡方檢驗、秩和檢驗、二項檢驗、游程檢驗、K-量檢驗等。
1.計量資料的統計方法
分析計量資料的統計分析方法可分為參數檢驗法和非參數檢驗法。
參數檢驗法主要為t檢驗和方差分析(ANOVN,即F檢驗)等,兩組間均數比較時(shí)常用t檢驗和u檢驗,兩組以上均數比較時(shí)常用方差分析;非參數檢驗法主要包括秩和檢驗等。t檢驗可分為單組設計資料的t檢驗、配對設計資料的t檢驗和成組設計資料的t檢驗;當兩個(gè)小樣本比較時(shí)要求兩總體分布為正態(tài)分布且方差齊性,若不能滿(mǎn)足以上要求,宜用t 檢驗或非參數方法(秩和檢驗)。方差分析可用于兩個(gè)以上樣本均數的比較,應用該方法時(shí),要求各個(gè)樣本是相互獨立的隨機樣本,各樣本來(lái)自正態(tài)總體且各處理組總體方差齊性。根據設計類(lèi)型不同,方差分析中又包含了多種不同的方法。對于定量資料,應根據所采用的設計類(lèi)型、資料所具備的條件和分析目的,選用合適的統計分析方法,不應盲目套用t檢驗和單因素方差分析。
2.計數資料的統計方法
計數資料的統計方法主要針對四格表和R*C表利用檢驗進(jìn)行分析。 四格表資料:組間比較用
檢驗或u檢驗,若不能滿(mǎn)足 檢驗:當計數資料呈配對設計時(shí),獲得的四格表為配對四格表,其用到的檢驗公式和校正公式可參考書(shū)籍。 R*C表可以分為雙向無(wú)序,單向有序、雙向有序屬性相同和雙向有序屬性不同四類(lèi),不同類(lèi)的行列表根據其研究目的,其選擇的方法也不一樣。
3.等級資料的統計方法
等級資料(有序變量)是對性質(zhì)和類(lèi)別的等級進(jìn)行分組,再清點(diǎn)每組觀(guān)察單位個(gè)數所得到的資料。在臨床醫學(xué)資料中,常遇到一些定性指標,如臨床療效的評價(jià)、疾病的臨床分期、病癥嚴重程度的臨床分級等,對這些指標常采用分成若干個(gè)等級然后分類(lèi)計數的辦法來(lái)解決它的量化問(wèn)題,這樣的資料統計上稱(chēng)為等級資料。
統計方法是指有關(guān)收集、整理、分析和解釋統計數據,并對其所反映的問(wèn)題作出一定結論的方法。統計方法是一種從微觀(guān)結構上來(lái)研究物質(zhì)的宏觀(guān)性質(zhì)及其規律的獨特的方法。
定義1
所謂統計方法是指用多次測量值采用一定方法計算出的標準不確定度。不同于A(yíng)類(lèi)的其它方法計算者稱(chēng)為B類(lèi)標準不確定度或稱(chēng)為標準不確定度的B類(lèi)計算法(typeBevaluation)。
定義2
在平均離子模型的基礎上,發(fā)展了一個(gè)計算離子組態(tài)概率分布的有效方法,稱(chēng)為統計方法。
源自: 激光等離子體非平衡X射線(xiàn)發(fā)射譜理論研究《物理學(xué)報》1995年 裴文兵,常鐵強,張鈞
定義3
統計方法是指在不知道紋理基元或尚未監測出基元的情況下進(jìn)行紋理分析,主要描述紋理基元或局部模式隨機和空間統計特征,如灰度共生矩陣法、隨機場(chǎng)模型法等。
源自: 利用紋理分析方法提取TM圖像信息《遙感學(xué)報》2004年 姜青香,劉慧平
定義4
分子物理學(xué)就是用統計方法來(lái)研究的。大量個(gè)別的偶然事件存在著(zhù)一定的規律,表現了這些事件的整體的本質(zhì)和必然的聯(lián)系。這種規律是客觀(guān)存在的,統計的方法則是揭示這種規律的必要手段。統計方法只能適合于大量事件,研究的事件越多,得到的統計結果也越準確
1.理化項目:
水分,灰分,酸價(jià),過(guò)氧化值,揮發(fā)性鹽基氮,三甲胺氮,咖啡因,脂肪酸,丙二醛,氨基酸態(tài)氮,總酸,酸度,
明礬,總堿度,L-羥脯胺酸,黃曲霉毒素B1,苯并[a]芘,丙酸鈣,丙酸鈉,脲酶,米酵菌酸,溶劑殘留量,羰基價(jià),
甲醛,次硫酸氫鈉甲醛,過(guò)氧化苯甲酰,亞硝酸鹽,甲醇,乙醇,總脂,酒精度,雜醇油,二氧化硫,相對密度,
pH值,比旋光度,折光率,粒度,細度,折射率,熔點(diǎn),凈含量,新鮮度,完整率,干粒重,干燥物,
可溶性固形物,總固形物,非脂乳固體,全乳固體
2.重金屬及微量元素:
鉛,砷,無(wú)機砷,汞,甲基汞,銅,鎂,鋅,錫,鈣,鉻,鎘,磷,氟,碘,硒,鉀,鈉,鋁,鐵,錳等。
3.食品添加劑:
防腐劑:山梨酸,苯甲酸;
著(zhù)色劑:胭脂紅,莧菜紅,檸檬黃,日落黃,誘惑紅,亮藍
甜味劑:糖精鈉,甜蜜素
抗氧化劑:叔丁基羥基茴香醚,二叔丁基對甲酚,植酸,TBHQ
漂白劑:亞硫酸鹽,二氧化硫
護色劑:硝酸鹽,亞硝酸鹽
面粉處理劑:過(guò)氧化苯甲酰
水分保持劑:磷酸鹽等
4.食品農藥殘留測試:
有機磷、有機氯、擬除蟲(chóng)菊酯類(lèi)、氨基甲酸酯類(lèi)等400余種測試
5.食品獸藥殘留測試:
氯霉素、土霉素、金霉素、四環(huán)素、硝基呋喃、磺胺類(lèi)、鹽酸克倫特羅等。
6.微生物檢測:
細菌總數、大腸菌群、霉菌和酵母菌、大腸桿菌、志賀氏菌、金黃色葡萄球菌、沙門(mén)氏菌、致病菌等
7.營(yíng)養標簽檢測:
以上是我們青島科標生物實(shí)驗室針對食品類(lèi)的檢測項目,可以參考一下。
假設檢驗是不可能做到完全正確的,它只能保證假設在最大概率上的成立。
一般雙側U-檢驗的做法就是你列出的檢驗法1。
利用檢驗法2或3,表面上結果是檢驗水來(lái)平a下進(jìn)行的,但實(shí)際內在的結果是:假設是在檢驗水平為b時(shí)成立;其中b可能大于a,也可能小于a。也就是說(shuō)
(1)(當假設值與真實(shí)值差別非常小時(shí)) b≥a,即在比a更高的檢驗水平下也能成立,若使用這種檢驗法,則“棄真”的概率就更大;
(2)(當假設值與真實(shí)值差別比較大時(shí)) b≤自a,即只有在比a低的檢驗水平下才能成立,若使用這種檢驗法,則“納偽”的概率就更大。
所以一般不采用檢驗法2和3。
可以想像,檢驗法1中,u2和u1的大小關(guān)系是由契比學(xué)夫不等式確定的,只有成立與不成立的情況,沒(méi)有程度關(guān)系。
而在檢驗法2和3中,u0或xx落在置信區間內的具體位置對其概率的影響是很大的,所以檢驗的結果也不一定準確,至少檢驗的結果不是對應于檢驗水平a的。
如果是通過(guò)矩估計法得到的u0,那么你列出的檢驗法2和檢驗法3就是一回事zhidao,u0=xx。
聲明:本網(wǎng)站尊重并保護知識產(chǎn)權,根據《信息網(wǎng)絡(luò )傳播權保護條例》,如果我們轉載的作品侵犯了您的權利,請在一個(gè)月內通知我們,我們會(huì )及時(shí)刪除。
蜀ICP備2020033479號-4 Copyright ? 2016 學(xué)習?shū)B(niǎo). 頁(yè)面生成時(shí)間:3.462秒