|
t 检定 (t-Test)
类型 |
单变量 / 连续型 |
样本 |
适用2组样本比较,每样本至少2重覆 |
说明 |
藉由实验组与对照组视为两母群体样本,并使用其样本平均数进行假设检定。可以针对差异基因或客户感兴趣的基因作列表 |
案例 |
 |
|
|
|
|
卡方检定 (Chi-Square Test)
类型 |
单变量 / 离散型 |
样本 |
适用于两组离散型资料比较 |
说明 |
统计分析时,通常采用 列联表(contingency table) 以计次方式呈现 类别尺度资料。此分析方法主要用来探讨两个类别变数间之相关性。通常是以观察次数 (observed frequency, O) 及期望次数 (expected frequency, E) 的比较来进行检定。 所有类别之 (O - E)2 / E 加总,即算得检定用的统计量χ2值 |
案例 |
 |
|
|
|
|
简单线性回归 (Simple Linear Regression)
类型 |
单变量 / 连续型 |
样本 |
适用于依变项为连续型资料,建议总样本数30以上 |
说明 |
用于探讨一个连续型变数(依变数)与单个或数个变数间(自变数)的关系。以直线定义依变项Y随着自变项X变动的情形,将母群体中变项之直线关系以 Y=β0+β1X+ε 来表示。而此方法相较于相关分析主要差异在于Linear Regression可在给定某一自变数的值以预测或估计依变项 |
案例 |
 |
|
|
|
|
复线性回归 (Multiple Linear Regression)
类型 |
多变量 |
样本 |
适用于依变项为连续型资料,建议总样本数30以上 |
说明 |
用于探讨一个连续型变数(依变数)与单个或数个变数间(自变数)的关系。以直线定义依变项Y随着自变项X变动的情形,将母群体中变项之直线关系以 Y=β0+β1X+ε 来表示。而此方法相较于相关分析主要差异在于Linear Regression可在给定某一自变数的值以预测或估计依变项
|
案例 |
 |
|
|
|
|
逻辑斯回归分析 (Logistic Regression)
类型 |
单变量 / 离散型 |
样本 |
适用于依变项为类别型资料,建议总样本数30以上 |
说明 |
用于探讨一个二分类类别型变数(依变数)与单个或数个变数间(自变数)的关系
|
案例 |
 |
|
|
|
|
复逻辑斯回归 (Multiple Logistic Regression)
类型 |
多变量 |
样本 |
适用于依变项为连续型资料,建议总样本数30以上 |
说明 |
独立变数有k个,依变数只有一个y, 研究各独立变数和依变数的关系。可以用μy=α+β1 x1 +β2 x2 +β3 x3 +β4 x4 +…βk xk+ε
|
案例 |
 |
|
|
|
|
相关系数分析 (Correlation Coefficient)
类型 |
单变量 / 连续型 |
样本 |
适用2组以上连续型资料 |
说明 |
为用来描述两个随机变数彼此之间的相关强度,且两者之间的关系是线性关系,其值介于-1~1之间
|
案例 |
 |
|
|
|
|
变异数分析与多重比较 (ANOVA & Multiple Comparisons)
类型 |
单变量 / 连续型 |
样本 |
适用3组以上样本比较,每样本至少2重覆 |
说明 |
用于检定三组或三组以上群体之母群体平均数是否有差异。 变异数分析主要的概念是将资料的变异来源分为“组间变异”和“组内变异”两部份,其中组间变异是指用不同处理方法之间所产生的变异;组内变异是用相同处理方法内的变异。接着以此两种变异的大小来判断虚无假设是否成立。ANOVA仅能得到各母群体平均数不完全相等之结论,无法得知是否为全部不相等,或是只有几个不相等,因此Multiple Comparisons为延伸ANOVA检定而进一步比较组间的平均值是否有差异的统计方法,避免增加违反型一误差的机率(Type I error)。
|
案例 |
|
|
|
|
|
存活分析 (Survival Analysis)
类型 |
单变量 / 设限资料 |
样本 |
额外考量时间的效应 |
说明 |
用来研究或分析样本所观察到的某一段时间长度的分配。一段时间长度通常是从一特定事件开始的时间原点 (起始时间点) (starting event time point, zero time point) 直到某一特定事件发生的时间点
|
案例 |
|
|
|
|