回归与方差分析: 使用时选择什么工具

回归与方差分析: 使用时选择什么工具

 
假设您以周期时间收集数据,收益、制造零件的尺寸或者其他一些指标对你来说很重要,你想看看其他哪些变量可能与它相关。现在你怎么办呢?

当我大学毕业时我的第一个统计学位,我的文凭是真正的证明,我忍受几个小时各种统计课题的课堂讲座,包括线性回归,方差分析和逻辑回归分析。

然而,没有一个单独的归类将数据放在一起并解释使用时选择什么工具。我有所有这些数据为我的X和Y,我想描述它们之间的关系,但是我现在做什么?

那时候,我希望有人清楚地指出回归和方差分析哪一种最适合这种类型的数据。
让我们从如何选择一个连续的Y的正确的工具开始。
 
  连续Y、连续X
 
例如:
Y:成年男性的体重
X:年龄、身高、每周锻炼时间
你应该使用什么工具呢? 回归

Minitab中哪里有这个工具? 统计>回归>回归>拟合回归模型

例如:
Y: 你的马里奥赛车Wii得分
X: Wii控制器类型(赛车方向盘或标准),无论你站或坐时游戏中角色 (Mario, Luigi, Yoshi, Bowser, Peach)
 
你应该使用什么工具呢? 方差分析
 
Minitab中哪里有这个工具? 统计>方差分析>一般线性模型>拟合一般线性模型

连续Y、连续和分类X(s)
例如:
Y: 每晚睡眠的小时数
X: 年龄、睡觉之前活动(没有、读一本书、看电视、上网)是否有小孩子…”我做了一个不好的梦,我渴了,有一个怪物在我床下!”

你应该使用什么工具呢? 你可以选择使用方差分析或者回归分析。

Minitab中哪里有这个工具? 统计>方差分析>一般线性模型>拟合一般线性模型或统计>回归>回归>拟合回归模型。
我个人更喜欢GLM,因为它提供多重比较,如果你有一个显著的分类X超过2个水平用这个是很有用的。例如,假设睡眠之前活动很重要。比较会告诉你4个水平中:没有、读一本书、看电视、上网哪个是显著不同于另一个的。

那些看电视再睡觉的人,平均而言和上网的人睡觉时间一样,但明显比那些什么都不做或读书的人少吗?或者也许是上网显著不同于其他三个类别吗? 比较有助于你发现这些差异。

分类的Y

如果Y是分类的,那么您可以使用逻辑回归的连续/或分类X。逻辑回归的3种类型:
    二进制:  Y有 2个水平(是/否、通过/失败)
     顺序:  Y超过2个水平有一个自然顺序(低/中/高)
    名义上的:  Y超过2个水平没有顺序(轿车/SUV /汽车/卡车)

所以下次你有一堆X和Y,你想看看它们之间有关系,这里是使用时选择什么工具的总结。
 

 
逐步说明如何使用一般回归、一般线性模型或Minitab统计软件中的逻辑回归,你只要浏览到Minitab中任何这些工具对话框底部左角单击“帮助”。您将会看到“例子”位于屏幕顶部的帮助。