当前位置:首页 > 问答大全 > 一个统计学的问题

一个统计学的问题

被浏览: 0次 2023年09月04日 20:55
热门回答(2个)
游客1

1.
对于这个问题,最好的方法莫过于:聚类分析。
聚类分析是根据样本间的距离进行分类,分类的标准很多:有的按照阀值,有的按照已经规定好的分的类数;可以说该问题就是一个聚类晌州分析的典型应用;在统
计教材中介绍聚类分析的例题就是这种问题。
2.
除此之外,还可以将这个问题堪称寻找“异常点”的问题。统计学是有系统的理论来研究个体“变异”。这种点即为“离群点”宴拆蔽,对它需要判断是否是“异常点”,这里有几种常用的判别方法(但要注意,对它的判定往往要结合实际问题的需要进行的,统计学上对异常点的态度非常谨慎,不能御高随便去掉它):看标准化残存、学生化残存;影响函数;Cook距离;WK统计量。
3.
提问中的解决方法本质上是考虑观察值跟数学期望的比值,如果过大那就说明这个点可能存在问题(这里设置了一个“阀值”作为挑选标准)。从线性回归的角度来看,数学期望就是最小二乘法下最好的常数估计,因此是线性回归的最简单情况。△X就是“残差”,△X/X类似于将它中心化,因为△X/X的数学期望是0,并且不受单位量纲的影响。此外,还有2中提到的方法。具体参见线性回归理论中回归诊断部分。
然而,最正统的方法同时也是目前最好的方法还是:聚类分析。

游客2

就是一个简单的回归问题,你是不懂题意还是不懂方法呢?
题意:研究居民的信用卡费用(或友裤者是透支额)的影响因素,共有三个变量:费用、收入、家庭人数
问题:
1.进行简单的统计分析
也就是均值-方差分析,说说均值、最大、最小值、方差 等
2.回归分析
分别建立以收入、人数为自变量,费用为因变量的OLS回归。纤纯书本上都应该有例题的。比较下哪个好,肯定是收入了。主要看拟合优度、F值、T值
3.建立 收入毁告咐、人数、费用的回归模型
4.利用你的回归模型 预测下三口之家收入为40000的信用卡费用
也即是代入回归方程就行了
5.考虑还需加入哪些变量加入回归方程更好
比如:可将收入细分、家庭人均消费支出、贷款额等等
参照书本例题吧