×

spss回归分析案例

spss回归分析案例(spss中回归分析实例求助,这样的R值F值T值可以继续做下去吗)

admin admin 发表于2023-04-07 05:52:19 浏览86 评论0

抢沙发发表评论

本文目录

spss中回归分析实例求助,这样的R值F值T值可以继续做下去吗


你好,F值和T值多少没有绝对的标准的。主要是看你的回归模型是否合理。在进行回归分析之后还要进行残差分析,看模型是否存在异方差,自相关,多重共线性等问题。若是存在异方差、自相关等问题,有可能会高估t值,F检验也会失效。所以单单看这个并不能下结论。如果你模型不存在违背基本假设的情况。那你所的出来的值是没有任何问题的。在实证分析中,R^2有0.734算不错了。因为在做宏观经济计量分析的时候,由于样本量的缺乏,以及数据记录等问题。难以保证有很高的拟合精度。最主要的是看是定量分析和定性分析是否相违背。(例如,一般情况下,销售量和销售价格是成反比的关系,但是你在回归分析时得到的结构是成正比的。那你就要注意了,要结合经济学的理论去分析你得到的结果是否合理。)
看了你的追问,你应该是想做主成分回归吧。主成分回归是先把所有指标做主成分分析,即提取主成分,然后利用主成分进行回归分析。这样做是可以的。另外你用SPSS做出来的是因子分析的结果,需要转化一下才能进行主成分回归。还有,据我做实例研究的经验,时间序列数据用来做因子分析是有待商榷的,需要进行一定的变换。
希望这个回答对你有用!

用spss对数据进行回归分析,但不知选哪一种回归类型,怎么办请教高手!


回归有很多种,回归研究X对于Y的影响,至于回归方法的选择上,关键在于因变量Y的数据类型,如果Y是离散数据,则统一应该使用logistic回归,但具体logistic回归又分成三种类型。

如果因变量Y提连续数据(通常也说Y是正态分布时),则应该使用线性回归(有时也称OLS最小二乘法回归)。

还有一种较为特殊而且使用较少的回归叫Poisson回归,如果Y符合泊松分布此时则应该使用Poisson。


spss回归分析结果怎么得出回归结果


如何报告回归分析的结果

回归分析的结果可以分为以下几部分:1)回归模型;2)回归系数;3)因变量和自变量的特征;4)自变量之间的关系。其中,1和2是必须详细报告的基本信息;而3和4则可以根据具体情况而详略各异的辅助信息。以下分别讨论之。

如何描述回归模型和回归系数

先简单讲一下一元回归。一元回归,即只涉及一个自变量(如X)。这种模型在社会科学中既很少见(一个常见的例外是时间序列分析中以时间为自变量分析因变量的长期趋势),也很容易报告。一般不需用表格,只须写一句话(如“自变量X的b = ?,std = ?, Beta = ?”)或给一个公式(如“Y = ? + ?b, where std = ?, Beta = ?”)就足够了。如果一项研究中有多个一元回归分析,那么就应该也可以用一个表格来报告(参加?),以便于读者对各模型之间作比较。

接下来专门讲多元回归。由于其涉及诸多参数,有的必须报告、有的酌情而定、有完全不必,为了便于说明,我按SPSS回归分析的输出结果(其它统计软件大同小异),做了一个如何报告回归模型和回归系数的一览表(表一)。如表所示,我将各种参数分成“必须报告”、“建议报告”、“一般不必”和“完全不必”四类。我的分类标准来自于公认的假设检验所涉及的四个方面,即变量之间关系的显著性、强度、方向和形式(详见“解释变量关系时必须考虑的四个问题”一文)。也就是说,每个参数的取舍,应该而且可以由其是否提供了不重复的显著性(即Sig)、强度(B或Beta的值)、方向(B或Beta的符号)和形式(自变量的转换)信息而定的。

表一、如何报告回归模型和回归系数之一览表

注释 SPSS结果出处 是否报告 如何报告

回归模型部分

R 因变量与所有自变量的复合相关系数 Model Summary表 完全不必  

R Square R的平方值 Model Summary表 一般不必  

Adjusted R Square R平方的修正值 Model Summary表 必须报告 见表二

Std Error of the Estimate 因变量预测值的标准误差(注1) Model Summary表 建议报告 见表二

Sum of Squares 总离差 ANOVA表 完全不必  

df 自由度 ANOVA表 完全不必  

Mean Square 平均离差 ANOVA表 完全不必  

F 模型F值 ANOVA表 一般不必  

Sig. F值的显著水平 ANOVA表 必须报告 见表二

N 模型的个案数(注2) ANOVA表 必须报告 见表二

回归系数部分

Unstandardized Coefficients (B) 非标准化系数 Coefficients表 必须报告 见表二

Unstandardized Coefficients (Std. Error) B的标准误差 Coefficients表 必须报告 见表二

Standardized Coefficients (Beta) 标准化系数 Coefficients表 必须报告 见表二

t = B / Std. Error Coefficients表    

Sig. t值的显著水平 Coefficients表 必须报告 见表二

95% Confidence Interval for B (Lower Bound) B的置信区间(下限) Coefficients表(注3) 建议报告 见表二

95% Confidence Interval for B (Upper Bound) B的置信区间(上限) Coefficients表(注3) 建议报告 见表二

注1:因变量预测值的标准误差描述了该模型的精确度(precision),如表二中的因变量是当前年薪,其预测误差为?,即如果用该模型(包括起薪、工龄和性别三个自变量)去预测条件相同的企业中的员工年薪,则可以知道?。这种信息无法从模型的其它参数(如R平方或其修正值、显著水平、各自变量的B或Beta)中得知。

注2:如果因变量和所有自变量都没有缺省值,那么模型的个案数就等于样本数。但变量常有缺省值,这时模型的个案数就会小于样本数、有时两者相差很大(当然是个严重问题),所以一定要报告前者。SPSS并不直接显示该信息,但很容易计算,等于 ANOVA表中的Total df + 1就是了。RegressionStatistics

注3:B的置信区间,是用来检验B的显著水平的另一工具(如果上、下限之间包含了0,说明B在95%的水平上不显著),以弥补t检验及其Sig值的不足。这是一个经典又有复杂的问题,叫做Null Hypothesis Significance Test (NHST),本文不做详谈。有兴趣的读者可以参见有关网页(R. C. Fraley; D. J. Denis)。SPSS不直接给出B的置信区间,需要在“Statistics”一项中要求添加。如右图所示,SPSS回归分析的输出结果中,内定只显示“Estimates“ 和“Model fit“两项(即会产生表一中除了置信区间之外的其它各项参数)。建议加选“Confidence intervals”。

现在用一个实例来演示如何报告回归分析结果。为了便于大家重复这个实例,我使用的数据是SPSS自带的world95.sav。这是联合国教科文组织(或世界银行之类机构)发表的1995年全球109个国家或地区的“国情”数据,其中含有人口、地理、经济、社会、文化等26个指标。我以其中的birth_rt(每1000人的出生率)为因变量,gpd_car(人均国内生成总值)、urban(城市化,即人口中城市人口比例)、literacy(识字率、即人口中能阅读者比例)和calories(每天卡路里摄入量)等四项为自变量。按表一的原则,我将该回归分析的结果报告在表二中:

[转载]如何报告回归分析的结果

限于篇幅和本文目的,我不对表二的各参数作解读。但想对表中的有关格式做些补充说明。

如何给表格取标题:一般只须描述表内的内容即可。那么,本表的内容是什么呢?是出生率对四个自变量作回归的结果。该四个自变量在表内均有详细介绍,故不必在表格标题中重复。

如何描述变量(包括因变量和自变量):我先给出每个变量的理论概念名(如必要,可以用英文)、然后在括号中注明其对应的SPSS变量名(这并非必须、而是为了便于大家对照手头的SPSS数据)和操作定义(很有必要、强烈推荐,从中读者可以看到变量是否做过转换、从而得知有关关系的形式、即线性还是非线性)。为何要如何详细地描述变量?APA手册对如何制作各种定量分析结果的表格或图形有一条“独立信息”的基本原则,即每个图表要包含基本信息、以致读者不需参照正文而能够独立读懂该图表。因此,简单地将SPSS输出结果黏贴过来,虽是最常见的做法、但是很坏的习惯。

是否需要报告常数(Constant):一定要。常数对解读回归模型的实际社会意义,有十分重要的作用。如本表中的常数 = 65.444,意即全球(74个国家或地区)的平均出生率(即在控制了四项自变量的影响之后)为千分之65.4,等等。有一点须注意的是在SPSS的输出结果中,常数是放在第一行的。应该搬到其它自变量之后。

报告哪个回归系数(即标准化还是非标准化系数):这是最常见问题。以前曾有过“预测派”和“解释派”之争,前者主张只要报告B就够了、而后者则认为只要报告Beta就行了。其实两者反映的是不同的信息,B不受因变量变异程度(variability)的影响、所以同一自变量在各回归模型中的B是可以比较的(很多理论假设需要检验的就是这一问题);而Beta受因变量变异程度的影响而无法跨越本模型、但是却因其标准化而可以与同一模型中的其它Beta相比(也有很多理论假设希望解决的是这个问题)。因此,APA手册建议同时报告两者(英文第五版pp. 160-161)。

小数点之后取几位:APA手册认为,一般的定量分析结果只须保留两位小数足够。对回归结果来说,Beta、R2值、显著水平等标准化参数(即其取值均在0与1之间)取两位小数最合适。B及其相关指标(标准误差、置信区间)是非标准化的(即取值可以是任意大或任意小),所以要酌情而定,根据变量的量表(scale,即取值范围)大小而多取、少取甚至不取小数点。一般而言,当自变量的量表大于因变量时,其B会取小值、所以需要多取一至数位小数;相反,自变量的量表小于因变量时,其B会取大值、所以可以少取甚至不取小数。在本例中,GDP和卡路里的量表都远大于出生率,所以它们的B值看上去很小(但不一定意味着影响小)。因此,我就没有机械地只取两位小数。大家如果仔细看一下表二,就会发现我的“酌情”规则是“最后一位0之后取两位”,如-0.00042、0.033、-0.034、-0.0041,这与APA手册的“取两位小数”原则的基本精神是一致的。我们日常见到的问题,主要是保留过多的小数点,往往是是直接黏贴SPSS的结果(其内定是6位小数)而不加编辑而造成。

表格内是否有横竖分割线:按APA的规定,除了表格顶部、底部和列标题底部有三条横线外,其余一概不用。很多人简单照搬Word表格的内定线条,不做任何修饰。审稿专家一看就知是“菜鸟”或懒汉所为。

p是什么东东?就是SPSS输出中的Sig。p是所有统计学教科书中通用的符号,Sig则只是SPSS的专用。前者更广为认知。

如何报告多个回归模型?以上是如何报告一个回归模型的结果。实际上,一项研究(即一篇论文)中往往涉及数个回归模型。有些作者喜欢为每个回归做一个类似表二的回归结果表。这种方法有两个问题:一是占用过多的空间、二是不利于对各模型进行比较。一般说来,应该而且可以将平行(即全部自变量相同)或交集(即部分自变量相同)的回归模型结果放在同一个表内。我们还是用world95数据,再对死亡率和AIDS发病率分别做一个回归,然后将三个模型的结果放在表三:

表三与表二的主要区别在于表二是横向的(每列为同一类参数)、而表三是纵向(每列为同一模型)。表二中横排的六类参数改成竖立的四行(其中的p值被星号代替、置信区间的上下限合在一行),以便读者做横向比较(这是所有定量分析结果的表格制作的一个基本原则)。如果是英文报告,去掉中文后,表三会变得简洁明了很多。

如何报告变量特征和自变量关系

如前所述,因变量和自变量的特征以及自变量之间的相关关系,是需要酌情考虑的辅助信息。鉴于本文已经很长了,我们简单说一下。变量特征主要指

变量的操作定义(问卷原文)

取值范围(如0-100、0-1、0或1、1-5、1-7等等;好雪问的,如果数据做过对数、平方、开方、倒数等转换,就应该而且最适合在这里报告)

描述性统计值(均值、标准差、偏度Skewness、峰度Kurtosis等)

一种值得推荐的方法,是将所有变量的上述特征列在一个表中(表四)、放到论文的附录中去、供有兴趣的读者查阅(类似的技术细节一般都可以放到附录中去)。 

------------------------

关于SPSS回归结果分析

写论文的这个回归结果怎么说明

解答:

一看判定系数R方,本例中,R方=0.202,拟合优度很差.一般要在0.6以上为好.至少也在0.4以上.
二看系数估计量的sig值,其中,独董规模的sig=0.007,小于0.05,说明该变量对因变量有显著的影响.而总经理持股量则不显著.因为sig值大于0.05.
之所以,模型不好,是因为你忽略了重要的影响因素.
但如果你只关注这两个自变量对因变量的影响,那么,结论已经出来了.目的达到了,所以,也说得过去.
统计人刘得意

追答:

可以的,若作自变量,就是虚拟变量模型。 只要有一个sig小于0.05,模型就可以说是有效的。

追问:

像董事长是否兼任总经理,是则为1,否则为0,这样的数据能进行回归分析吗?从哪个值能看出这个模型是有效的?PS. R方好像是0.041吧?

追答:

一般来说是这样的。线性相关时,才能做线性回归模型。


如何利用spss进行已知维度的回归分析


用SPSS进行回归分析,实例操作如下:单击主菜单Analyze / Regression / Linear…,进入设置对话框如图7-9所示。从左边变量表列中把因变量y选入到因变量(Dependent)框中,把自变量x选入到自变量(Independent)框中。在方法即Method一项上请注意保持系统默认的选项Enter,选择该项表示要求系统在建立回归方程时把所选中的全部自变量都保留在方程中。所以该方法可命名为强制进入法(在多元回归分析中再具体介绍这一选项的应用)。具体如下图所示:
请单击Statistics…按钮,可以选择需要输出的一些统计量。如Regression Coefficients(回归系数)中的Estimates,可以输出回归系数及相关统计量,包括回归系数B、标准误、标准化回归系数BETA、T值及显著性水平等。Model fit项可输出相关系数R,测定系数R2,调整系数、估计标准误及方差分析表。上述两项为默认选项,请注意保持选中。设置如图7-10所示。设置完成后点击Continue返回主对话框。
回归方程建立后,除了需要对方程的显著性进行检验外,还需要检验所建立的方程是否违反回归分析的假定,为此需进行多项残差分析。由于此部分内容较复杂而且理论性较强,所以不在此详细介绍,读者如有兴趣,可参阅有关资料。
用户在进行回归分析时,还可以选择是否输出方程常数。单击Options…按钮,打开它的对话框,可以看到中间有一项Include constant in equation可选项。选中该项可输出对常数的检验。在Options对话框中,还可以定义处理缺失值的方法和设置多元逐步回归中变量进入和排除方程的准则,这里我们采用系统的默认设置,如图7-11所示。设置完成后点击Continue返回主对话框。
在主对话框点击OK得到程序运行结果。

SPSS二元logistics回归结果分析


Logistic回归:主要用于因变量为分类变量(如疾病的缓解、不缓解,评比中的好、中、差等)的回归分析,自变量可以为分类变量,也可以为连续变量。

变量为二分类的称为二项logistic回归,因变量为多分类的称为多元logistic回归。Odds:称为比值、比数,是指某事件发生的可能性(概率)与不发生的可能性(概率)之比。OR(OddsRatio):比值比,优势比。

SPSS功能:

一、集数据录入、资料编辑、数据管理、统计分析、报表制作、图形绘制为一体。从理论上说,只要计算机硬盘和内存足够大,SPSS可以处理任意大小的数据文件,无论文件中包含多少个变量,也不论数据中包含多少个案例。

二、统计功能囊括了《教育统计学》中所有的项目,包括常规的集中量数和差异量数、相关分析、回归分析、方差分析、卡方检验、t检验和非参数检验。