林业生产和科学研究SPSS应用
林业生产和科学研究SPSS应用 1SPSS介绍 SPSS的全称是StatisticalProgramforSocialSci-ences,即社会科学统计软件, 现阶段使用较多的是SPSS17.0汉化版。SPSS集便捷的数据处理、直观的图表编 辑、强大的统计分析以及丰富的数据接口于一体,被业界称为最优秀的统计分析 软件之一。1.1数据编辑功能 利用SPSS,可以完成数据的增加、删除、复制、剪切和粘贴等常规编辑;
可以快捷高效地进行数据的排序、转化、拆分、聚合、加权等操作处理;
并且具 有多个数据文件的合并功能。
1.2图形生成与编辑功能 利用SPSS可以生成各种基本图和交互图。其中基本图包括条形图、线图、 面积图、饼图、高低图、箱图、误差条图、直方图、散点图等。交互图可以是二 维或三维的,包括条形交互图、线形交互图、带形交互图、饼形交互图、点型交 互图、箱型交互图、误差条形交互图、直方交互图和散点交互图等[1]。
1.3表格生成和编辑功能 利用SPSS可以生成数十种风格的表格,根据功能又可有一般表、多响应 表和频数表等。利用专门的编辑窗口或直接在查看器中可以编辑所生成的表格。
1.4统计分析功能 利用SPSS几乎可以完成所有的数理统计任务。具体包括样本数据的描述、 假设检验、非参数检验、T检验、方差分析、列联表、相关分析、回归分析、线 性分析、聚类分析、判别分析、因子分析、可靠性分析等[2]。
1.5与其他软件的联接功能 SPSS能读取和调用Excel、DeBase、Foxbase、Lotus1-2-3、Access、文本 编辑器等生成的数据文件。通过其内置的VBA编程开发,可以实现增强的应用功 能,完成对复杂数据的管理,提高统计分析的效率。2SPSS在林业统计分析中的应用实例 2.1频数分布分析 频数分布分析过程可以较方便地对数据进行按组分类整理,形成各变量的 不同水平的频数分布表和图形,从而把握变量的数据特征和分布状况的规律[3]。
下面对苗木样本进行频数分析,探讨苗木高度的生产规律。从某苗圃中抽取50 株苗木样本,测得苗木高度数据资料如下(单位:cm)。101、90、99、96、90、 98、103、94、98、113、92、99、100、87、102、100、96、103、102、92、93、 95、101、93、94、103、95、104、96、93、102、94、93、100、95、109、95、 98、91、97、94、96、88、91、106、97、93、96、93、98。运行程序,输入样 本资料,建立SPSS数据文件。依次点击“转换→重新编码为不同变量”菜单,打开 “重新编码”对话框选择分组变量,定义输出变量名“所在组”,输入变量标签“苗 木高度数据分组”。在“旧值和新值”中,定义分组区间。本例将苗木高度分为90 以下、90~94、95~99、100~104、105~109、110以上6组。打开“分析→描述统计 →频率”菜单,在“频率”对话框中确立频数分析“变量”,选择统计图形。本例点选 “直方图”,勾选“常正态曲线”。单击“确定”按钮,在输出窗口中显示苗木高度数 据的频数分析报表和直方图。详见表1和图1。频率分布表和分布图十分清楚地表 述了苗木高度变量取了哪些数值,取得这些数值机率是多少,以及苗木高度变量 分布规律。
2.2相关分析 针对客观事物相互间关系的密切程度用适当的统计指标表示出来,这个过 程就是相关分析。下面介绍两种方式:散点图方式、相关系数方式。
2.2.1散点图 表2为胸高断面积和蓄积量数据,依据数据资料绘制散点图。根据散点图 初步判断胸高断面积和蓄积量之间是否有相关关系。输入样本编号、胸高断面积、 蓄积量等数据资料,建立数据文件。依次点击“图形→旧对话框→散点”菜单,选 择散点图类型,本例选择“简单分布”。选择定义X、Y轴变量。本例选择“胸高断 面积”为X轴,选择“蓄积量”为Y轴。单击“确定”按钮,在输出窗口显示出散点图。
如图2所示。从散点图可直观的看出胸高断面积x与蓄积量y之间大致成直线关系, 蓄积量y随胸高断面积x增加而增加。要想较准确推断它们的关系,还需进一步计算相关系数。
2.2.2相关系数 相关系数的大小反映两个变量之间的线性关系的密切程度,仍以上例数据 资料为基础,介绍相关系数的计算过程。打开“分析→相关→双变量相关”菜单, 在“双变量相关”对话框中确定相关系数的类型;
选择“显著性检验”标准;
勾选“标 记显著性相关”复选框。单击“确定”按钮,在输出窗口中显示相关分析结果。如 表3所示。相关系数为0.974。胸高断面积和蓄积量之间存在正相关关系。
2.3回归分析 回归分析是通过建立回归方程来研究变量之间相关关系的一种统计分析 方法。回归分析过程分为两步:第一步建立变量之间的数学解析式;
第二步利用 所建的数学解析式进行预测。SPSS中的回归分析方法有:线性回归、非线性回 归、Logistic回归等[4]。下面以表2数据资料为例,介绍线性回归分析的计算过程。
设胸高断面积x和蓄积量y拟合的直线回归方程为:y=a+bx。打开“分析→回归→ 线性”菜单,在线性回归对话框中选择一个因变量,一个自变量;
在“统计量”中 设置输出的分析内容。本例使用默认选项“估计”和“模型拟合度”。单击“确定”按 钮,在输出窗口中显示出回归分析的结果。如表4所示。从结果中可看出,截距a 为0.027,回归系数b为9.788,所以胸高断面积x和蓄积量y拟合的直线回归方程 为:y=0.027+9.788x。在此直线回归中,如果选定自变量胸高断面积x的值,就 可以对因变量蓄积量y进行直线回归预测。
3结论 通过上述应用实例,可以总结出SPSS的一般使用过程:确定研究对象并 提出问题,选择合适的分析方案;
获取样本数据,创建SPSS数据文件;
运行相 应的SPSS功能模块,生成丰富的统计数据和图表;
根据计算结果分析研究对象 并解决问题。在实际应用中,针对具体对象常常会应用多种分析过程,计算比较 后取其中最优最合理的方案。综上所述,SPSS集数据编辑、数据管理、统计分 析、报表制作、图形绘制等功能于一体,是开展林业统计分析和科学研究的有效 实用工具。