11-12学时:数据分析实践
数据分析实践案例:老年人健康生活方式影响因素分析
研究背景
我们希望研究影响老年人健康生活方式的因素,包括饮食习惯(Diet)、运动频率(Exercise)、社会支持(SocialSupport)和心理状态(MentalHealth)等,并验证数据的可靠性和有效性。最终目标是分析这些因素如何影响综合的健康生活方式得分(HealthyLifestyle)。
数据变量
以下是数据集的变量说明案例:
Age(年龄):连续变量,单位为岁,例如 65、72。
Gender(性别):分类变量,0 = 女(Female),1 = 男(Male)。
Diet(饮食习惯):量表得分,1-5 分,5 表示最健康。
Exercise(运动频率):量表得分,1-5 分,5 表示最频繁。
SocialSupport(社会支持):量表得分,1-5 分,5 表示支持最强。
MentalHealth(心理状态):量表得分,1-5 分,5 表示最好。
HealthyLifestyle(健康生活方式得分):因变量,综合得分,1-20 分。
数据准备和实验条件
1. 从上一节课同学们收集的数据中,挑选一个组的数据进行分析。

分析下载数据:
下载问卷数据:
选择序列(编号)excel格式
样本量:大于100 。
数据:各组从问卷星或腾讯问卷平台导出序列(编号)数据和原始数据,csv格式,。
保存格式:保存为 .csv 文件,例如 第1组.csv,通过电子教室软件提交给老师。
2.确保计算机已安装JASP软件,若未安装,请从下列链接下载安装。
JASP 软件介绍
JASP(Jeffreys’ Amazing Statistics Program)是一款由阿姆斯特丹大学支持的免费开源统计分析软件,旨在为用户提供简单易用的统计工具。它以直观的图形用户界面(GUI)为特色,特别适合心理学、社会科学等领域的学生和研究人员。JASP 不仅支持传统的频数主义统计方法(如 t 检验、ANOVA 和回归分析),还特别强调贝叶斯统计方法的集成,这使其在现代科学研究中独具优势。自 2014 年首次发布以来,JASP 不断更新,功能日益完善,逐渐成为 SPSS 等商业软件的有力替代品。
与 SPSS 的对比
SPSS(Statistical Package for the Social Sciences)是由 IBM 开发的一款老牌商业统计软件,自 1968 年以来广泛应用于学术和行业数据分析。相比之下,JASP 作为一个新兴工具,在多个方面展现出与 SPSS 的差异:
成本
SPSS:商业软件,需购买许可证,价格较高,尤其是对个人用户或预算有限的学生而言,成本可能成为负担。
JASP:完全免费,开源性质意味着无需任何费用即可使用全部功能,且可在 Windows、Mac 和 Linux 等多个平台运行。
用户界面
SPSS:界面较为传统,菜单复杂且选项繁多,对于新手来说学习曲线较陡,操作可能不够直观。
JASP:拥有现代化的设计,界面简洁直观,分析选项一目了然,用户只需几次点击即可完成复杂分析,适合初学者。
功能覆盖
SPSS:功能全面,支持大量统计方法,但缺乏对贝叶斯统计的内置支持,且某些现代分析(如元分析)需要额外插件或手动操作。
JASP:涵盖常见统计分析(如描述统计、t 检验、回归等),并内置贝叶斯方法、元分析和结构方程模型(SEM)等高级功能,部分功能甚至超越 SPSS。
输出格式
SPSS:输出表格格式较繁琐,需手动调整以符合 APA(美国心理学会)出版标准,增加了后期处理的工作量。
JASP:默认生成 APA 格式的表格和图形,结果可直接复制粘贴到学术报告中,极大简化了报告撰写过程。
数据同步与可重复性
SPSS:分析步骤需通过菜单或语法手动重复,数据更新后需重新运行整个流程,可重复性较弱。
JASP:支持实时计算和数据同步,修改数据后结果自动更新,且分析步骤集成在输出中,便于研究的可重复性和透明性。
JASP 的优点
免费且开源
JASP 无需任何费用,消除了经济门槛,同时开源特性允许用户和开发者持续改进软件,保持其与时俱进。
易用性
简洁的界面和直观的操作设计使得 JASP 特别适合统计学初学者,用户无需编程知识即可完成复杂分析。
贝叶斯统计支持
与 SPSS 不同,JASP 内置贝叶斯分析工具,提供更丰富的统计推断选择,符合现代科学研究趋势。
APA 格式输出
默认生成符合 APA 标准的表格和图形,节省了研究人员格式调整的时间,提升了工作效率。
实时更新与动态交互
数据和分析结果实时同步,用户可随时调整参数并立即查看变化,增强了分析的灵活性和直观性。
跨平台兼容
JASP 支持多种操作系统,无需担心兼容性问题,安装和使用过程简单,无需复杂的许可激活。
软件下载 :
JASP-0.19.3.0-Windows.msi
3. 导入数据到 JASP
打开 JASP 0.19.3。
点击左上角 File(文件) > Open(打开)。
选择 ElderlyHealth.csv 文件,点击 Open(打开)。
数据加载后,界面会显示表格,确认变量名称和数据无误。
分析步骤
1. 描述性统计(Descriptive Statistics)
目标:了解数据的分布特征,如平均值、标准差等。
操作步骤
在 JASP 主界面,点击顶部菜单 Descriptive Statistics(描述性统计)。
在左侧变量列表中,将以下变量拖到右侧 Variables(变量) 框中:
Age(年龄)
Gender(性别)
Diet(饮食习惯)
Exercise(运动频率)
SocialSupport(社会支持)
MentalHealth(心理状态)
HealthyLifestyle(健康生活方式得分)
在下方选项中勾选:
Frequency Tables(频率表):适用于 Gender(性别)等分类变量。
Mean(均值):计算平均值。
Std. Deviation(标准差):测量数据离散程度。
Minimum(最小值) 和 Maximum(最大值):查看数据范围。
Skewness(偏度) 和 Kurtosis(峰度):检查分布是否正态。
点击 OK(确定) 运行分析。

输出解读
Age(年龄):均值可能是 68.5,标准差 4.2,表示年龄分布较集中。
Gender(性别):频率表显示男女比例,例如 60% 女性 (0),40% 男性 (1)。
HealthyLifestyle(健康生活方式得分):均值 12.3,标准差 3.1,表示得分中等且有一定差异。
Skewness(偏度) 和 Kurtosis(峰度):接近 0 表示数据接近正态分布,若偏离较大(如 > 1 或 < -1),分布可能不正态。
2. 信度分析(Reliability Analysis)
目标:检查量表(Diet, Exercise, SocialSupport, MentalHealth)的内部一致性。
操作步骤
点击顶部菜单可靠性分析---> Reliability(信度)。
将以下变量拖到右侧 Variables(变量) 框中:
Diet(饮食习惯)
Exercise(运动频率)
SocialSupport(社会支持)
MentalHealth(心理状态)
在选项中选择 Cronbach’s α(克朗巴赫α系数),保持默认设置。
点击 OK(确定) 运行。

输出解读
Cronbach’s α:
>0.7:信度良好。
0.6-0.7:信度可接受。
< 0.6:信度较差,可能需要调整量表。
Item-rest correlation(项目剩余相关性):如果 α 偏低,检查每个变量的值,若某项 < 0.3,可考虑删除。
示例:α = 0.82,表示量表一致性很好。
3. 效度分析(Validity Analysis)
目标:验证量表是否有效测量健康生活方式(通过相关分析检查收敛效度)。
操作步骤
点击顶部菜单 Correlation(相关性)。
将以下变量拖到右侧 Variables(变量) 框中:
Diet(饮食习惯)
Exercise(运动频率)
SocialSupport(社会支持)
MentalHealth(心理状态)
HealthyLifestyle(健康生活方式得分)
在选项中选择:
Pearson(皮尔逊相关系数):默认方法。
勾选 Report significance(报告显著性):显示 p 值。
点击 OK(确定) 运行。

输出解读
相关系数 r:
r > 0.3 且 p < 0.05:变量与 HealthyLifestyle 有显著正相关,效度较好。
r < 0.1:相关性弱,可能不适合纳入量表。
示例:
Diet 与 HealthyLifestyle:r = 0.45, p < 0.01,正相关显著。
Exercise 与 HealthyLifestyle:r = 0.50, p < 0.001,效度很好。
4. 影响因素分析(Regression Analysis)
目标:探究哪些变量显著影响健康生活方式得分。
操作步骤
点击顶部菜单 Regression(回归) > Linear Regression(线性回归)。
将 HealthyLifestyle(健康生活方式得分) 拖到 Dependent Variable(因变量) 框中。
将以下变量拖到 Covariates(协变量/自变量) 框中:
Age(年龄)
Gender(性别)
Diet(饮食习惯)
Exercise(运动频率)
SocialSupport(社会支持)
MentalHealth(心理状态)
在选项中勾选:
R squared(R平方):显示模型解释力。
Coefficients(回归系数):
勾选 Standardized(标准化系数):便于比较各变量影响大小。
勾选 Significance(显著性):显示 p 值。
点击 OK(确定) 运行。
输出解读
R²(R平方):例如 R² = 0.50,表示模型解释了 50% 的健康生活方式变异。
回归系数表:
β(标准化系数):表示影响大小和方向。
p 值:< 0.05 表示显著影响。
示例:
Exercise:β = 0.35, p = 0.001,运动频率显著正向影响。
SocialSupport:β = 0.28, p = 0.02,社会支持也有显著影响。
Age:β = -0.10, p = 0.15,未达显著水平。
结果整理与报告
示例报告
描述性统计:
平均年龄 68.5 岁(标准差 4.2),健康生活方式得分均值 12.3(标准差 3.1),性别比例 60% 女性。
信度:
Cronbach’s α = 0.82,量表信度良好。
效度:
Diet (r = 0.45, p < 0.01)、Exercise (r = 0.50, p < 0.001) 与 HealthyLifestyle 显著相关,效度较好。
影响因素:
回归模型 R² = 0.50,Exercise (β = 0.35, p < 0.01) 和 SocialSupport (β = 0.28, p < 0.05) 是显著预测因子。
输出保存
在 JASP 中,点击顶部 Export(导出) > Export results(导出结果),保存为 .html 文件,方便整理报告。
注意事项
软件版本:确保使用 JASP 0.19.3,界面可能因版本差异略有不同。
数据检查:导入数据后,确认无缺失值或异常值(如 Age = 150)。
正态性:若偏度和峰度偏离较大,可在回归前勾选 Assumption checks(假设检验) 检查正态性。
最后编辑:信息技术教研室 更新时间:2025-08-13 10:53