“我们乐于向读者推荐本书,并建议大学教师将本书作为‘回归分析’课程的教材,尝试一种新的教学方法。”
——郑忠国(北京大学)
“总之,这本优秀的教材价值非凡,不断更新。书中通过大量精心设计的例子,向读者全面展示持久不衰的回归分析处理数据的技巧。毫无疑问,在统计教学中,这本书将一如既往地被经常采用。”
——国际统计评论
本书已在世界范围内畅销三十多年,被美国斯坦福大学、哥伦比亚大学、康奈尔大学、纽约大学以及加拿大麦克马斯特大学等众多名校采用为教材,曾被译成德语、日语等版本。内容涉及简单线性回归、多元线性回归、岭回归、逻辑斯谛回归、泊松回归、稳健回归、变量变换和变量选择等,既有传统的统计分析,也有一些不那么传统的统计分析,目标是挖掘数据内在的结构。本书强调的是数据分析的技巧,而不是统计理论的发展,采用丰富的实例,形象生动而又系统详尽地阐述了回归分析的基本理论和具体的应用技术。
作者几乎是手把手地指导读者做探索性数据分析,读者在学完后,会系统地掌握回归分析的各种技巧,并且能够融会贯通地处理自己所遇到的数据分析问题。因此,对于从事数据挖掘或数据分析的工作者来说,这本经典的教材也是指导他解决实际问题的案头佳作。
网站提供了本教材中所有的数据以及配套的教师解答手册等资料。
......(更多)
Samprit Chatterjee 纽约大学Stern商学院荣休教授,国际数理统计学会、英国皇家统计学会、美国统计学会会士,1967年获哈佛大学博士学位。
Ali S. Hadi 康奈尔大学荣休教授,开罗美国大学特聘教授,国际统计学会会员,美国统计学会会士,多次荣获康奈尔大学的杰出教师奖项,还于2000年荣登美国教师名人录。
......(更多)
中文版序
译者序
前言
第1章 概述1
1.1 什么是回归分析1
1.2 公用数据集1
1.3 回归分析应用实例选讲2
1.3.1 农业科学2
1.3.2 劳资关系3
1.3.3 政府5
1.3.4 历史8
1.3.5 环境科学8
1.3.6 工业生产9
1.3.7 挑战者号航天飞机11
1.3.8 医疗费用12
1.4 回归分析的步骤14
1.4.1 问题陈述14
1.4.2 选择相关变量15
1.4.3 收集数据15
1.4.4 模型设定16
1.4.5 拟合方法17
1.4.6 模型拟合18
1.4.7 模型评价和选择18
1.4.8 回归分析的目标19
1.5 本书的内容和结构20
习题21
第2章 简单线性回归22
2.1 引言22
2.2 协方差与相关系数22
2.3 实例:计算机维修数据26
2.4 简单线性回归模型27
2.5 参数估计28
2.6 假设检验30
2.7 置信区间34
2.8 预测34
2.9 拟合效果度量35
2.10 过原点的回归直线38
2.11 平凡的回归模型39
2.12 文献40
习题40
第3章 多元线性回归45
3.1 引言45
3.2 数据和模型的描述45
3.3 实例:主管人员业绩数据46
3.4 参数估计47
3.5 回归系数的解释48
3.6 中心化和规范化50
3.6.1 含截距模型的中心化和规范化50
3.6.2 无截距模型的规范化51
3.7 最小二乘估计的性质52
3.8 复相关系数53
3.9 单个回归系数的推断54
3.10 线性模型中的假设检验55
3.10.1 检验所有预测变量的回归系数为056
3.10.2 检验某些回归系数为058
3.10.3 检验某些回归系数相等60
3.10.4 带约束的回归参数的估计和检验61
3.11 预测62
3.12 小结63
习题63
附录 多元回归的矩阵表示69
第4章 回归诊断:违背模型假定的检测71
4.1 引言71
4.2 标准回归假定71
4.3 各种残差72
4.4 图形方法74
4.5 拟合模型前的图形76
4.5.1 一维图76
4.5.2 二维图77
4.5.3 旋转图78
4.5.4 动态图78
4.6 拟合模型后的图形79
4.7 检查线性和正态性假定的图形79
4.8 杠杆、强影响点和异常值80
4.8.1 响应变量的异常值81
4.8.2 预测变量中的异常值81
4.8.3 伪装和淹没问题82
4.9 观测影响的度量83
4.9.1 Cook距离84
4.9.2 Welsch-Kuh度量84
4.9.3 Hadi影响度量85
4.10 位势残差图86
4.11 如何处理异常点87
4.12 回归方程中变量的作用88
4.12.1 添加变量图88
4.12.2 残差加分量图88
4.13 添加一个预测变量的效应92
4.14 稳健回归92
习题93
第5章 定性预测变量97
5.1 引言97
5.2 薪水调查数据97
5.3 交互变量100
5.4 回归方程组:两个组的比较102
5.4.1 斜率和截距都不同的模型103
5.4.2 斜率相同但截距不同的模型107
5.4.3 截距相同但斜率不同的模型108
5.5 示性变量的其他应用109
5.6 季节性109
5.7 回归参数随时间的稳定性111
习题115
第6章 变量变换121
6.1 引言121
6.2 线性化变换122
6.3 X射线灭菌124
6.3.1 线性模型的不适用性125
6.3.2 对数变换实现线性化125
6.4 稳定方差的变换126
6.5 异方差误差的检测130
6.6 消除异方差性131
6.7 加权最小二乘132
6.8 数据的对数变换132
6.9 幂变换134
6.10 总结137
习题137
第7章 加权最小二乘法141
7.1 引言141
7.2 异方差模型142
7.2.1 主管人员数据142
7.2.2 大学教育花费数据143
7.3 两阶段估计144
7.4 教育费用数据145
7.5 拟合剂量反应关系曲线151
习题152
第8章 相关误差问题153
8.1 引言:自相关153
8.2 消费支出和货币存量153
8.3 Durbin-Watson统计量155
8.4 利用变换消除自相关性157
8.5 当回归模型具有自相关误差时的迭代估计法158
8.6 变量的缺失和模型的自相关性159
8.7 住房开工规模的分析160
8.8 Durbin-Watson统计量的局限性162
8.9 用示性变量消除季节效应164
8.10 两个时间序列之间的回归166
习题167
第9章 共线性数据分析171
9.1 引言171
9.2 共线性对推断的影响172
9.3 共线性对预测的影响176
9.4 共线性的检测178
9.4.1 共线性的简单征兆179
9.4.2 方差膨胀因子182
9.4.3 条件指数184
习题186
第10章 共线性数据的处理189
10.1 引言189
10.2 主成分189
10.3 利用主成分的计算192
10.4 施加约束条件194
10.5 搜索模型中回归系数的线性函数195
10.6 回归系数的有偏估计198
10.7 主成分回归199
10.8 消除数据中的共线性200
10.9 回归系数的约束条件202
10.10 主成分回归中的注意事项203
10.11 岭回归205
10.12 岭估计法206
10.13 岭回归:几点注解209
10.14 小结210
10.15 文献210
习题211
附录10.A 主成分214
附录10.B 岭回归216
附录10.C 代理岭回归218
第11章 变量选择219
11.1 引言219
11.2 问题的陈述219
11.3 删除变量的后果220
11.4 回归方程的用途221
11.4.1 描述和建模221
11.4.2 估计和预测221
11.4.3 控制221
11.5 评价回归方程的准则222
11.5.1 残差均方222
11.5.2 Mallows的Cp准则223
11.5.3 信息准则223
11.6 共线性和变量选择224
11.7 评价所有可能的回归模型225
11.8 变量选择方法225
11.8.1 前向选择方法226
11.8.2 后向剔除方法226
11.8.3 逐步回归法226
11.9 变量选择的一般注意事项227
11.10 对主管人员业绩的研究227
11.11 共线性数据的变量选择231
11.12 凶杀数据231
11.13 利用岭回归进行变量选择234
11.14 空气污染研究中的变量选择234
11.15 拟合回归模型的可能策略243
11.16 文献244
习题244
附录 误设模型的影响247
第12章 逻辑斯谛回归249
12.1 引言249
12.2 定性数据的建模249
12.3 Logit模型250
12.4 例子:破产概率的估计251
12.5 逻辑斯谛回归模型诊断254
12.6 决定变量的去留255
12.7 逻辑斯谛回归的拟合度257
12.8 多项Logit模型258
12.8.1 多项逻辑斯谛回归259
12.8.2 例子:确定化学糖尿病259
12.8.3 顺序值逻辑斯谛回归263
12.8.4 例子:重新考察化学糖尿病的确定问题264
12.9 分类问题:另一种方法264
习题266
第13章 进一步的论题268
13.1 引言268
13.2 广义线性模型268
13.3 泊松回归模型269
13.4 引进新药269
13.5 稳健回归270
13.6 拟合一个二次式模型271
13.7 美国海湾中PCB的分布272
习题275
附录A 统计表276
参考文献283
索引291
......(更多)
......(更多)