4门统计学你选择哪个
统计学的重要性毋庸多说,基本上NGS数据分析的每个环节参数的把握,每个图表的理解背后都是统计学背景知识。当然了,对大量入门级别玩家,暂时可以不要考虑那么多,先跟着我在生信技能树的教程肝下去,走出一个完整项目再说。但是大量中高级玩家的需求我们也得满足啦,很久以前我们整理过:统计学回顾(精华目录收藏)(statquest+协和八+ NGSHotpot),可以说是啃这块统计学硬骨头是提升自己的生信段位不二选择!
1. 统计及生物统计概要(2学时)
2. 数据探索性分析、可视化(4学时)
3. 假设检验和置信区间估计(12学时)
a) 参数假设检验 b) 非参数假设检验 c) Bootstrap方法、permutation 方法 d) 多重假设检验
4. 回归分析方法(12 学时)
a) 线性回归分析 b) 广义线性回归 c) 非线性回归方法、广义非线性回归方法 d) 混合效应回归模型
5. 高维生物统计学方法 (12学时)
a) 模型选择方法
模型衡量准则;传统变量选择方法,如前向选择方法、后向选择方法;罚函数方法b) 超高维数变量筛选方法
线性模型中的变量筛选、非线性模型中的变量筛选c) 降维方法
PCA, NMF,LLE,DiffusionMap, tSNE, UMAP等线性、非线性降维方法
6. 分类、聚类分析简介(6学时)
a) 逻辑回归、支持向量机、随机森林等分类方法 b) K-means、混合正态模型、隐马氏模型等聚类方法
第一章 矩阵代数
1.1 矩阵的定义和运算 1.2 正交矩阵 1.3 矩阵的行列式、逆和秩 1.4 矩阵的特征值、特征向量和迹 1.5 正定矩阵、非负定矩阵和矩阵函数值的SAS输出 附录1.A 矩阵代数的R代码(选) 附录1.C 矩阵代数的本教材节选(选)
第二章 随机向量和多元正态分布
2.1 多元分布 2.2 数字特征 2.3 欧氏距离和马氏距离 2.4 多元正态分布 2.5 极大似然估计及估计量的无偏性 2.6 JMP入门 2.7 一个案例的JMP演示 附录2.A 多维数据描述及可视化等的R代码(选) 附录2.B SPSS在多维数据描述及可视化等中的应用(选) 附录2.C 随机向量的本教材节选(选) 附录2.D 多元正态分布的本教材节选(选) 第二章测验
第三章 判别分析
3.1 引言 3.2 两组距离判别 3.3 多组距离判别 3.4 贝叶斯判别——最大后验概率法 3.5 贝叶斯判别——最小期望误判代价法 3.6 费希尔判别 附录3.A 判别分析的R代码(选) 附录3.B SPSS在判别分析中的应用(选) 附录3.C 摘自本教材的若干数学证明(选) 第三章测验
第四章 聚类分析
4.1 引言 4.2 距离和相似系数 4.3 系统聚类法 4.4 聚类中的若干问题 4.5 动态聚类法——k均值法 附录4.A 聚类分析的R代码(选) 附录4.B SPSS在聚类分析中的应用(选) 第四章测验
第五章 主成分分析
5.1 引言 5.2 总体的主成分 5.3 样本的主成分 5.4 若干案例 5.5 若干补充及主成分应用中需注意的问题 附录5.A 主成分分析的R代码(选) 附录5.B SPSS在主成分分析中的应用(选) 附录5.C 摘自本教材的若干数学证明(选) 附录5.D 对主成分综合得分方法的质疑(摘自本教材,选) 第五章测验
第六章 因子分析
6.1 引言 6.2 正交因子模型 6.3 参数估计 6.4 因子旋转 6.5 因子得分 附录6.A 因子分析的R代码(选) 附录6.B SPSS在因子分析中的应用(选) 附录6.C 摘自本教材的若干数学证明(选) 第六章测验
第七章 对应分析
7.1 引言 7.2 行轮廓和列轮廓 7.3 总惯量 7.4 行、列轮廓的坐标 7.5 对应分析图 附录7.A 对应分析的R代码(选) 附录7.B SPSS在对应分析中的应用(选) 附录7.C 摘自本教材的若干数学证明(选) 第七章测验
01 多元统计分析概述
1.1 多元分析的定义 1.2 多元分析的方法简介 1.3 多元分析的应用领域
02 多元数据的描述与展示
2.1 一元随机变量回顾 2.2 随机向量 2.2.1 多元数据的数值特征及可视化 2.2.2 协方差矩阵的用途 2.3 随机向量的变换
03 多元正态分布
3.1 多元正态分布 3.2 多元正态分布的性质 3.3 多元正态的估计 3.4 评估多元正态性
04 均值向量的检验
4.1 多元检验的冬季 4.2 单样本均值向量检验 4.3 两样本均值向量检验 4.3.1 独立样本 4.3.2 成对样本
05 判别分析和分类分析
5.1 判别分析和分类分析概述 5.2 判别分析:分类规则 5.2.1 两群体Fisher线性判别分析 5.2.2 多群体Fisher线性判别分析 5.3 分类分析:分类结果 5.3.1 两群体Fisher分类 5.3.2 两群体贝叶斯分类 5.3.3 多群体分类
06 主成分分析
6.1 主成分分析思想 6.2 总体主成分分析 6.2.1 总体主成分推导 6.2.2 基于标准化的总体主成分分析 6.3 样本主成分分析 6.3.1 样本主成分推导 6.3.2 主成分个数的选择 6.3.3 R语言应用实例
07 因子分析
7.1 因子分析简介 7.2 载荷估计方法 7.2.1 主成分法 7.2.2 其他方法 7.2.3 估计因子得分 7.3 因子旋转 7.3.1 因子旋转的理解 7.3.2 正交旋转和斜交旋转 7.4 R语言示例
08 聚类分析
8.1 聚类分析概述 8.2 层次聚类 8.2.1 简介 8.2.2 层次聚类的类型 8.2.2.1 层次聚类的类型(上) 8.2.2.2 层次聚类的类型(下) 8.2.3 R语言示例 8.3 k-均值聚类 8.3.1 方法介绍 8.3.2 R语言示例
赞 (0)