成绩好的本科生具有哪些特征?
图 | 网络
作者 | 林同学
本号原创首发
正好在知网看到一篇利用一卡通信息预测学生成绩的论文,感觉很有意思,因此阅读了相关领域十余篇论文,归纳了一些公认的说法,和大家交流。
这篇文章是十分长的,如果不耐烦看可以直接拉到最后看总结与对策。
这里把论文中提到的可能对成绩产生影响的因素分为这几个类别:
(1)学生的固有特征:包括性别,籍贯,民族,家庭情况,上学期绩点和挂科数,高考时分数等属于个人固有属性的内容;
(2)学生学习习惯特征:主要包括上课出勤率,晚自习次数和学习时间,图书馆次数和学习时间等直接和学习关联的特征,通常可以直接表征学生学习所花精力;
(3)生活习惯特征:通常会包括学生吃饭,超市买东西,操场体育馆锻炼,宿舍和教学楼打水,图书馆和宿舍门禁,每天上网时间,游戏时间和视频时间等,通常是由一卡通刷卡记录和校园网账号记录生成;
(4)社交特性:包括朋友的多少,是否有情侣等。
01
学生固有特征
1.人口特征
虽然有多篇硕士论文均认为仅凭人口特征如性别,籍贯,民族等不足以对学生成绩进行预测,但是这并不等于这些因素毫无影响。有一个博士论文《高校学生学业表现数据建模研究-基于A大学教育数据的分析》对这些因素的影响进行了很详细的综述,利用A大学2014-2017级的学生数据进行了统计研究,文中指出:
(1)性别:女生的GPA均值高于男生,方差明显较小,但是高分的人少,体现出女大学生的成绩具有“下限高上限低”的特点,男生则正好相反,数据比较离散,既有极好的也有极差的,而且均值较低;
(2)地区:中部地区学生GPA最高,其次是东部地区和西部,这可能由于该学校在北京和天津仍然是本二批招生,因此作者画了不同省学生的GPA均值对比,如图1所示;
图1 A大学不同生源地学生的GPA对比
(3)城乡:城市学生的GPA均值略高,但是没有统计上的显著性,说明在A大学中城乡对学生GPA影响不大;
(4)民族:汉族学生的GPA均值明显高于少数民族学生,统计上非常显著,少数民族中不同地区也有差异,西部地区少数民族的GPA均值较低;
(5)经济:由于无法直接获取学生经济情况,就只能对比不同级别的贫困生的GPA均值,一般贫困>比较贫困>特别贫困,统计上显著,说明家庭经济状况是有一定影响的;
(6)父母最高学历:经过假设检验,这一项不显著,说明影响不大;
(7)是否独生子女:这一项也是不显著,影响不大;
(8)人格测试:文章用的是大五因素模型(big five factors model),不是组里常用的MBTI模型。五大因素分别为:严谨性,宜人性,开放性,外倾性和神经质。通常认为严谨性和GPA正相关,神经质和GPA负相关,其他关系不大。但是A大学数据表明宜人性和GPA也是正相关。笔者自己测了一下,严谨性评分不高,但是好在神经质也不高,宜人性似乎还挺高。
(9)身体素质:文中指出体测成绩和GPA是正相关,没有详细说明其机理。笔者认为有两种可能性:1)体测高代表经常锻炼,说明生活规律,比较自律,肯定愿意多学习;2)身体好的人确实学习能力强。前者可能性更高。但是有一个非常诡异的现象:肥胖学生的GPA均值显著低于体重偏低或偏高的学生,后者的GPA又低于体重正常的学生。这个机理尚不清楚,但是胖子太惨了,又弱又丑。
这里提一个有趣的点,这篇博士论文指出A大学学生的就读体验和GPA呈明显负相关,高分组对学校的打分为2.91±0.62,低分组对学校的打分为3.13±0.57。其实成绩好的学生对学校评价更低并不很奇怪,考虑到A大学好像是一个双非一本,其中表现好的学生想必都想往高处走,然后就觉得这个学校垃圾的要死,要是当年去了个985自己会是现在这个样吗。所以,在互联网对骂中采用“你天天骂学校,想必混的很差吧”这种攻击其实没什么逻辑,越是混得好的人眼界高,就越感觉到学校的层次和各种操作对自己的前途造成了限制,必然会不满。
2.人口特征外的学生固有特征
(1)高考成绩:在那篇博士论文中,高考成绩和GPA是非常显著的正相关,这一点应该很容易理解,说明基础好,高中就养成了好的学习习惯;
(2)学生上学期成绩和挂科数等:这个特征在多篇硕士论文里被认为非常重要,这一点也是非常符合常识的,因为能够痛改前非发愤图强的人毕竟比较少。而且,不同科目的挂科之间是有一定联系的,一个硕士论文中算出了常见工科基础课程的挂科关联矩阵,如图2所示,其中挂过高数的人有一半多还要挂高代,触目惊心。这说明如果大一挂科导致基础不好会造成连锁反应。
图2 工科常见基础课程的挂科关联关系
02
学生学习习惯特征
很明显,上课出勤率高且图书馆或晚自习次数多的学生成绩高,多篇论文的数据分析都明确指出了这一点。比如北邮的硕士论文《基于校园多域融合数据的学生成缋及社交性分析》收集了各种数据,从中挑选出和学院排名的皮尔逊相关系数高于0.3的特征:工作日宿舍时长,晚自习次数,图书馆次数,上网流量和充值,有无情侣,社交活跃度,还有几门课的出勤(数字电路,DSP,工程数学,随机信号处理,通信电路),其中主要都是学习习惯特征。电子科技大学的硕士论文《基于学生行为的成绩预测模型的研究与应用》分析宿舍和图书馆门禁数据指出学霸通常都是早出晚归,在图书馆或教室学到关门。西电的硕士论文《基于校园大数据的学生行为挖掘方法应用研究》采用关联规则分析算法Apriori也得出结论:学习习惯好(出勤率高,图书馆学习和借阅多)+生活习惯好(早睡早起,规律吃饭,多锻炼,少上网)的人中有80%综合能力良好。
03
学生生活习惯特征
这一部分主要包括学生的吃饭消费,超市消费,上网(游戏视频)时间,锻炼时间,洗浴时间和次数,周末出门等。
(1)吃饭,洗浴,锻炼,睡觉:在许多篇硕士论文中都提到了这两类特征,重点关注的是早餐次数,吃饭时间规律性,周洗浴次数和洗浴时间规律性。成绩好的学生明显早餐和洗浴次数多也更加规律,通常早睡早起不熬夜,规律性锻炼。华中师范大学硕士论文《基于一卡通消费数据的学生成绩预测和朋友关系网络检测研究》对比了校内不同专业的平均早餐次数,如图3所示,并指出基地班和交叉班确实学习比较努力。这篇文章也给出了不同成绩的学生的早餐次数分布,如图4所示,可以看出优秀学生的平均早餐次数几乎是差生的两倍。这篇文章进一步采用早餐次数和消费行为的阵发性(表征规律性的指标)两个特征就能利用KNN预测学生的五档成绩水平,正确率高达80%。这说明生活的规律性代表学生的自律能力,自律能力是成为好学生的核心指标。西电的硕士论文《基于校园大数据的学生行为挖掘方法应用研究》中也指出,生活习惯差的人中有80%以上综合能力差,属于强关联,在这里生活习惯差也暗示了学生自制力方面的缺陷。因此,自制力或者自律能力是大学取得好成绩的核心竞争力,是非常重要的。
图3 华中师大不同专业早餐次数对比
图4 不同成绩等级学生的早餐次数分布
(2)消费:虽然消费行为的规律性可以像早餐次数一样表征自律能力,但是消费(吃饭,超市等)的金额对于成绩的影响是很难捉摸的。重庆大学的硕士论文《数据挖掘技术用于高校学生留级预警的研究》认为吃饭花钱多少和是否留级没有关联。电子科技大学硕士论文《基于学生行为的成绩预测模型的研究与应用》认为超市消费数据和成绩没有关联,但是笔者却从文中的图里看出了端倪。学生分数和消费金额的关系如图5所示,可以明显看出消费高于600块的基本全是均分低于80分的学生,均分高于80分的学生通常消费在400块以下。联系到前段时间组里一个帖子说他特别喜欢吃零食,这或许和图里的情况暗合。消费较高的学生通常喜欢吃零食(或者边看剧边吃零食),暗示了较差的自制力和较低的学习时间。这部分和上文提到的肥胖学生GPA显著低于其他学生也有关联。另外,天津商业大学的硕士论文《基于大数据的高校学生学业成绩预警分析》指出学习消费(打印等)也和GPA正相关,这个内容和常识吻合,不多细说了。
图5 电子科大学生计算机学院学生分数和超市消费金额的关系
(3)上网时间:通常认为上网时间,尤其是视频时间和游戏时间过长会使GPA下降。重庆大学的硕士论文《数据挖掘技术用于高校学生留级预警的研究》指出上网时间,游戏时间和视频时间都和留级有正相关关系。北邮硕士论文《基于校园多域融合数据的学生成缋及社交性分析》指出上网流量和网络充值都和学生排名有明显相关关系。天津商业大学的硕士论文《基于大数据的高校学生学业成绩预警分析》也认同网络流量和学生成绩有明显负相关,但是指出浏览特定类型网页的次数和成绩有正相关关系,比如求职网站,党政机关,互联网公司网站等。这个现象或许表明优秀学生更加关注社会,更加善于搜集信息。
(4)周末出门:天津商业大学的硕士论文《基于大数据的高校学生学业成绩预警分析》认为周末出门和学生成绩有较强的正相关关系。这个有一点反常识,但也许可以解释为学霸们通常比较生活规律,工作日就多学习,然后周末就规律出去玩,不会像笔者一样每天不出门,或者侧面反映出他们的交际能力较强,有朋友一起玩,不会像笔者一样总是一个人。图6为这篇论文对多种因素对GPA印象进行线性回归后的雷达图,可以看出周末出门情况的回归系数高居第二名。
图6 各种特征对于GPA影响的线性回归系数雷达图
04
社交特性
石河子大学的硕士论文《同伴关系对大学生学业成绩影响研究》研究了同伴关系和一些人口特征对成绩的影响,但是我很难看懂纯社会学的文章。总之就是同伴关系中的“自我描述”这一项(相当于自我认知的能力,认识自己在同伴群体中的定位,强的人比较有自我实现的动机,乐于发展人际关系,学习积极性高)和成绩是有显著正相关,但是这一项也和性别,学科,城市/农村,是否独生子女等特征有复杂的相关关系,这里就不介绍了,有兴趣的可以直接看那篇论文。
北邮的硕士论文《基于校园多域融合数据的学生成缋及社交性分析》通过WIFI探针等网络手段也进行了社交和学生排名关系的研究,朋友人数和排名的关系如图7所示,可以看出中等成绩的学生社交能力强,尤其是中上排名的学生社交最猛,差生的社交能力最差。这或许表明很多性格孤僻的学生成绩通常不太好。
图7 北邮通信学院学生排名和朋友人数的关系
北邮的论文还研究了是否有情侣和学生排名的关系,如图8所示。这张图的横坐标其实是有问题的,中上和中下的学生组有150人,但是好学生组和差生组都只有100人,所以看起来似乎中上和中下学生组情侣最多其实是错觉。在笔者估计下,前三组学生的人均情侣数其实差不太多,但是差生情侣明显较少,说明通常在大学里成绩很不好的学生找对象难。但是因果关系尚不清楚,到底是学习好促进了找对象还是比较会谈恋爱的通常学习好,无法确定。此外,情侣关系不是通过直接采访得到的,是通过技术手段估计的(分析学生是否经常出现在异性宿舍楼下,某两人校园轨迹重合度大不大,是否存在校园网账号借用等疑似亲密关系),可能存在偏差。值得一提的是,这篇论文分析了情侣之间的成绩关系,通常男生的排名比女生略高,并打印出了一些情侣的排名情况,如图9所示。可以看出确实通常男生排名略高,虽然笔者也不知道编号2的情侣是怎么回事。
图8 北邮计算机学院情侣在不同排名段的分布
图9 情侣中的性别成绩分析
05
总结与对策
从上文可以看出,学生成绩收到学生固有特征(包括人口固有特征,高考成绩,上学期成绩等),学习习惯特征和生活习惯特征的共同影响,其中后两者影响较大。但是学习习惯和生活习惯并不是相互独立的两种特性,从分析中可以看出良好的学习习惯(多出勤,多上自习,多去图书馆)和良好的生活习惯(早睡早起,规律吃饭运动洗澡,上网适度等)是学生优秀自律能力的衍生品。因此,自律能力是大学生获得良好成绩的核心能力。在社交方面,没有非常明显的证据表明社交能力或是否谈恋爱会对成绩造成影响,但是可以明显看出成绩差的学生在交朋友和谈恋爱方面的平均表现明显低于其他学生。
对策:
(1)加强自律能力:可以通过一段时间的自我强迫养成多学习,规律生活的习惯,之后就可以依赖这种惯性,具体策略包括学习时候少看手机(可以采用frost之类软件辅助),不能经常买零食吃,强迫早睡早起(即使第二天没课),每天或者没两天一定要去洗浴等。这些可以通过一个一揽子学习计划实现,比如规定每天都要早起(8点),晚上上自习到至少9点,然后去洗浴,回宿舍可以上网娱乐到11点或者熄灯,然后上床睡觉。
(2)进行体育运动:可以选择打球,跑步这些,最好是规律性运动,一时兴起式运动难以坚持。规律运动不仅是加强自律能力的补充,同时也可以是比较超重的同学对抗“肥胖学生GPA显著偏低”的有力武器,这样可以让自己又强又帅/美,不会陷入又弱又丑的噩梦。
(3)社交能力:虽然天天社交未必能提高成绩,但是从“差生交朋友和谈恋爱的能力显著较差”可以看出,适度社交必不可少,拥有良好的恋爱关系也可以让自己更快乐,学习更积极。可以每周末约朋友或者男女朋友出去玩,就可以实践“周末出门比例和学习成绩的显著正相关”。
希望正在上本科或者即将上本科的同学看完这篇文章能够有帮助,不要像笔者一样成为几乎完全的反面教材(除了上自习图书馆还算多,不翘课以外,天天熬夜修仙,没课下午起床,懒得出门和社交,从不运动,天天大量上网,超市零食消费极高,从来没有女朋友),现在回顾起来心有余悸,幸好当年天可怜见保研最后一名,但是最后依旧失学失业,在废物组和大家相见。太难了。