如何进行问题的分析和数据的获取 - 数学建模研究过程指导(精编版) 02

向上滑动阅览说明及建模指导目录 

说明:此文稿为朱浩楠老师于2018年11月-12月北京地区联校数学建模活动的课题研究阶段中,每天一篇发布给各课题组的研究方法指导文件的汇总。为方便更多的同学参考使用,现调整为正序后通过遇见数学公众号发布,版权归朱老师和遇见数学公众号所有。

目录

1如何开题

2如何进行问题的分析和数据的获取

3挖掘情境中数学模式的两种方法

4连续模型的使用范围、建立和求解方法

5从连续模型到离散模型&离散模型的常见类型及其研究方法

6确定性与不确定性

7以支持向量机为例谈机器学习的本质

8以神经网络为例谈深度学习的本质

9到底算法能不能算作数学模型或研究成果?

10科学中的香芬迷雾

11问题重述与基本假设部分的检查表

12符号约定部分的检查表

13模型建立部分的检查表

14模型求解部分的检查表

15模型分析部分和参考文献部分的检查表

16数学建模论文摘要的写作建议

17从高中数学体会数学概貌和数学建模

18感性认知如何驱动理性认知

19我们应该抱着什么心态去学习数学与科学

20新生代青年在变革时代中的机会与责任

如何进行问题的分析和数据的获取

研究方法指导2

1. 问题的分析绝不是将问题照抄一遍,或者简单的元素提取。问题分析的目的是找到问题的切入点。问题的分析过程中需要思考如下的问题并解答,只要如此,问题的本质就会逐渐浮现。

  • 是否找到问题的关键词(不止一个)?

  • 是否清楚问题中所有提到的概念?

  • 是否能分辨问题主体是离散型问题还是连续型问题?

  • 是否想清楚将哪些量看作变量,哪些看作参数,哪些看成定值?

  • 是否想清楚最后结果的呈现方式?

  • 是否想清楚数据的可能来源?

  • 是否收集并整理出历史上相关问题的研究进展?

  • 是否能从前人的研究中发现可以借鉴的地方?

  • 是否能从前任的研究中发现可以改进的地方?

  • 是否想清楚可能会用到什么层次的数学?自己的数学知识是否够用?如果需要临时自学,载体是什么?

  • 是否需要用到跨学科知识?需要用到哪些学科?如何查找这些学科的相关资料?

2. 没有数据往往是同学们一开始尝试解决实际问题时遇到的一大困难,下面我以三个不同类型的课题来讲一下数据的获取(采集/检索/调查)。

(1)以“课题编号0308 如何设计座位能让同学更轻松地看到黑板”为例谈数据采集。

显然这个课题不可能研究全国所有学校的所有教室,因为不同学校的不同教室的空间大小、桌椅数量、方向方位都有差异。当限制这个问题在自己所在学校的某个教学楼的某几种特定类型的教室时,研究才变为可能。面对具体化后的问题,“采集”就是一个获取数据的较好方式,因为面对具体的教室,我们完全可以拿着尺子去测量(现在也有利用手机摄像头的距离测量APP)教室、黑板、桌椅的尺寸。

(2)以“课题编号0703 人口结构的变动对于房地产价格和数量的影响”为例谈数据检索。

这个问题是一个比较宏大和深刻的问题。人口和房地产都是国计民生的大事,所以国家肯定会有相关的统计记录。一个可靠的、官方的数据来源是国家统计局官网。

国家统计局数据中心网址:http://data.stats.gov.cn/

在上图所示搜索框中输入“人口结构”和“房地产价格”,可以显示出如下统计数据:

(3)以“课题编号0312 同一间晚自习教室,自习人数如何影响自习效率”为例谈数据调查。

只要确定了是哪几间自习教室,自习人数可以通过“采集”来完成。但是自习效率这件事就是比较主观、引人而异的事情。类似于这样引人而异的事情,个体会造成统计差异,所以需要具有一定量的样本,利用统计学的办法来让这些差异明晰化,并且分析数据的整体平均趋势。例如:可能我们希望能够获取横坐标为自习人数,纵坐标为自习效率的一个平面点集并用相关函数拟合处一条曲线来反映综合趋势,那么这些平面点集的获取就成了关键。一个行之有效的方式就是利用“调查问卷”。

调查问卷的制作工具:问卷星,网址:https://www.wjx.cn。优点:免费、使用便捷、学习成本低、可以通过手机实时查看提交进度和结果统计、可以将调查结果汇总为excel数据表下载。

设计调查问卷时需注意:

  • 避免统计陷阱:我们在高中课内会学习基本的统计方法,其中抽样调查是第一节内容,需要自习体会抽样调查的三种方法及它们之间的关联、优缺点。避免因为设计或投放缺陷而造成的统计谬误。例如:在这个课题中,如果我们仅仅是找了一个“学霸密集型”的自习室进行问卷调查,得到的结果和“非学霸密集型”的自习室得到的结果肯定不同。同时教室大小、布局的不同,也会造成对统计结果的影响,所以还需控制这些变量(控制变量法是理、化、生等实验科学的基本思想,科学的思想应学会迁移)。

  • 避免叙述不清:一个好的调查问卷对语言功底的需求不亚于一篇小作文,如果问题的描述让填写问卷的人无法理解,那么肯定填写起来就会出现谬误。一个好的方法是:当调查问卷制作完成后,课题组成员反复互审,并用前5-10份调查问卷作为“试运行”,并询问填写调查问卷的人的感受,之后对调查问卷进行修正改进,再正式投放。

  • 避免选项互相纠缠:我以前填写过不少调查问卷,发现很多调查问卷的问题相互包含或矛盾,例如:先问了是否喜欢喝可乐,又问喜欢喝什么味道的可乐,试问如果选择了不喜欢喝可乐,那么后面的问题又有什么意义呢?这种情况下,如果是用电子问卷就会方便很多,例如问卷星,其中可以使用“逻辑跳转”功能。

  • 减少不可控的文字输入:能用选择尽量不要用填空。因为选择题有备选选项,相当让于填写问卷的人在填写的那一刻就将他的结果按照你给出的备选选项进行了分类,这样就省去了面对填空题的复杂分类的麻烦。实际上如果是语言文字的描述,很多时候也无法有效分类。当然你可以在这里选择使用一些人工智能相关的语义识别工具,但是这样一来课题的重心就发生了偏移,显得头重脚轻。而且据我所知语义识别目前的对文段进行主题分类的能力还很薄弱。如果有同学对语义识别感兴趣,可以参考文档:https://wenku.baidu.com/view/a418ea19ac02de80d4d8d15abe23482fb4da02ca.html。

设计调查问卷是一项艺术,我在百度文库上为大家找到一个还不错的将调查问卷制作方法的PPT,链接如下:
https://wenku.baidu.com/view/c6a1c3e90975f46527d3e13f.html。

(0)

相关推荐