2019年第一季度线上科研(UCSD导师:理论+实操)|计算机科学背景提升:机器学习之线性回归预测房价趋势
线上科研,可以省去自己找暑期科研的时间和精力;同时也省去了出国自备干粮的科研之旅。不出国门,在国内参与国外导师的科研,通过后获得国外导师极具个性化的推荐信,尽量小的影响你的平时在校学习。经济又省时!
项目日期
2019年2月16日-2019年3月30日
30课时/6周集训,利用线性回归分析现实问题。
学习时间 : 6 周
每周除课堂时间外自主学习 8 小时
语言 : 英文教学服务
加州大学圣迭戈分校导师全英文授课
课程简介
课程从最基本的回归模型开始,覆盖机器学习基础模型和方法。导师将带领学生深入了解监督学习与无监督学习的概念、理解机器学习方法所需的基本数学知识,并介绍机器学习常用的编程工具和函数库,引导学生使用机器学习方法分析现实生活中的数据集。
学生将在案例研究的背景下学习以上概念,从房子的平方英尺预测房价,学习如何构建单个变量(如“平方英尺”)与响应变量(如“房屋销售价格")之间更复杂关系的模型。这包括将多项式拟合到数据或响应值中的季节性变化等内容,以及如何台并多个输入变量(如“平方英尺”、“卧室”、“浴室”)。课程后期学生还将学习如何评估机器学习模型,如何构建端到端的机器学习系统,以及如何处理大规模数据。
课程模式
10课时的主导师Lecture:UCSD教师讲解机器学习核心要点。
6课时1对1Office Hour:扫除你上课时积累的所有疑难知识点。
12课时的Mentor Session:指导小组完成实战项目。
2课时的成果汇报Presentation:将你所学知识呈献 给导师及所有学员,获得导师点拨和反馈。
24小时内答疑回复:第一时间解决遗留问题。
全程助教辅助模式:课程期间配双语助教全程辅助教学过程,不让任何一位学生拉下进度。
班主任跟踪监督模式:不让懒惰拖延成为你成功路上的绊脚石。
师生比例1比3:小班教学,人人都能与大佬沟通熟悉,打通人脉。
导师介绍
Amarnath G.美国加州大学圣迭戈分校 超级计算机中心 科学家
印度Jadavpur大学计算机科学博士
美国德克萨斯大学生物医学工程专业硕士
Amarnath主要领导UCSD超级计算机中心(SDSC)数据和知识系统小组的高级查询处理实验室,他的研究方向主要包括科学数据建模,信息集成,多媒体数据库和时空数据管理。
适合人群
课程需要学生具有一定Python基础,并熟悉基本的统计学和线性代数概念。
了解机器学习的基本概念。
对机器学习或人工智能感兴趣且希望掌握该领域知识的学生,尤其是未来有跨专业想法或者希望在自己的领域应用机器学习算法的学生。
课程大纲
第一周
机器学习方法介绍你将学习:
●监督学习
●无监督学习
●机器学习的数学基础
线性方程组的解与函数的极值问题
单变量/多变量函数优化
●单变量/多变量梯度下降法
第二周
线性回归你将学习:
●线性回归问题
使用梯度下降法解线性回归问题
向量化表示
●数据处理与实践
特征尺度变换与均值标准化
模型与代码纠错
第三周
回归问题详解
你将学习:
●多变量/特征回归问题
多变量梯度下降法
正则化优化问题
●二元分类方法介绍:逻辑回归
●数据分析实验框架
第四周
分类问题
你将学习:
●逻辑回归
熵与信息论及多类别分类问题
损失函数、决策边界与优化
分类问题正则化、过拟合与欠拟合
第五周
无监督学习与相关话题
你将学习:
●主成分分析
●K-Means聚类算法
第六周
机器学习知识补充
●随机森林
●核方法支持向量机
●神经网络
●Xgboost
实战内容
学生将根据房价数据集进行线性回归的练习,并利用房地产数据库创建模型来预测:
1.回归误差 或
2.分类问题
注:项目将使用Anaconda和Python 2.7, 系统需要Windows XP或更高版本,64位macOS 10.9+或Linux,以及5GB以上的磁盘空间来存储Anaconda和数据。
学员作品
以下是学员的作品(全部项目的部分作品示例):
结业后获得
一封权威的推荐信
UCSD导师亲自为你撰写推荐信,为你未来的升学或就业提供一块重要的基石。
一份不一样的工作经历
值得写进简历的美国名校项目实践成果,与来自UCSD的导师一起工作、交流。
一种不一样的可能
真人沉浸式教 学,创造个人在这个领域发展的可能性。
一种不一样的眼界
全面提升自己的专业背景和知识水平,开阔视野,跳出舒适圈,得到顶级专家的带领和指导。
推荐信
为学员提供个性化的推荐信(全部项目的部分推荐信示例)。
与一般的推荐信用笼统的描述比,我们的推荐信是个性化的、唯一的,只适合你,与你参与项目的课题紧密相关。
推荐信样例如下:
结果证书
下边是培训结果证书样例(全部项目的部分证书示例):
往期学员
以下是全部项目的部分往期学员情况:
学员信息:
个人标签:爱旅游、爱食物、爱潮流的 cool boy
本科:香港理工大学 商业管理
参与课程:《华尔街金融 IPO 案例分析远程科研项目》
上榜理由:优秀学员 推荐信
项目介绍:
团队项目——IPO 案例分析:一个虚拟的休闲餐厅——主要在美国经营特色亚洲菜,正在寻找一个投资银行,就公司可能进行的首次公开募股(IPO)向公司管理层和董事会提供一些建议性的意见。学生将被假设为一个投资银行家,通过分析餐厅的财务信息和运营情况、创建估值模型、完成无杠杆贴现现金流分析(“DCF”),编制一份估价资产负债表等一系列任务来帮助这家餐厅完成 IPO。
最后,学生将进行小组答辩,汇报项目成果,获得导师的点评,并完成一份学术报告。
成果展示:
学员信息:
个人标签:内向而不乏生活热情的萌系少女
本科:中山大学 地理信息系统
参与课程:《参与课程:《18 春-哈佛导师数据科学入门课程(初中级)》
上榜理由:优秀学员 推荐信
项目介绍:
该项目将由哈佛高级讲师远程授课,以 project 的方式带学生掌握数据科学入门知识,主要内容包括: 纽约出租车指派优化问题,希格斯玻色子分类问题,深度神经网络等问题。
课程将会融合数据研究与调查中多方面核心知识点:数据收集——如何通过数据对比、筛选、提炼找到最精准的数据组合;数据管理——如何迅速收集到最可靠的数据;探索式数据分析——如何提出合理的假设并且建立对数据判断的敏锐直觉;对数据走向的预判和统计能力以及如何把数据形象化同时书进行面化的总结。
最后,学生将进行小组答辩,汇报项目成果,获得导师的点评,并完成一份学术报告。
成果展示:
学员信息:
个人标签:我是学霸,我是团队领袖,项目对我 So easy
本科:南京师范大学
参与课程:《哈佛导师数字图像处理远程科研项目》
上榜理由:优秀学员 推荐信
工作内容:
学生将在老师课程与组会讨论的指导下,学习空间和频域数字图像处理的基本原理,压缩和最重要的图像分割技术。分类区别传统的 1-D 和 2-D 信号与图像处理的基本原理,学会如何挖掘图像特征,分析数字图像,并识别场景中感兴趣的对象和其他信息,在未来可应用于机器视觉和机器人技术中,以及从工业和医疗设施产生的公共和私人网络上可用的大量分布式图像和视频数据库中提取相关信息。
继而基于给定的数据库,编写一个完整程序,完成对数据库中图像特征的挖掘。例如学生将被要求使用他们自己的相机拍摄城市景观或使用细胞或组织结构的医学图像,并使用分割技术来分析它们,挖掘图像特征。
成果展示:
学员信息:
个人标签:逗比贪玩爱音乐的建模大神
本科:广州大学 应用数学
参与课程:《UCB 导师数据科学与机器学习远程科研项目(中级)》
上榜理由:优秀学员 推荐信
项目介绍:
该项目由加州大学伯克利分校高级讲师远程授课,学生以团队合作的形式使用“机器学习”的方法对虚假
新闻数据库进行初步的分类与解析,通过 Python、R、Anaconda 等工具进行纠错与模型改进,在这过程中,学生将学会训练基本的分类器(classifiers),能够调整机器学习模型的超参数(hyper-parameters),
初步掌握自然语言处理的方法,了解机器学习中的常见错误与难点。
最后,学生将进行小组答辩,汇报项目成果,获得导师的点评,并完成一份学术报告。
成果展示:
学员信息:
个人标签:知心哥哥,团队领袖
本科:中国科学技术大学
参与课程:《哥伦比亚大学导师:基于面部识别数据的机器学习科研项目》
上榜理由:优秀学员 推荐信
项目介绍:
同学们将在六周内完成一个基于社交平台的实时面部识别技术自动系统,了解并掌握机器学习这一看起来高深而尖端的工具在现实世界中的应用。机器学习在我们生活中的普遍程度已经大大超乎了我们的想象,音乐 App 总能推荐到你爱听的歌,导航软件带你避免交通拥堵的路段,这些都是机器学习的一些成熟应用场景。在本项目中,学员们将学习机器学习基础原理以及数据处理的方法,包括数据分类、回归的回归与模型的搭建与检测,并通过六周的时间,完成一个基于智能手机的实时面部识别系统。
成果展示:
学员信息:
个人标签:我的能力与我一样美丽
本科:北京邮电大学
参与课程:《Machine Learning on Fake News Detector》
上榜理由:优秀学员 推荐信
项目介绍:
自2016 年总统大选以来,主导政治讨论的一个话题就是“假新闻”问题。一些政治学专家认为,显著的偏见和/或不真实消息的泛滥影响了这次大选。假新闻日益成为社会中的威胁,它通常是为了商业利益而产生,以吸引观众并收集广告收入。
参加该项目的学生将以团队合作的方式使用机器学习尤其是深度学习、神经网络算法完成关于“假新闻”的探测。该项目的目标是建立一个分类器,可以预测一个新闻片段是否只是基于它内容的虚假,从而从自然语言处理(NLP)的角度来解决这个问题。比较来自不同模型实现的结果,并对结果进行分析。
成果展示:
学员信息:
个人标签:思想独立爱加班的美女律师
本科:北京大学 法律
参与课程:《中国石油天然气公司首次公开募股(IPO)案例研究》
上榜理由:优秀学员 推荐信
项目介绍:
学生将在哥伦比亚大学导师的带领下,对中国三大石油公司 “中石油”、“中石化”和“中海油”(又称“三桶油”) 的 IPO 历史进行整理与分析,深入的挖掘 IPO 给企业发展带来的影响,从而对 IPO 这个重要的金融资本运作方式产生深刻的认知。
另外,针对油气企业的 IPO 研究,对于理解 IPO 的过程及影响极具代表性 。
最后,学生将进行小组答辩,汇报项目成果,获得导师的点评,并完成一份学术报告。
成果展示:
项目费用
项目费用:RMB19800 项目费用主要包括项目的培训课程费,场地及设备使用费,讲师课酬,导师费用等。
咨询报名
预报名和咨询地址:
http://gaoduanqun.mikecrm.com/U4mjIGV