麻省理工学院金融学科研感受

原标题:麻省理工学院金融学科研感受

山东大学学生参加MIT金融学科研总结

第一周

周一

今天,初见导师,外国上课方式是学生自己成组做项目,每周与导师见面几次回答问题并且讲一些课,主要是解决项目问题可能用到的方法;

因为第一天到,所以我问了项目是什么方面的内容,导师讲课听的我一脸懵逼,完全不知道讲的是什么,但是我努力去听,还是听懂了一些有关于IV model,接手的是两个项目,一个是ongoing的大组项目,一个是处于起步阶段的小组项目。

第一天有同学邀请我加入他们组,所以就向导师申请加入他们组,然后直接开始了他们小组的项目,任务是从网上找到美国各个county的龙卷风location、date、伤亡等数据,并且进行整合,任务不算难,我们花3个小时就做完了。

住家东西都很好吃,英语交流还算流畅。

周二

今日,下午3:00的meeting,老师提问了我三个问题我只回答上了一个问题,主要是对项目不是很熟悉,并且对老师跳跃性的讲课不是很习惯,所以要增加学习强度,趁着明天没有meeting多学一点东西,晚上是跟大组一起做飞机直航和两国公司业绩有什么影响的课题,进展还算顺利,大家都非常努力。

周三

今天没有上课,今天的大组任务是clean data,并且将数据merge 起来,由于data中存在各种问题,比如存在各种奇怪符号变成string格式的数值,数值明显不合理等问题。

由于对stata不是很熟悉,所以我花费了一些时间在网上学习并与组员交流,最后我还是完成了大部分工作,但细节上仍有瑕疵。

小组的任务比较简单,我要做的任务只是写一个read me的文件来说明我们选用的各个变量数据的具体含义。

周四

今天上课讲的是回归的较为基础的内容,是老师为了引出后面内容做的铺垫。经过几天的学习,我也开始逐渐理解PSM、DID等方法,晚上是更精细地处理昨天的数据,就是昨天工作的完善,我负责帮助完成了2010、2014、2015年的data clean 工作。

周五

今天是比较闲的一天,大家聚了餐,组织了团建,就回去自己学习自己需要的内容,比如我学了stata的一些基本操作指令。

第二周

周一

今天熟悉了bartik IV,由于影响企业firm growth的因素中GDP有内生性问题,所以需要用bartik IV来处理,这部分工作主要由第一组完成,我只稍微做了一些了解,了解了bartik IV的公式并阅读了一组完成的代码。

我们组今日的任务依旧是编写PSM的code.

周二

今日我们开始着手merge 我们的小组项目中的tornado数据和 housing value数据,但是出现了merge 不上的情况。

我们发现是tornado 影响多个州和county,需要将tornado数据拆成单列state和county的panel data.

拆完之后我们发现housing value数据中的state是简写,所以又在tornado数据中加了一列简写数据,但最后还是只merge了一些数据,究其缘由我们认为是housing value数据中state数据不全,还需要找更多的数据,今日还是比较忙碌的。

周三

今日上课讲了lasso方法来处理ordinary linear regression 对于采样数据p不是远大于变量数n的overfit的问题。由于下星期我们组中有三位成员要走,所以教授邀请大家聚餐,最后合影留念。

周四

今日教授去NBER参加一个会议,所以让我们自行brainstorm研究项目如何向下进展,并且给了我们一个stata的do.file和一个dataset,让我们用R语言复现出来,并且熟悉DID.

周五

今日依然是完成昨日的复现工作,用latex呈现结果,并熟悉difference-in-differences (DID) estimation.

第三周

周一

今天组里走了三个人,只剩我和一个高中生还有一些online的同学(online的同学由于时差问题很难安排工作),于是我不得不开始接手主要工作,然后每个小组都有一个leader,所以我就当了leader,小组工作由于是全程参与的所以交接的很顺利。

由于上个星期出现了tornado和house value数据 merge不上的情况,今天的工作就是排查,我找出了前面大家都没有发现的问题,就是state数据中出现多余的空格。为了更清晰地观察tornado和house value的分布,即将数据分布可视化,老师建议我们使用QGIS.

大组开始试着构建回归模型。

老师开始讲machine learning 相关知识,讲了lasso回归,确实有点难理解。

周二

今天学习了一天QGIS.

周三

今天尝试着用qgis和stata做出了tornado和 house value的distribution图。上课老师开始讲随机森林等知识,回去学习了一下还是有难度。

周四

今天老师说在与他人合作过程中不能只有一个结果,需要documentation来记录自己的workflow并且要让别人可以replicate your work,这在以后的工作中也是非常重要的,于是我写了一个非常详细的documentation.

大组都是一些exploration,开始尝试用各种变量回归,老师让我们自行探索。

周五

今天大组做出了一个比较合理的模型。

然后我们小组今天继续向老师解释我们的工作,由于文件名太乱导致了老师replicate困难,所以写了documentation后又用xmind画了一张图把workflow更清晰地展示出来。

我也学到了,在一个多人合作的项目中,不能只靠自己一个人需要照顾到他人的工作,即应该把变量名、代码注释清楚,把workflow记录清楚,文件名也要指向明确,replication也要写清楚,总之是要把自己完成的工作详细的表述给他人,不知不觉锻炼了我与他人的合作能力。

第四周

周一

大组作业,我们优化了一下原来的DID模型,将一些变量换成log形式,并尝试进行了propensity score weighed regression,整体效果还可以。

小组我们开始自己做了一些exploration,比如给tornado添加一个severity变量描述tornado的严重程度(severity变量是通过其他变量的线性组合得出的),然后我们collapse了tornado datasets。

由于来了新同学,而我们下一周就要离开workshop了,所以我开始教新同学一些stata和r的基本指令,并且跟他们介绍了项目,to make a smooth transition.

周二

因为我发现我们小组这个项目这个用DID和RDD都不是很合适,所以今天老师给我们了指了一个方向(即给了我们一篇paper),使用DID with multiple time periods来做。由于论文较长所以尚未读完。

周三

今天老师给了我们一篇paper,要求每个小组周五之前要提交一篇review,review中要从自己的观点找出paper中存在的一些漏洞,并对paper进行攻击。说实话这个工作还是相当有挑战性的,因为作者是一些名校的教授,而我们只是刚刚涉猎statistics和econometrics的本科生和高中生,所以提出我们自己见解的时候也是畏手畏脚,当然老师鼓励我们勇敢质疑,他说只有不断地质疑才能让一篇paper更加完善。

周四

今天一直在看paper,从模型本身到定义的公式,我们尽力地找漏洞,也算是用尽浑身解数。

周五

由于这是我在workshop中的最后一天我今天继续给新同学介绍stata和r,并且我把各种文件全部放到dropbox中,写了一个xmind说明了我们这些天做了什么工作,接下来工作的大概方向。

这些天收获还是颇丰的,前两周我作为组员,从新进来一点不了解项目也不是很会stata和r,慢慢了解了项目并学习了stata和r,这期间我锻炼了与他人的交流能力,还有快速学习能力。

后两周作为组长,我开始学会分配任务,并且写了许多documentation,还学习了QGIS的一些功能,并且教新成员如何使用stata和r,这锻炼了我的领导能力、团队协作能力,加强了我的自学能力,并提高了我带新人的能力,整个项目虽然累,但还是非常开心的,交到了很多朋友也提升了自己的能力。

- THE END -

想要了解名校科研详情,可以+名校科研-科研顾问-vx:123911280,进行咨询

或关注我们的公众号“researchproject”进行了解返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
免费获取
今日搜狐热点
今日推荐