>科技>>正文

一个数据人的2018

原标题:一个数据人的2018

王阳明先生说:“知行合一:知之真切笃实处即是行,行之明觉精察处即是知。

2018年的最后一天,我来写下一个数据人的2018

2018年,上半年在新零售行业里面做着算法工程师,利用新零售的领域知识,统计学和机器学习的方法,文本分析和挖掘的手段,解决预测类,推荐类和画像类等相关问题。2018年下半年重新回归到金融科技行业,任职大数据算法工程师,利用过往的经验,结合具体的业务问题,利用内部和外部数据,结合统计模型和机器学习模型,解决一系列风控(用户风险特征的挖掘,用户的申请评分卡,用户的欺诈规则挖掘等)问题

在数据世界的思考和践行中,我逐渐开始构建自己的认知体系,把其归纳为三个环节,形成闭环,相辅相成。如下图:

我会从业务与数据,算法与模型,策略与价值三个方面来看数据世界。马云先生说,”一切业务数据化,一切数据业务化“,我很欣赏。当今的产品或者商业模式,业务流和数据流,相辅相成,只有形成一种正向的闭环,才能脱颖而出。有了业务和数据了,利用数据分析问题和解决问题,利用数据学习到数据背后的意思,就有了根基了,接下来的算法和模型,可以看做工具箱和方法论,都是为之服务,不管是传统的统计学,还是时下的机器学习,人工智能,一旦从数据中学习到规律或者洞见,最后要落到策略点,即能够正确地实现决策或者指导行动,以创造价值或者强化价值。并且,这是一个不断迭代和优化的过程中。这个闭环进程中,你会发现,要让数据变现,让数据创造价值,地基要打扎实,换句话说,就是数据的收集和加工(data collect and process)就应该上升到公司的战略层面,这当然需要组织和制度,还有协同来保驾护航,以解决数据孤岛,实现数据归总与整合。

因而,在启动和实施一个数据科学项目的时候,我以及我们的组员,会深入地思考如下问题:

  • 明确问题的定义和具体的目标,换句话说,要解决什么问题,为什么要解决这个问题,关于解决这个问题,行业里面目前是个什么均值水平,我们的预期是什么。
  • 展开数据的收集,数据的理解和数据的准备工作,通俗地讲,为了解决好这个问题,我们需要那些数据集,如何获取这些数据集,这些数据集的元数据是什么情况,这些数据集有什么特性,这些数据集的质量合理和过关吗;为了解决好问题,需要对数据集做哪些预处理操作。
  • 根据具体的问题和实际的数据,确定合适的模型和相应的算法,然后选择合适的工具进行实现和工程化,并且在关键指标的评价下,快速地做模型选择,模型优化和模型迭代的事情。比方说,我们做一个申请评分卡,我们当先会考虑利用WOE编码和LR算法来设计和实现一套标准评分卡(优势:简单,好解释,易于实施等),并且利用KS和AUC来评价模型的区分好人与坏人的能力,利用PSI来度量模型的整体稳定性和入模变量的稳定性,同时,还要考虑入模变量与实际业务的一致性(入模变量能否合理的解释实际业务)。
  • 模型或者算法的实施,和相关部门的同事协同完成,或者做成服务模式,提供接口供其他方使用,模型一旦实施后,伴随着时间的推移,监控这种动态的变迁,就尤为重要。通过监控系统,一旦发现关键指标出现预期不符合的波动,就需要启动相应的预警措施,以快速地定位准问题和解决好问题。
  • 我们各位成员一致认为,这不是一个一劳永逸的过程,而是一个不断迭代和优化的过程,在这个环节里面,始终要把业务,数据,算法,策略,价值做综合性地考虑,以最大程度地实现所期望的目标值。

塞翁失马,焉知非福 ——《淮南子·人间训》

2018年,有幸认识一批了良师益友,在此匿名谢过了。你们对我的教导,帮助,评判,祝福,我都历历在目,而我始终相信,这一切都是最好的安排,感谢这一路上过来所遇到的人,所碰到的事情。正是这些人和这些事,让我对数据世界的探索又前进了一些。一旦你开启了感谢模式,生活中所有的一切都会转化为你成长路上的推力。承推力而上,以实现“欲穷千里目,更上一层楼”佳境。

  • 当你的工作做得不够出色时候,当你的思维方式比较僵化,当你的表达欠缺生动和接地气的时候,有人给予你相应的意见,你应该感谢他(她)。因为这些意见,会帮助你在下一次如何改进和提升,这就是成长,这也是发展。
  • 当你领头者给你分配了新的任务,当你的客户给你反馈了问题或者表达了其它诉求,当你的合伙人和你分享了新的想法,你应该感谢他(她),因为这些任务,问题,诉求,想法,促使了你要更进一步地深度思考,并且要做出进一步优化的行动,谋取更好地结果。这种过程和行为,创造了“细水长流,日日苟新”的模样。
  • 当你从低谷中走出来的时候,当你的所作所为得到认可和肯定的时候,当你创造和传播的东西有利于他人的时候,当你继续坚持学习新的东西的时候,你应该心存感谢,既要感谢他人,又要感谢自己。人在路上走,给自己一点鼓励,让自己有个好心情走路,欣赏路上的好风景,逐渐地你会感受到,“活着就是幸福”,活好,也就是自然的事情和追求了。

你会在朋友圈里面看到复旦大学的一位副教授陈果博士的视频和分享,引起了许多人的共鸣和点赞。陈博士分享了一个案例(case):

一个研究生同学在食堂遇到她,问她:有人喜欢你和自己喜欢自己,那个更重要?陈博士的回复:两个都重要,若是不能兼具,自己喜欢自己更重要。

在此,我想问,“你喜欢你自己吗?

我想说,我喜欢我自己,逐渐地,我学会了和自己独处,和自己谈心,也开始懂得和践行如何照顾好自己,让自己更加的真实和率性,让自己的内我不断的外显。我在数据世界里面思考和践行,这是我聆听自己内心声音所做的正确选择,它告诉和启迪我,根据我这个人的实况,我应该要去专注从数据中学习,利用数据来分析和解决问题,努力地去实现“做数据世界最好的厨师”的目标。

王阳明先生说:“人生大病,只是一个“傲”字

我喜欢王阳明先生,深受王阳明先生的“致良知和知行合一”的思想影响。在数据的世界里面,我们既要实事求是,又要知行合一,积极地利用各种知识和方法,从数据中出学习到规律,模式或者范式,然后客观地去认识和评价这些东西,并正确地应用这些东西。既不浮夸,又不保守,而是以一颗敬畏的心,以一种严谨而细致的态度来对待数据,探索数据和应用数据。

实际你会发现,一个人,没有什么好骄傲的。古人说的好“山外有山,人外有人。”一旦你动了骄傲的心念,就意味着你目光开始短浅了,见识开始狭隘了,进步开始停歇了,发展开始受限了。正如巴菲特的铁杆搭档查理的思维方式,逆向思维。不骄傲,而是平和地接纳所有的知道和不知道,对于知道给予归纳和总结,让其不断上升到更高的台阶,对于不知道用各种方式方法进行补充,这些方式方法,可以是阅读书籍,可以是看最新的论文,可以是编写和修改代码,可以是聆听一门课程,可以是学习和总结一份教程,可以是一次组内讨论,可以是一次开放(open)的分享等等,选择适合自己的方式,让自己一次次的登高,并且依旧谦卑于怀。

感谢2018年,我是数据人王路情,一个在数据世界求索之人。面对即将过往的2018年,我碎片式地写了以上内容,且从网络上借用了应景的配图,再次感谢啦。你会发现,一个人既要学会与自己相处,同时,又要懂得与这个世界相处。

文章结尾之处,像往常一样,让我们一起思考几个有意思的问题:

  • 2018年,你有进步吗?
  • 2018年,你最初的心愿和最终的结果有多少偏差?可以考虑因果分析或者相关分析了
  • 你喜欢自己吗?你在数据世界看到了什么?诚邀你来数据人网分享,我们都是数据人。

你有任何想分享的,请留言。返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
投诉
免费获取
今日搜狐热点
今日推荐