>教育>>正文

【Book】这些是学习现代统计学最好的书,而且都是免费的

原标题:【Book】这些是学习现代统计学最好的书,而且都是免费的

编者按:统计学习两本经典书籍,ESL和ISLR,建议先阅读ISLR,再阅读ESL,并用R语言做时间,以理解统计学习(SL)的理论和方法。

早在计算机出现之前,统计学就出现了。如果情况正好相反,情况就会大不相同。

大多数人在高中或大学学到的统计来自于用笔和纸计算的时代。斯坦福大学统计学教授罗伯特•蒂布希拉尼(Robert Tibshirani)表示:“当时可用的计算技术限制了统计数据。”“人们使用某些方法,因为这是一切的开始,也是他们习惯的。很难改变。”

上过统计学导论课程的人可能认识“正态分布”、“t分布”和“最小二乘回归”等术语。我们之所以了解它们,很大程度上是因为,用20世纪初可用的工具计算它们非常方便。我们不应该再学习这些东西了——或者,至少,它不应该是我们学习的第一件事。还有更好的选择。

作为一名前数据科学家,我经常被问到“学习统计的最佳方法是什么?”我总是给出同样的答案:阅读《An Introduction to Statistical Learning.》。然后,如果你完成了这些并想要更多,阅读《 The Elements of Statistical Learning》。这两本书是由斯坦福大学(Stanford University)、华盛顿大学(University of Washington)和南加州大学(University Southern California)的统计学教授撰写的,它们是我发现的关于如何利用现代技术进行统计的最直观、最相关的书籍。Tibsharani是这两本书的合著者。你可以免费下载

数字处理器

这些书基于“统计学习”的概念,它是统计和机器学习的结合。机器学习领域就是把大量的数据输入到算法中,从而做出准确的预测。Tibshirani说,统计数据也与预测有关,但也与确定我们对某些输入的重要性有多大信心有关。

编者按:统计学和机器学习的异同。

这在医学等领域很重要,研究人员不仅想知道一种药物是否有效,还想知道它为什么有效。统计学习是指从机器学习和计算机科学中吸取最好的思想,并解释如何通过统计学家的镜头来使用和解释它们

这些书的美妙之处在于,它们让看似不可理解的概念——“交叉验证”、“逻辑回归”、“支持向量机”——变得容易理解。这是因为作者关注的是直觉而不是数学。与许多统计学家不同,蒂布希拉尼和他的合著者并非来自数学背景。他相信这有助于他们从概念上思考。他表示:“我们试图通过先解释基本思想,来直观地解释(概念)。” “然后,我们给出一个例子,你希望它工作的情况。而且,在这种情况下,它可能不起作用,我想人们真的很欣赏这一点。” 我的确很喜欢。

例如,《统计学学习导论》中有一节专门解释了“bootstrapping”的使用——一种只有在计算机时代才能使用的统计技术。bootstrapping是一种通过从相同的数据生成多个数据集来评估评估准确性的方法。

例如,假设你收集了美国1000名随机挑选的成年女性的体重,发现平均体重为130磅。你对这个数字有多大信心? 在传统的统计学中,要回答这个问题,你需要使用一个100多年前发展起来的公式,它依赖于许多假设。今天,你不需要做那些假设,你可以用计算机从最初的1000个人中抽取500个人中的数千个样本集(这是bootstrapping),看看这些结果中有多少接近130个。如果大多数都是,那么您可以对评估更有信心。

理论和应用

幸运的是,这些书不需要高级数学,比如多元微积分或线性代数。(如果你对这类事情感兴趣,你会发现有大量有价值但枯燥无味的学术文献等着你。) 《统计学习导论》(a Introduction to statistical learning)一书的合著者丹妮拉•威滕(Daniela Witten)表示:“尽管这些主题的知识非常宝贵,但我们认为,要对统计学习方法的工作原理以及如何应用它们形成牢固的概念理解,并不需要这些知识。”

有帮助的是,这些书还提供了一些代码,您可以使用它们来应用统计编程语言R中的工具。我建议将他们的示例用于您感兴趣的数据集。如果你喜欢小说,就用它来分析 Goodreads ratings。如果你喜欢篮球,把他们的例子应用到Basketball Reference中的数字中。统计学习工具本身非常棒,但我发现它们最适合那些受到个人或专业项目激励的人。

数据和统计是现代生活中越来越重要的一部分,如果能更深入地理解那些有助于解释我们这个世界的工具,几乎每个人都会过得更好。即使你不想成为一名数据分析师——这恰好是增长最快的工作之一,你也知道,这些书是帮助你解释正在发生的事情的宝贵指南。

作者: Dan Kopf

原文链接

https://qz.com/1206229/this-is-the-best-book-for-learning-modern-statistics-its-free/

内容推荐

数据思践,数据的思考与践行。返回搜狐,查看更多

责任编辑:

声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()
投诉
免费获取
今日搜狐热点
今日推荐