加入收藏 | 设为首页 | 会员中心 | 我要投稿 网站开发网_马鞍山站长网 (https://www.0555zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

像数据科学家一样思考:12步指南(上)

发布时间:2019-04-12 14:18:39 所属栏目:教程 来源:虎说八道译
导读:副标题#e# 介绍 目前,数据科学家正在受到很多关注,因此,有关数据科学的书籍正在激增。我看过很多关于数据科学的书籍,在我看来他们中的大多数更关注工具和技术,而不是数据科学中细微问题的解决。直到我遇到Brian Godsey的像数据科学家一样思考,它讨论

除数学外,统计学还拥有一套专属的以数据为中心的技术。

  1. 描述性统计是一种通常直观或简单的统计数据,可以提供对数据的良好概述,不会过于复杂或难以理解。在某种意义上,描述性统计通常与数据保持接近。
  2. 推理统计本质上是从数据中删除的一个或多个步骤。推断是基于可测量的相关量来估计未知量的过程。通常,推论统计涉及统计模型,该模型定义数量,可测量和不可测量,以及它们彼此之间的关系。推论统计的方法可以从简单到复杂,也可以在抽象性和可解释性方面有所不同。
  3. 统计建模是使用描述性统计系统后使用模型来帮助分析和解释与系统相关数据的一般实践。描述性和推论性统计都依赖于统计模型,但在某些情况下,模型本身的明确构造和解释起次要作用。
f698824126dc9188462c583325070b85794dc918

通过统计建模,主要关注的是理解模型及其描述的底层系统。数学建模是一个相关概念,它更强调模型构建和解释,而不是与数据的关系。统计建模侧重于模型与数据的关系,以下是你应该了解的统计建模中的一些重要概念:

  • 线性、指数、多项式、样条、微分、非线性方程;
  • 潜在变量;
  • 量化不确定性:随机性,方差和误差项;
  • 拟合模型:最大似然估计、最大后验估计、变分贝叶斯、马尔可夫链蒙特卡罗、过拟合。
  • 贝叶斯与频率统计;
  • 假设检验;
  • 聚类;
  • 成分分析;

离原始数据最远的是一组统计技术,通常称为黑盒方法。机器学习和人工智能的许多方法都是黑盒方法。如果你尝试将出现在数据集中的个体分类为几个类别,并且你应用机器学习技术(如随机森林或神经网络),事后往往很难说为什么是以某种方式分类。数据进入黑匣子,分类出来,最后你通常不能解释两者之间究竟发生了什么。

【编辑推荐】

  1. 干货 :送你12个关于数据科学学习的关键提示(附链接)
  2. 初级数据科学家常犯的十大编程错误
  3. 数据科学岗位将在未来5年内重新洗牌,你准备好转型了吗?
  4. 除Kaggle外,还有哪些顶级数据科学竞赛平台
  5. 给有抱负的数据科学家的六条建议
【责任编辑:未丽燕 TEL:(010)68476606】
点赞 0

(编辑:网站开发网_马鞍山站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!