数据科学家应注意的基本统计术语是什么?

如今,与传统统计,优化(OR)相比,典型的数据科学家的工具箱包含大量的机器学习。 尽管如此,至少了解本科生的统计数据对于做出明智的决定很重要。

这是统计要点的一小部分

  • 基础知识:随机变量,期望值,方差,矩,概率分布(了解哪种模型至关重要),方差-协方差矩阵,各种相关性(以及何时使用它们)。
  • 通用框架:中心极限定理,弱数定律。
  • 假设检验:p值(直觉很重要),置信区间,各种检验,例如t检验,F检验,置换检验。 重要的是要知道每项测试何时适用。 功率计算。
  • 从贝叶斯角度理解2和3。
  • MLE,稳健的统计指标,各种抽样技术。

较长的清单(不全面)

  • 马尔可夫链。
  • 排队论。
  • 多元统计:PCA,使用SVD,各种关联分析:Chi-sq,(多)对应分析,因子分析等。
  • 实验设计。

您提出的这个问题确实有点含糊。

但是我会尽力回答我的知识

  1. 消耗率-如今,数据科学家每天都使用消耗率图表来提供问题解决率
  2. EVMS:根据监控收益进行的挣值管理。
  3. 首次通过收益率(FPY):这是为了计算流程中的批准库存与输入库存。

您可以通过Google了解这些条款,以获取更多见解。

作为制造专家,我实际上是在机器学习中使用自然语言处理(NLP)进行FPY研究。 我在工作中使用的其他术语。

学习愉快。