我觉得自己不够聪明,无法涉足数据科学领域。 我看不到自己开发任何新算法或变得出色,但我想做得很好。 我应该换职业吗?

数据科学与严格的数学方法或深入的还原论方法无关。 实际上,那些专注于此类事情的人通常是糟糕的数据科学家。 这是因为数据科学旨在构建利用机器学习功能来产生推动创新所需的预测性和解释性输出的现实产品。 在“现实世界”中运行的机器学习不是从数据中挤出额外1%的预测准确性的算法,也不是在玩游戏时击败人类并识别狗何时笑的算法。 现实世界中的机器学习涉及将软件开发和领域经验整合到机器学习工作流程中,以将不完美的企业数据转换为适合其环境的产品。 这是关于知道如何通过迭代而不是前期设计和数学上的优雅来提高您的技巧。

在白板上写方程式或不停地浸入学术期刊几乎总是表示“包装意识”差的征兆,这意味着您对创建机器学习产品所需的开源工具没有足够的了解。 没有这种工具方面的教育,几乎可以保证您在白板上的努力会重新发明轮子。 我们已经进行了半个多世纪的机器学习研究,并且通过高级工具可以使用大量算法和验证技术。 数据科学并没有因为缺乏算法而受到伤害。 大数据科学家不是在解决方程式,而是在对数学和其算法的假设进行概念性的理解,以解决高度复杂的非理想(即非学术性)问题。 发生在理想化的象牙塔外的那些。

您必须了解,社会的“智能”概念来自工业革命,在工业革命中,硬编码的规则,数学思维以及对逻辑的坚持是推动战争努力的因素。 到目前为止,所有机器都依靠严格的基于规则的逻辑来产生其行为。 这不再是你所处的世界 。 我们正在构建的机器的行为来自通过数据了解其环境的模型。 换句话说,人不是编写计算机程序的人,而是机器。 如果您专注于规则和严格的逻辑,那么您将无法替代机器可以自己完成的工作。 这是信息时代,我们需要的技能与过去主导的技能看起来非常不同。

作为数据科学家,您应该知道如何训练计算机,而不是对其进行编程或赋予它们所谓的复杂数学知识。 拥有大量“硬技能”但缺乏软技能的数据科学家无法胜任这项工作。 我看过很多次了。 我们产品的复杂性是通过从多个角度解决问题并与其他产品一起在机器学习工作流程中快速迭代来实现的。 如果您正深入研究数学并且忽略了惊人的机器学习从业者社区提供的高级工具,这是100%不可能的。 使用机器学习库是您摆脱朴素的学术方法(前期设计)而转向更现实的发现的发现,这种发现是在快速尝试多种算法时发生的; 数据引导解决问题的地方,而不是某个人“聪明”的猜测应该使用哪种技术。

由于大型公司和研究部门的引人注目的成就,数据科学遭受了媒体的狂热。 从学术的观点来看,这些壮举令人兴奋,但与构建产品的现实世界机器学习无关。 该行业不需要一系列的硬技能和过时的工程最佳实践。 我们需要那些可以采用更柔和,不太天真的方法来理解人类需求的人。 那些可以超越技术杂草并学会使用机器的人,可以平衡计算机编写程序的能力和我们对策略和价值的理解能力。

世界将变得非常不同,“智能”一词将被重新定义。 柔和的技能以及作为行为主义者训练机器的能力是当今的热门技能。 如果您喜欢此领域,请继续学习并知道您依赖开源的预打包库是明智的选择。

我认为没有人能比您自己更好地判断您的情况。 不要从头开始,而要从心开始。 用心解决问题。 问题越难,就越需要从头开始。 有太多理由说不,当问题变得棘手时,有太多理由要退出。

当谈到改变职业的问题时,你必须走慢一点。 我认为您应该花更多时间来判断您的情况。 现在,当您因为没有看到自己在开发新算法而感到自己不够聪明而无法进入数据科学领域时,我觉得您正在努力应对自己。 这并不是数据科学家所做的全部。 称自己为数据科学家,这使我们可以做更多的事情。

白宫前数据科学家DJ Patil引用“数据科学是一项团队运动”。 他说,因为数据科学是一个非常广阔的领域,并且有很多面孔。 显然,您不应该对所有事情一无所知。 如果您对算法不是很特别,也可以。 数学和算法只是数据科学的一部分。

数据科学的基础由3种特定事物构成。 数学,统计学和程序设计。 如果您有足够的统计和编程能力,则可以随时学习数学。

在板球运动中,您不能同时成为最佳的击球手,投球手和守门员。 击球手与投球手一样具有自己的价值。 数据科学也是如此。 如果您擅长一个方面,而另一个方面高于平均水平,那么您仍然可以成为一名出色的数据科学家。

但是,我将列出一些您可以学习以简化工作的机器学习算法:

  • 决策树
  • 朴素贝叶斯定理
  • K均值聚类
  • 逻辑回归
  • 随机森林
  • XG加速

免责声明:我是@GreyAtom的联合创始人,致力于帮助工程技术人才在新兴技术中找到可持续的职业。

GreyAtom的高度选择性旗舰计划旨在指导正在工作的专业人士和新生,以启动他们的数据科学事业。 学生根据行业和招聘合作伙伴提供的REAL数据集和问题陈述构建项目。 该计划以课堂为基础,并以实践为导向。 GreyAtom是一个生态系统,学生可以在此生态系统中充分利用学术界,行业从业者和影响者的力量。

一些快速链接

开发新算法不是数据科学家的工作。 这就是学术界和工业研究实验室中的机器学习研究人员的工作。

在数据科学中, 严格的数学也不重要。 根据这篇出色的博客文章,数据科学“强调实际结果(如工程学),而不是证明,数学纯正或学术科学的严格特征”。 我认为这是每位具有行业经验的实用数据科学家都可以与之相关的东西。

但是谁说您需要任何这些东西来使您的工作变得出色? 我遇到的一些最伟大的数据科学家的特点是拥有丰富的经验和出色的业务理解。

数据科学并不像想象的那么迷人。 数据科学家面临各种各样的问题,但很少有时间去深入研究一种特定的算法。

再说一次,机器学习研究也没有想象中那么迷人。 研究人员可能会深入研究某个特定领域,但是他们只面临非常狭窄的问题。

所以,不,我认为您不应该因为自己的工作而变得出色。 伴随着经验和激情。

您期望伟大的数据科学家发明新的算法或应用严格的数学方法。 尽管这可能是正确的,但对于一类数据科学家或您曾经看到并欣赏过的数据科学家而言,这并不会因为没有实现它们而使您变得不那么出色。 解决此难题的一种简单方法是查看组织中(尤其是团队中)从事数据科学工作的人员。 基于这一事实,我们了解到,一个团队会聘用数据科学家和相关学科,因为他们具有能力,核心技能以及与团队合作的意愿。 长期候选人是那些在困难时期或艰难时期坚持不懈并留在团队中,在公司中成长并在有价值的股票和储备金之间取得平衡的人。 这与团队和公司一起创造了价值,与之相对照的是启动和迅速转移到另一个“机会”。 决定留在数据科学领域,是从一家初创公司开始匆忙地总结出来的,在那家公司从事机器学习和应用标准库。 您应该充分利用工作的事实,成就和成长潜力,以丰富的经验,团队合作和人际关系。 从财务角度讲,这实际上意味着您了解入门级职位的投资,您的同事证书和推荐能力,以及如果愿意的话,可以在另一家公司申请的机器学习的可转让经验。 作为一门学科,数据科学结合了许多定量学科,并且在很大程度上不依赖于任何学科。 这使该学科变得通用,并且当添加到实际的商业思维中时,该职业就变得不可或缺。 这不仅对认识到人工智能价值的公司产生了兴趣,同时也认识到数据科学家必须了解的人为因素,而数据科学家必须与商人进行中间,建议和开发这样的机器进步。 从这个意义上讲,数据科学家在计算机系统和智能应用程序之间进行仲裁,与特定公司的管理人员,技术人员以及核心生产者和服务人员进行仲裁。 因此,如果您了解自己的学科承诺,数据科学的驱动力,讨价还价和谈判能力以及数据科学既是公司的职业生涯又是公司的人力资源的价值,那么长期投资将毫无问题。术语。 您将能够长期可靠地度过与同事的通货膨胀,风险失败,低利润率或管理问题的商业周期。

不要放弃 要真正了解这些内容的内部工作,需要花费大量的时间和精力。 我每天都在学习有关概率,统计,编程和更多主题的知识,但我还有很多事情要做。 您了解得越多,您就越了解真正的知识。 虽然令人生畏,但我认为这令人鼓舞。

不要再坚持不合理的标准了。 您可能不会看到自己“正在开发任何新算法或变得异常出色”,但这并不意味着您不能成为机器学习从业人员并不能解决现实世界中的问题。 库的存在很方便 ,了解使用哪个库以及为什么使用它是您的工作。 当有人用C编写了神经网络或随机森林实现,将其包装在Python中,并使它免费易用时,就无需重新发明轮子。 但这并不会让您感到懒惰,而是让您务实,自由地考虑数据管道或建模选择中的许多其他问题。 🙂

所以不行。 不要更改字段。 我们都对自己的位置和前进的方向感到怀疑。 由您来与否定性思想作斗争并通过解决问题来有所作为。 我也在研究它,所以我会让你知道它的进展。

具有讽刺意味的是,我感到被困在你所在的地方。

我的大部分经验是在“常规”数据科学中的-尽管我具有非常强的数学背景,尤其是在机器学习理论方面,但我的行业经验中有很大一部分正在做您现在正在做的事情。

您现在正在做的是扎实的数据科学工作 。 您正在前进–您需要获得信心和经验。

但是,大多数时候,您所做的不会改变我的想法。 坦白说,过去两年来我从事合同工作的原因之一是,这很有趣。 知道我专门研究时间算法和数学上的新算法的人来找我-足以谋生,我现在正申请一个名字来寻找更多合同,或者可能在一家有职位的公司工作我可以玩得开心。

我们和您(我)喜欢做的事情(以及您喜欢做的事情)不同。 太酷了。 你不必是我,我也不必是你。

不要辞职,因为您不会觉得自己没有像数据科学家那样被削减–您正在做大多数数据科学家所做的事情。 如果您讨厌自己正在做的事情,请考虑其他事情。 但是,不要被工作中更像我的人所吓倒。 很有可能,管理层雇用您去做您做的事情并做好它,而他们对您所做的事情感到非常满意。 尤其是因为在您工作的地方像我这样的人不会擅长于自己擅长的事情,或者至少没有乐趣可做,而这通常是同一件事。

成为数据科学家并没有明智之举。 我想你还在学习中。 永不放弃。 尝试尽可能多地学习。 您获得了一个惊人的机会来开始机器学习。 很少有人会得到这样的机会。 继续努力

事实是,没有人太聪明或太愚蠢而无法成为数据科学家,您的领域特定知识对您的发展将起很大的作用。 无论您是学术背景还是工作背景,您都更有可能了解数据科学任务的结果。

您什么都不擅长是不可能的,尝试解决您喜欢使用数据科学的领域中的问题。

这样一来,您就可以减少数据科学的过度状况,而只能将其视为达到目的的一种手段。

智力从来都不是主要因素,

主要因素是热情,勤奋和愿意学习,如果同时具备这三个条件,那就继续做自己最爱的事情,您就会成功。