做有温度的教育!
全国统一咨询热线:400-803-9399
北京
校区
新闻资讯> 行业新闻> 为什么你不应该成为一名数据科学通才

为什么你不应该成为一名数据科学通才

时间:2018-12-06
浏览:42456
发布:甲骨文华育兴业
赞:5217

  似乎,数据科学家涉及的领域越广,越能突出数据科学这份职业的价值。但是,情况恰恰相反!有着丰富的数据科学经验的SharpestMinds联合创始人Jeremie Harris告诉你,千万不要成为一个数据科学通才!  

甲骨文华育兴业

  数据科学家似乎个个都是全才,他们知识面很广,即写的了代码,又分析的了业务,没事还能整个数学模型调调参数。

  似乎,数据科学家涉及的领域越广,越能突出数据科学这份职业的价值。

  但是,情况恰恰相反!

  有着丰富的数据科学经验的SharpestMinds联合创始人Jeremie Harris告诉你,千万不要成为一个数据科学通才!

  以下是他以第一人称的论述,enjoy

  我在公司帮新手规划数据科学职业发展的时候,通常首先建议他们先去考虑一下自己想成为什么样的数据科学家,而不是直接推荐一个新的库或工具,或者一些写简历的技巧给他们。

甲骨文华育兴业

  这个问题之所以如此重要,是因为数据科学涉及太多方面,以至于很难被一个人完全掌握。所以,对公司而言,与其雇一个什么都懂一点却不精通的人,不如雇佣那些专才。

  你可以试想一下你是一家计划雇用数据科学家的公司。在你的脑海中几乎存在一个需要寻求帮助才能解决的具体的问题,该问题需要一些相当专业的技术知识和项目经验。例如,一些公司将简单模型应用于大型数据集,一些公司将复杂模型应用于小型数据集,一些公司需要动态地训练他们的模型,还有一些公司根本不使用传统的模型。

  解决上面例子中的每一个问题所需要的技能组合完全不同,而让人感到特别奇怪的是,每一个有志于数据科学的人得到的建议往往是一样的:“学习如何使用Python,构建一些分类/回归/聚类的项目。”

  其实,出现这一现象的原因是包括我在内的圈内人造成的。因为在闲聊、博客帖子中,我们把过多的东西放到“数据科学”中。

  为生产建一个强健的数据通道?这是一个“数据科学问题”。创造一种新型的神经网络?这是一个“数据科学问题”。

  这往往导致有志于数据科学的人们失去对特定问题的深入研究,从而成为泛泛之辈。要知道,人才市场上已经满是所谓的通才,他们很难再得到市场的青睐或取得突破。

  但是,如果你自己不清楚都有哪类常见问题需要你去深入研究,那你就很难避免流于平庸。


  我们把圈内出现的问题归结为以下五类:

  1. 数据工程师  

甲骨文华育兴业

  职位描述:处理大量数据的公司,并管理数据通道。这意味着,当需要时,你要能确保有效地从数据源收集和检索数据,并进行清理和预处理。

  为什么它很重要:如果你只处理过相对小的(<5Gb)保存为.csv或.txt文件的数据集,那么你可能很难理解为什么会有一些人的全职工作是构建和维护数据管道。

  这里有几个原因:

  · 一个50Gb的数据集对计算机的RAM来说太大了,所以你通常需要其他方法将其输入到你的模型中。

  · 处理这么大规模的数据需要花费大量时间,并且经常需要冗余存储。管理数据的存储也需要专门的技术诀窍。

  要求:你将使用的技术包括Apache Spark、Hadoop和/或Hive,以及Kafka。你很可能还需要有一个扎实的SQL基础。

  你要处理的问题听起来像:

  “我如何构建一个能够每分钟处理10000个请求的数据管道?”

  “如何清理数据集而不用将其全部加载到RAM中?”


  2. 数据分析员  

甲骨文华育兴业

  职位描述:将数据转换成可指导业务发展的商业洞察力。你会是技术团队和商业战略、销售或营销团队的桥梁。数据可视化将成为你日常工作的重要组成部分。

  为什么它很重要:纯技术人员通常很难理解为什么数据分析员如此重要,但事实是他们就是很重要。这些人需要将经过训练和测试的模型和大量用户数据转换为让人易于理解的形式,以便根据数据分析结论设计业务策略。数据分析员帮助确保数据科学团队不会浪费时间在不能提供业务价值的问题上面。

  要求:你将使用的技术包括Python、SQL、Tableau和Excel。你还需要成为一个好的沟通者。

  你要处理的问题听起来像:

  “什么驱动了用户的增长?”

  “我们如何向管理层解释,最近用户费用的增加会减少客户?”


  3. 数据科学家  

甲骨文华育兴业

  职位描述:清理和探索数据集,并做出有商业价值的预测。日常工作包括训练和优化模型,并将它们部署到生产中。

  为什么它很重要:当你有一大堆数据,以至于人类无法解析,同时这些数据也很珍贵以至于不能忽略它们时,你需要通过一些办法从中提取一些可被接受的见解。这是数据科学家的基本工作:将数据转换成可被理解的结论。

  要求:你将使用的技术包括Python、scikit-learn、Pandas、SQL,可能还有Flask、Spark和/或TensorFlow/PyTorch。一些数据科学职位纯粹是技术性的,但是大多数职位还需要你具有商业头脑,这样你就不会老想着去解决没有人需要解决的问题。

  你要处理的问题听起来像:

  “我们到底有多少种不同类型的用户?”

  “我们能建立一个模型来预测哪些产品能卖给哪些用户吗?”


  4. 机器学习工程师

  职位描述:建立、优化和部署机器学习模型到生产中。通常需要把机器学习模型当作API或组件来处理,把它们嵌入到全栈应用程序或硬件中,但是你也可能会被要求自行设计模型。

  要求:使用的技术包括Python、JavaScript、scikit-learn、TensorFlow / PyTorch(和/或企业级深度学习框架)和SQL或MongoDB(通常用作app数据库)。

  你要处理的问题听起来像:

  “如何将这种Keras模型集成到我们的Javascript应用程序中?”

  “如何减少推荐系统的预测时间和预测成本?”


  5. 机器学习研究员

  职位描述:寻找新的方法来解决数据科学和深度学习中的挑战性问题。没有现成的解决方案给你,需要自己去制定。

  要求:你将使用的技术包括Python、TensorFlow/PyTorch和SQL。

  你要处理的问题听起来像:

  “我如何才能提高我们模型的准确性,使之更接近最新水平?”

  “自定义优化程序有助于减少训练时间吗?”

  这里列出的五种工作描述并不是在所有情况下都是独立的。例如,在初创公司的早期,数据科学家可能还必须是数据工程师和数据分析师。但是,大多数工作都可以被划分为这几类工作中的一种,而且公司规模越大,数据科学工作的划分越贴近这里所列出的类别。

  总而言之,要记住的是,为了得到聘用,你最好能培养一个更加专注的技能集:如果你只是想成为一名数据分析员,不要着急去学习TensorFlow;如果你是想成为一名机器学习研究人员,没必要先去学习Pyspark。

  相反,你需要考虑你想帮助公司创造什么样的价值,并且让自己善于创造这种价值。相对于任何其它方式,这是得到offer最好的方式。


人生从业之路的第一步,从甲骨文华育兴业开始,

背后付出的辛苦与努力只有自己知道,而这也只是职业生涯的开始。

勤恳努力的人终会得到最好的回报,有些努力需要时间来回答

你吃的苦终会铺成你想要的路!

甲骨文华育兴业,为你的IT之路开启梦想之门!


【版权与免责声明】如发现内容存在版权问题,烦请提供相关信息联系我们,我们将及时沟通与处理。本站内容除非来源注明甲骨文华育兴业,否则均为网友转载,涉及言论、版权与本站无关。


相关推荐

大数据开发

大数据Hadoop 原理学习二

​在 HBase 中,Region 是有效性和分布的基本单位,这通常也是我们在维护时能直接操作的最小单位。比如当一个集群的存储在各个节点不均衡时,HMaster 便是通过移动 Region 来达到集群的平衡。或者某一个 Region 的请求过高时,通过分裂 Region 来分散请求。或者我们可以指定 Region 的 startKey 和 endKey 来设计它的数据存放范围等等。

java开发培训

收到offer是去大公司还是小公司?

前一段时间,我们甲骨文华育兴业毕业的学员问了我们这么一个问题,说他是应届生,拿到了 BAT 一家互联网大公司的 offer,但同时他还拿到了一家 A 轮融资的创业公司的 offer,本来他是不纠结的,但是他跟创业公司老板聊完之后,觉得做的产品听起来挺有潜力的,他想着以后他也可以创业,所以一下就纠结了,问我到底该怎么选?

大数据

大数据告诉你:2018年该学习什么技术

很明显的看出Swift 和 Angular式增长最快的语言,背后原因是因为Swift背后亲爹Apple大力加持,和苹果独有的生态体系,作为Objective C的替代者,它的增长毋庸置疑。Angular则代表了前端框架的流行趋势,面对快速发展的时代,适应需求才能活得长一些。Android Studio 是谷歌推出的开发 IDE,增长势头也很快。在 人工智能概念大行其道的今天,TensorFlow 几乎成为了机器学习和深度神经网络的工业标准,涨势喜人。 大数据技术   哪些技术有明显的下降呢?JavaScript 框架 Backbone.js 差不多已经走到了生命的尽头,用于 iPhone 开发的游戏引擎 Cocos2d 也渐渐淡出开发者的视野。Silverlight 和 Flex 技术因为浏览器的背离,基本上已经属于历史遗产,这说明即使有大厂(Adobe 和 微软)背书,如果脱离了主战场,也是说完就完,不带走一片云彩。ORM 技术变得沉寂还是挺让人奇怪的,不过就我近几年在的互联网公司里技术应用,ORM 使用的确实很少了,也可能是技术成熟导致没什么人问问题了吧。   稳步增长的技术   有哪些稳步增长的技术呢?当然是前端大丰收了,Angular 居首,JavaScript 的生态系统成员 TypeScript 和 Meteor 紧随其后。Pandas 是 Python 的一个开源数据分析库,它提供的数据结构DataFrame 极大的简化了数据分析过程中一些繁琐操作,由于数据科学和机器学习的风生水起,Pandas 同样水涨船高。其他一些技术则在行业内有广泛的应用,比如搜索引擎 Elasticsearch,游戏引擎 Unity,亚马逊的 Web Service 服务,机器学习框架等等。 那么在2018年学习什么更符合趋势呢?   1、希望就业的同学来说,学习Java还是首选。它的需求还很庞大,企业服务端和安卓手机的不断增长让Java保持巨大增量。除了Java外,还有python,swift,Go, Javascript,c++也很值得关注。Python和JavaScript目前风头正劲,无需多言。随着Go的成熟,越来越多的企业也正是尝试Go,来构建项目。C++在硬件和科研方面还是主流。Swift正在全面取代Objective C,成为Apple的当家语言。   2、随着技术的成熟,物联网在2018年会有大的发展。万物互联不再是梦想,这里面包含的技术有蓝牙技术,WiFi技术,自动控制...... 将万物数字化连在一起的时候,这里面的想象力很大很大!   3、人工智能方面,在2018年会更加渗透到生活的方方面面。更多的企业会应用这项技术来推动自己的业务增长。 人生从业之路的第一步,从甲骨文华育兴业开始, 背后付出的辛苦与努力只有自己知道,而这也只是他们职业生涯的开始。 勤恳努力的人终会得到最好的回报,有些努力需要时间来回答 你吃的苦终会铺成你想要的路!

甲骨文华育兴业太原

学Java可以做什么?这九大领域任你选!

Java是时下非常流行的语言,这意味着有很多很多不同的工作可供选择。Java软件工程师入行1-3年,年薪已达到10-15万,而且在IT行业工作经验越多,薪资待遇越高。工作选择多,薪资待遇好,成了许多大学生选择转行IT的原因。那么,学了Java以后能做什么工作呢?小骨头就为大家整理一下,学完Java之后可以从事的方向。

【AI大数据】2019年AI数据5大趋势 ps使用 大数据 冲刺Java架构师年薪50W

友情链接: 甲骨文华育兴业太原校区 甲骨文华育兴业北京校区 甲骨文华育兴业哈尔滨校区 甲骨文华育兴业长春校区 魔据教育

Copyright ©2016-2019. All Rights Reserved. 京ICP备17018991号-4

网站地图