编程语言应用

首页 » 常识 » 诊断 » 数据科学家最常被问到的8个问题
TUhjnbcbe - 2024/8/8 17:50:00

我在与大学生交流时经常被问到一些类似的问题。

在过去的一年里,我开始和大学生谈论数据科学的职业生涯。在这些活动中,我经常讲到我在硕士期间学到的技能,以及它们是如何在工作场所发挥作用的。那些希望进入数据科学领域的学生向我提出了许多问题,但有些问题比其他问题更常见。说到这里,我想和大家分享一下我在年收到的最常见的问题,并给出相应的答案。

下面我列出了八个最常见的问题:

l由于从事数据科学的大多数人员拥有研究生学位,你认为拥有数据科学学士学位的人找一份工作会面临多大的挑战性?

l你有多少在学校学到的东西是你经常使用的?

l机器学习在你的位置上是司空见惯的吗?

l作为一个数据科学家,典型的一天是什么样的?

l为什么选择数据科学作为职业道路?

l你对飞机感兴趣吗?或者你愿意在另一个领域做一名数据科学家吗?

l作为一名数据科学家,你面临哪些独特的挑战?

l你的数据科学家职业和生活的其他部分之间是如何平衡的?

1.由于从事数据科学的大多数人员拥有研究生学位,你认为拥有数据科学学士学位的人找一份工作会面临多大的挑战性?

前一段时间我写了一篇文章,详细回答了这个问题。总而言之,这些研究表明,你可以从学士学位或数据科学新兵训练营开始你的职业生涯,但要想更进一步,你应该考虑攻读高级STEM(科学、技术、工程和数学教育)学位。工作岗位不同,公司不同,要求也会不同。

我选择攻读数据科学硕士,是为了在学术环境中学习相关的数据科学和商业技能。通过参加这个项目,我获得了从事研究项目和撰写用于发表的论文的经验。我发现这对我很有帮助,因为我喜欢更多以研究为重点的工作。根据课程的不同,你可以在上学期间从事工业研究项目。我参加的项目让我在最后一个学期在波士顿的一家公司工作。该项目旨在开发有助于数据采集,清理和预处理自动化的图书馆。我发现这个项目是有益的,因为它向我展示了在处理数据时可能涉及到的各项工作。

在获得数据科学学位时,许多个人可能会认为数据科学家是主要的职业道路。尽管如此,你还可以选择很多其他的路径,比如数据工程师,软件工程师,机器学习工程师等等。对我来说,获得另一个学位的主要原因是时间和金钱的投入。如果你必须自己付钱或依靠助学贷款,上大学可能会很贵,第二个学位可能需要你再花1到2年的时间。对我自己来说,利大于弊,所以我就又回到了学校。

小贴士:在数据科学中找到一个你喜欢的利基领域,并专注于发展你在该领域的技能。

2.你在学校学到的东西有多少是你经常使用的?

我在大学期间学到的主要技能来自我的计算机科学课。这些课程讨论了面向对象编程,数据库,算法和数据结构。我的本科专业是计算机工程,而当我回到学校读硕士的时候,我的专业则变成了数据科学。在我目前的职位上,我确实运用了我在硕士期间学到的许多技能。我日常使用的主要有:

数据库——根据您正在做的工作,需要用到的数据库方面的技能可能会有所不同。不过最起码来说,你要知道如何从数据库中读取数据应用到您正在使用的任何内容。使用Tableau这样的工具,您将需要学习如何连接数据源。但是如果您正在用Python或R编写代码,那么要知道如何编写获取数据所需的连接。如果您对数据工程更感兴趣,那么应该更多地了解创建和优化您的数据源,包括NoSQL和SQL数据库。

数据清洗和预处理——这是一个非常广泛的技能领域,包括值归算,处理NaN/Null值,转换或创建新的数据列以从现有列中提取意义。注意您在这里学习的内容,以及如何将它们应用于不同的数据集。你确实会花费大量的时间来验证和清洗你的地面真相数据。

MapReduce——处理大数据可能需要很长时间。MapReduce与大数据一起使用,在集群上运行并行以及分布式算法。我每天处理至少10TB的数据,经常发现MapReduce非常方便,可以加快我的分析速度。学习在Spark或Hadoop中使用MapReduce非常有用。

数据可视化——创建对业务有用的仪表板,报告和KPI以提供有价值的见解是必须的。我经常发现自己正在学习新的工具和技术来可视化我所处理的数据。参加以这个主题为重点的课程是非常有帮助的。数据可视化和故事讲述在数据科学中经常出现。

小贴士:根据你想要的工作,选择你重点学习的技能。比如说您打算进入数据工程领域,那么请将更多精力集中在数据库上,并学习构建大型数据集。

3.机器学习在你的职位上是司空见惯的吗?

是的。机器学习在数据科学中是司空见惯的。作为一个快速发展的领域,我发现自己花了很多时间学习新技术,确定什么适用于我的工作,并阅读业界已发表的最新研究。与其仅仅是为了学习机器学习这项技能,我的方法是从问题开始。当我确定了问题,我就可以开始解决它了。你可能会惊讶地发现,机器学习并不总是最好的选择。你需要选择最适合你正在做的工作的技术。

教训:从问题开始。一旦你确定了你的问题,你就可以开始开发一个适合它的解决方案。

4.作为数据科学家,典型的一天是什么样的?

我的一天通常有三个主要的焦点:冲刺工作,项目规划/路线图,以及研究。

冲刺工作——这个工作指的是我在sprint期间承担的大部分项目。冲刺工作可以包括修复代码中的漏洞,在库中创建新的功能,或者根据客户对某个问题的输入对某些数据进行分析。

项目规划和路线图——我是我的团队的领导,因此花时间清理我们的积压的工作,添加新的概念,并绘制未来几个月的路线图。在这段时间里,我正在与项目的相关方以及其他团队成员合作,在需要的地方添加信息,并为接下来的几个月制定路线图。

研究——如果我不是在做上面两个中的一个,那么我就是在研究市场上有什么,已经出现的新技术,以及解决我们目前面临的问题的方法。如前所述,数据科学是新思想,新概念和新教义的旋转门。你会花很多时间去学习已经出来的东西,以及它是否适用于你的工作。我的研究既可以是我的冲刺工作的一部分,也可以是项目规划的一部分。那要看我那周在做什么了。

教训:根据你选择的角色类型,你的一天会有所不同。确保你选择了适合你在你的职位上想做的事情。

5.为什么选择数据科学作为职业道路?

我最初并没有选择数据科学;是它选择了我。我开始上大学的时候是英语专业,学了两年,然后转到另一所大学,成为一名计算机工程师。正是在本科的最后一年,我开始探索自己对数据的热爱。我从事的一个研究项目要求我从传感器和用户输入中摄取数据进行分析。就在那时,我认为自己最初对成为一名嵌入式工程师感兴趣。我对这个想法探索了一会儿,又上了几节嵌入式编程和芯片设计的课,然后做了一次实习。

我对嵌入式系统的数据研究越多,我就越不想成为一名嵌入式工程师。然后我开始攻读数据科学硕士学位。随着我上了更多的课,处理了不同的数据集,我开始享受大数据挑战。数据科学是一个不断发展的领域,可以让你与各种背景的人互动。它每天都提供新的挑战,伴随着更多的数据而来的是需要解决的更多问题。我最初没有选择数据科学,是它选择了我,我很高兴它这么做了。

教训:生活不是一条直线前进的道路。这里面会有很多曲折。你可能不知道你会在哪里结束,这也没关系。

6.你对飞机感兴趣吗?或者你愿意在其他领域做一名数据科学家吗?

我最初的兴趣是物联网(IoT)和家庭自动化。当我开始寻找另一份工作时,碰巧我开始感兴趣的是航空航天领域的工作。自从开始从事航空航天工作以来,我一直非常喜欢它,并且学到了很多关于飞机的知识。虽然我不介意在另一个领域工作,但我想我现在还是留在航空航天领域。

我的看法是,你可以对你想要接触的数据类型进行概括或专门化。如果泛化,您不介意切换到不同的领域,但是你要明白你将更多地依赖其他的主题专家(SME)的帮助才能理解你的数据。如果你专门化,你将成为该领域的主题专家(SME),因为你对自己所面对的数据更有经验。

教训:你的兴趣可以随着时间的推移而改变。您可能希望从掌握通用型的技能开始,然后专攻特定类型的数据。没问题。找到适合你的工作和你喜欢做的事情。

7.作为一名数据科学家,你面临哪些独特的挑战?

每一份工作都会带来不同的挑战。我在数据科学方面看到的三个有趣的挑战是:这一空间不断发展的本质,数据清洁度和分析瘫痪症。

技术的发展——总有新的东西要学。把注意力集中在你需要知道的事情上,然后把视野扩展到你感兴趣的事情上。我经常阅读研究论文,观看不同的谈话节目,从而来了解领域里有什么新的东西。要确定哪些新的想法你应该研究并运用于你的工作,这可能有一定的挑战性。

数据清洁性——没有完美的数据集这样的东西,尽管我希望有。每个数据集在清洗,预处理和利用它创建地面真相方面都带来了一组独特的挑战。我处理的数据越多,我就越了解如何清理数据和查找什么。

分析麻痹症——很容易陷入分析和思考之中。如果我得到更多的数据或调整我的视觉更多一点,我可以得到完美的结果。如果你能学会什么时候做就好了。这项技能是一项挑战,但随着时间的推移你将具备这项技能。

小贴士:数据科学充满挑战。迎接挑战并找到有益的解决办法。

8.你的数据科学家职业和生活的其他部分之间是如何平衡的?

我是一个坚信工作与生活平衡的人,但并不是每一份工作都能做到这一点。你需要理解你在平衡方面寻找什么,并为你自己定义它。如果每周工作80小时以上不适合你,就不要接受这样的工作。无论我担任过什么职位,我都在寻找那些了解员工在工作之外有生活的公司。我发现我现在的角色是平衡的,既有时间过自己的生活,又有时间工作。根据项目的不同,我可能会工作得比我预期的时间长,但那不是必须的。

经验教训:你需要了解工作与生活的平衡,然后接受这一点去找一份工作。

最后再聊聊别的一些想法。

在我被问到的所有问题中,第五个问题总是我最喜欢回答的。它表明你可以改变你的想法,在你的职业生涯中尝试新的事物。学生们问了我很多问题,但有些问题比其他问题更常见。我希望这些答案能帮助你解决下一步的问题。

总之,我的建议和经验教训如下:

l找到你的位置。

l挑选你的技能并学习它们。

l从问题开始。然后找到解决方案。

l选择一个适合你想做的事情的角色。

l你可能不知道你会在哪里结束,这也没关系。

l找到适合你的方法,并享受它。

l迎接挑战。

l学会保持工作和生活的平衡。

1
查看完整版本: 数据科学家最常被问到的8个问题