学习数据科学,这3个大坑一定要避开

来源:程序员书库(ID:CodingBook) 猿妹整编

链接:https://towardsdatascience.com/3-things-not-to-do-when-learning-data-science-149b9bc6a414


近年来,科技企业比以往任何时候都要重视数据科学,他们为与数据相关的解决方案进行了大量投资。因此,数据科学生态系统有了巨大的增长,许多来自不同专业的人转行从事数据科学领域的工作。

学习数据科学,这3个大坑一定要避开

然而数据科学是一个非常泛的领域,需要你大量的学习和适应许多软件工具,因此你需要比任何时候都要专注于学习,今天,我将和大家分享3个关于如果你想成为一名数据科学家应该避免的三件事:



不要试图在 Kaggle 上竞争


Kaggle 是一个很好的学习平台,你可以在上面找到非常有价值的内容,人们共享的优质学习资料以及可以用于练习的数据集等。


但是该网站的有奖竞赛并不适合新手,因为它的难度比较大,很可能会破坏你的学习动力,尽管你依然可以学习到很多东西,在你的数据科学职业生涯开始时,你应该花时间学习更基本的概念。


即使你在这些比赛上花费了大量的时间,你依然可能离排行榜很远,这是非常正常的,不好的成绩很可能会打压你的自信心,所以,建议你将Kaggle视为一个很好的学习平台,而不是测试知识或技能的地方。



不要陷入 Python-R 的困境


数据科学生态系统中有大量的软件工具和软件包。在大多数情况下,这些工具可以帮助我们无缝高效地完成任务。


在许多情况下,您将拥有多种工具来执行一项任务。丰富的工具选择通常会引发相关比较的讨论。例如,你必须至少阅读过一篇关于 Python 和 R 比较的文章。其实,随便选一个就可以了,在你职业生涯的初期,无论质疑哪一个都是在浪费时间,基础学习无论选择哪一个都一样。


比较不仅是Python和R之间,还有诸如,Matplotlib、Seaborn 和 Altair 是三个不同的 Python 数据可视化库,很多人也会将它们三个放在一起比较。


你可以使用 R 和 Python 库进行数据分析和操作。你选择哪一个并不重要,至少在你学习的时候是这样。获得第一份工作后,你可以根据自己的喜好做出更好的决定。



神经网络很酷,但是并不适合初学者


深度学习是机器学习的一个子领域,它用于解决神经网络的机器学习问题。你需要创建一个模型,训练它,并根据损失函数对其进行评估。这是一个迭代过程,因此你可以调整模型以提高其性能。


深度学习算法比传统机器学习算法更复杂,卷积神经网络可能是图像分类任务的最佳选择。然而,数据科学广泛范围内的许多问题不需要使用深度学习模型。在大多数情况下,机器学习算法绰绰有余。


神经网络听起来很酷,但不要在一开始的时候就学习它,数据科学是一个如此广泛的领域,有许多不同的应用。根据你的工作,你可能永远不需要使用神经网络。此外,如果用更简单的模型就可以解决问题,没有人会强迫你使用深度学习模型。


你应该更多地专注于学习与机器学习算法相关的统计概念。提高你的统计知识肯定会对你有很大帮助。

展开阅读全文

页面更新:2024-02-16

标签:卷积   科学   数据   神经网络   大坑   职业生涯   算法   生态系统   深度   模型   概念   机器   领域   时间   工具   工作   科技

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top