当前位置: 首页 > news >正文

最佳数据科学家总是持续学习

最佳数据科学家总是持续学习

原文:towardsdatascience.com/part-1-the-best-data-scientists-are-always-learning/

你认为是否能够完全掌握数据科学中的每一个主题?

由于数据科学涵盖了如此广泛的领域——统计学、编程、优化、实验设计、数据讲故事、生成式 AI 等——我个人认为不是。

这是一个更窄的问题。是否能够在数据科学中完全掌握一个单一的主题?当然,你可以在某些领域成为专家,但你是否能够达到一个没有更多东西可以学习的点?再次强调,我真的不这么认为。

每个数据科学家都有东西要学,即使是那些经验丰富的人。我写作的目的是提供一些来自我的学习旅程的见解,希望这能帮助你。

这是两篇系列文章的第一部分。在这篇文章中,我将涵盖:

  1. 为什么数据科学家应该持续学习

  2. 如何提出要研究的话题

让我们开始吧!

1. 为什么数据科学家应该持续学习?

持续学习者区别自己

当我年轻时,我在一个小组环境中学习西班牙语。当小组开始进行对话后,发生了一些有趣的事情。许多学生停止了学习,他们对自己的熟练程度感到满意。其他人则继续进行日常学习和练习。

最初,两组之间并没有太大的区别。但随着时间的推移,那些继续学习的人开始领先。他们的流利度、词汇量和自信心都在累积,而其他人则陷入了停滞。

不幸的是,这种情况也可能发生在数据科学家身上。有些人一旦掌握了做好工作的足够技能,就会停止学习。与西班牙语小组类似,在职业生涯早期,持续学习者和“满足”的数据科学家看起来可能很相似。但随着时间的推移,那些持续学习的人开始脱颖而出。他们的知识在累积,他们的判断力在提高,他们解决复杂问题的能力在加深。

在早期职业生涯中,持续学习者和“满足”的数据科学家看起来可能很相似。但随着时间的推移,那些持续学习的人将开始脱颖而出。

持续学习者之所以出色,是因为他们能够运用自己的知识来提出更聪明的解决方案。他们将拥有对数据科学工具的更成熟的理解,并知道如何在工作中正确地使用它们。

学习带来满足感(对大多数人来说)

这有点空洞,所以我将尽量简短。但我确实非常喜欢学习。我从花时间投资自己并掌握新主题中获得了许多满足感和成就感。如果你喜欢持续学习的想法,你可能会从中获得很多满足感!

2. 如何提出要学习的内容

在上一节中,我们已经确立了终身学习的价值,现在让我们谈谈如何确定学习内容。

自主学习的最好之处在于没有人告诉你该学什么。自主学习的最坏之处在于没有人告诉你该学什么。

你已经不再是学生了,这很好。没有更多的截止日期,没有更多的考试,也许最重要的是,没有更多的学费。但你也失去了与相应材料、文本和讲座相对应的精选主题列表。现在,创建这个列表是你的工作!自己制定学习计划的灵活性是惊人的。但这个模糊、无方向的空间可能会让人感到 daunting。

这些年来,我发展了三种方法来找到对我非常有效的学习主题。我的目标是它们能成为你发展自己方法的良好起点。最终,你必须找到最适合你的方法。

让我们来看看这三种方法。

来自工作项目的话题

如果你是一名数据科学家,你的项目将为你提供丰富的“深入研究”研究主题。这种方法相当直接——研究与你工作相关的技术/主题。特别关注你理解最薄弱的领域。

例如,如果你正在设计实验,就学习实验设计。如果你正在解决优化问题,就学习优化。

这种方法的巨大好处是它立即让你在工作中变得更好。你将对面临的问题有更深入的理解,并且你将能够立即应用这种理解。

跟随“主题网络”

数据科学是一个研究领域,你可以深入探索任何给定主题,并且许多主题都是相互关联的。

在学习过程中,你会发现许多与当前主题相关的“旁枝末节”主题。我经常将这些主题记录下来,稍后再回来研究。我把这称为“主题网络”。这是一个很好的技巧,因为它让你围绕组或相关主题逐渐构建起一个理解网络。这为你提供了深刻的知识,这将使你与众不同。

这里是一个关于逻辑回归的小型主题网络的例子。为了说明,我只包括了几个主题——我相信你能想出更多。网络中的每个主题都有自己的网络,形成了一个庞大的相关学习主题网络。

图片

由 Dall-e 根据用户特定提示生成的图像

我可以继续说,但你已经明白了。任何单个主题都会有一个庞大的相关主题网络。将这些主题列一个清单放在某个地方,当你完成当前主题时,你总会有一系列相关的主题可以深入研究!

注意:你的主题网络需要从某个地方开始。如果你发现很难开始,我建议阅读 Hastie、Tibshirani 和 Friedman 所著的《统计学习的要素》或《统计学习引论》。这些是基础读物,将帮助你进入一个优秀的主题研究网络。

发现渠道

工作项目和主题网络是两种优秀的整理研究主题的方法。然而,这两种方法有一个主要的盲点。如果你只使用这些技术,你将不会接触到在工作或自然学习顺序中不出现的话题。可能有一些非常重要的主题会被忽视。

我使用“发现渠道”来帮助捕捉那些没有自然出现的重要话题。发现渠道是任何向我展示独立于其他学习内容的话题的内容来源。我主要的发现渠道来源是 Towards Data Science、播客和 YouTube 频道。

图片

我目前最喜欢的“发现渠道”来源——图片由作者提供

在选择发现渠道时,选择一个涵盖广泛主题的来源非常重要。例如,如果我跟随一个专注于实验设计的播客,我可能不会从它那里获取广泛的研究主题。这可能是一个很好的 DOE 研究资源,但不会是一个好的发现渠道。

我在发现渠道上的整体学习努力相对较少,但它们在我的学习中扮演着非常重要的角色。

总结

我希望这篇文章能让你感到有动力开始独立学习,如果你还没有开始的话,或者如果你已经在学习,能给你带来额外的动力继续前进。我还希望我给你提供了一些关于如何想出学习内容的全新想法。

在几周后,我将发布这篇文章的第二部分,它将涵盖如何(1)避免倦怠,(2)选择学习策略,(3)利用独处来巩固和深化你的知识——敬请期待!

http://www.jsqmd.com/news/554029/

相关文章:

  • 2026高端晾衣架怎么选?十大品牌选购指南来了! - 匠言榜单
  • 连云港市区本地人推荐的特色家常铁锅炖餐厅
  • 超越跑分:Gemini 3.1 Pro 2026年多维度能力评估体系深度拆解
  • 斯坦福-CS253-网络安全笔记-全-
  • 如何快速掌握Mesa:Python多智能体建模的完整指南
  • 百川2-13B微调实践:为OpenClaw定制专属的自动化指令集
  • OpenClaw技能市场巡礼:Qwen3-32B适配度最高的5个工具
  • 上海地区好用的精密过滤器供应商有推荐的吗 - myqiye
  • 公众号排版别乱堆样式!抓住这几个要点,新手也能做出高级感 - 小小智慧树~
  • React Native PagerView入门指南:5分钟快速搭建页面切换组件
  • 公众号排版教程丨巨详细!用这个编辑器三分钟教会你公众号排版 - 小小智慧树~
  • 斯坦福-CS261-网络优化笔记-全-
  • 深入解析CAN总线通信原理与CANoe实战开发指南
  • SUNFLOWER MATCH LAB与SolidWorks集成展望:植物三维模型检索与匹配
  • 从零到一:基于LangFlow、Ollama与Neo4j的本地知识图谱问答系统搭建实录
  • 2026年北京地区知名护栏网品牌排名,靠谱的小区护栏网制造商有哪些 - 工业设备
  • 2026南京手表售后全攻略|高端奢华腕表维修科普+六城正规网点汇总 - 时光修表匠
  • 从iRMB到EMO:构建下一代轻量级密集预测模型的统一架构解析
  • 玄机——从钓鱼邮件到内网沦陷:一次完整攻击链的深度溯源分析
  • Qwen3-VL-2B为何选CPU优化?低门槛部署实战解读
  • 2026和你一起品味实力强的过滤机品牌,江浙沪哪家口碑好 - mypinpai
  • 中山湘菜馆价格多少,靠谱的优质品牌怎么选 - mypinpai
  • 智能模型的秘诀-跟踪特征历史
  • 斯坦福-AA228V-安全关键系统验证笔记-全-
  • 告别底噪和发热:TPA3255的PCB布局与散热设计保姆级教程(附嘉立创EDA文件)
  • Ostrakon-VL-8B效果展示:AI识别货架商品、检查消防通道真实案例
  • AI Agent操作系统架构师:Harness Engineer解析
  • 为什么 PHP 闭包要加 static?
  • Display Driver Uninstaller完全指南:解决显卡驱动残留的系统级清理方案
  • 智能模型调优-一个结合-LangGraph---Streamlit-的-AI-代理-提升机器学习性能