当前位置: 首页 > news >正文

如何使你的数据科学/机器学习工程师工作流程更有效

原文:towardsdatascience.com/how-to-make-your-data-science-ml-engineer-workflow-more-effective-4f857c36bbc1

任何从事编程工作的人都需要一个有效的流程。许多任务都很耗时,你希望尽可能多地自动化以减少手动工作。在这篇文章中,我讨论了我最近如何作为一个数据科学家更新我的工作流程,从使用 Jupyter 笔记本转向使用 VS Code 交互式窗口。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/3d3af8e48c80d9b57c3b44f0844b688c.png

本文讨论了如何使用 VS Code 交互式窗口来优化你的数据科学/机器学习工程工作流程。图片由 ChatGPT 提供

为了展示新的工作流程,我将使用一些简单的代码来突出如何使用新的工作流程更快地工作。然而,你应该注意,我认为新工作流程的好处随着项目的复杂度增加而增加。当项目变得更大时,Jupyter 笔记本的问题就会增多,更难对你的数据进行概述。因此,我认为我在本文中展示的工作流程的好处将随着实际项目而增加。我将在整篇文章中使用图片和视频来直观地展示如何使用 VS Code 交互式窗口。我写这篇文章的灵感来自 Dave Ebbelaar 的这个 YouTube 视频(https://www.youtube.com/watch?v=qFvInA7DKuE&t=395s),关于他如何停止使用 Jupyter Notebook。

目录

· 动机 · 使用 VS Code 交互式窗口 ∘ 设置 ∘ 好处 · 结论

动机

我写这篇文章的动机是,作为一个数据科学家,我一直在寻找改进我工作方式的方法。我认为在我的工作中,保持对最新趋势的了解至关重要,无论是跟上最新的机器学习模型,使用新的 IDE 如 Cursor,还是通过使用交互式窗口来改进我的工作流程。因此,在这篇文章中,我分享了我在数据科学相关项目中最近的工作流程变化,从在 Jupyter 笔记本中工作到使用 VS Code 中的交互式窗口。改变工作流程后,我在编写代码和实验方面变得显著更有效率,这对于你想要在数据科学项目中取得成功至关重要。

使用 VS Code 交互式窗口

设置

要开始使用 VS Code 中的交互式窗口,你必须在设置中激活它。打开 VS Code 的设置,搜索 Jupyter 交互式窗口,并启用表示“按 shift+enter 时,发送所选代码”的复选框。下面是一个设置图片的示例:

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/950016c6becd04dad6caede266d25ab4.png

在 VS Code 中激活交互式窗口设置的图片。图片由作者提供。

现在,你已经准备好使用交互式窗口了。打开一个 Python 文件,标记你想要运行的代码,然后按住 shift 键并按下 enter 键。只有标记区域内的代码会被运行,并且变量会被存储。这允许你直接从 Python 文件中工作,同时获得使用 Jupyter Notebooks 的大部分好处。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/5b834cb2011850016a7092f5c6d938e6.png

此图片展示了我标记了左侧所有代码并按下 shift enter 后的 VS Code 视图。这打开了右侧的交互式窗口,运行了你所选的所有代码(你只看到第一行,但你也可以扩展该行,如图片下方所示。图片由作者提供。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/61e37828ddf1c1147f63ecf2f75e9113.png

展示如何扩展运行单元格以增强清晰度的图片。图片由作者提供。

现在,变量ab已经被定义,例如,为了理解加法函数的工作原理,我可以通过按行标记第 5 行,按下 shift enter,然后只标记单词 result 来打印出结果值。请注意,在这个例子中,函数非常容易理解,但随着你处理更复杂的编程,这会非常有用,便于轻松理解和调试函数。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/8cd45c315ec5354884c0b383151444e5.png

运行第 5 行,定义变量 result 后,标记变量 result,并运行它以查看变量的值。图片由作者提供。

你可以在这里使用的另一个有用功能是打开终端窗口(在 Windows 上使用 ctrl+j,在 Mac 上使用 cmd+j)。然后,你可以选择 Jupyter 标签来查看所有变量的值。

https://github.com/OpenDocCN/towardsdatascience-blog-zh-2024/raw/master/docs/img/39a07d08bd778b80a33a36e9329a3b52.png

在底部打开 Jupyter 终端后的我的 VS Code 视图,以查看所有变量的值。这有助于快速检查所有变量的值,便于轻松调试和理解代码。图片由作者提供。

您可以观看以下我解释的视频:

cdn.embedly.com/widgets/media.html?src=https%3A%2F%2Fwww.loom.com%2Fembed%2F1e5ec8dec00e40be9ccc6f4e130cf810&display_name=Loom&url=https%3A%2F%2Fwww.loom.com%2Fshare%2F1e5ec8dec00e40be9ccc6f4e130cf810%3Fsid%3Dace6f471-ca4a-42f7-8555-a05537cfb18a&image=https%3A%2F%2Fcdn.loom.com%2Fsessions%2Fthumbnails%2F1e5ec8dec00e40be9ccc6f4e130cf810-d3135cc5319d4086.gif&key=a19fcc184b9711e1b4764040d3dc5c07&type=text%2Fhtml&schema=loom

优点

使用交互式窗口有许多好处。以下列出了主要优点:

  • 更快。我认为使用交互式窗口比使用 Jupyter 笔记本工作更快。你不需要创建单元格;你可以简单地标记代码并运行它。例如,要打印变量,你只需要选择变量并按 shift enter 键,而不是创建一个新的单元格,编写变量名,然后运行单元格。

  • 更干净的代码。我认为在 .py 文件中编写代码通常迫使你编写更干净的代码,例如,通过尽可能多地使函数模块化。Py 文件通常也比 Jupyter 笔记本更容易阅读。

  • 生产就绪。在 Py 文件中编写代码意味着你的代码已经准备好推送到生产环境,这样可以节省更多时间。

结论

在这篇文章中,我讨论了您如何使用 VS Code 交互式窗口来提高作为数据科学家或机器学习工程师的工作流程效率。我发现从 Jupyter 笔记本切换到交互式窗口后,生产力显著提升,因此我认为这绝对是一个值得尝试的改变。

http://www.jsqmd.com/news/145470/

相关文章:

  • Java毕设选题推荐:基于springboot的马蜂窝书店网站SpringBoot+Vue 马蜂窝书店网站管理平台【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 5分钟掌握在线UML工具:浏览器中零配置绘图的终极方案
  • Unity游戏翻译神器:XUnity.AutoTranslator自动翻译插件完全解析
  • Fritzing中Arduino电路设计:新手教程(零基础入门)
  • 2025最新!自考党必看!9个AI论文软件测评与推荐
  • 独家技巧!AI应用架构师优化AI模型训练效率的不传之秘
  • 如何快速实现Unity游戏翻译:XUnity.AutoTranslator终极使用指南
  • ESP32 Wi-Fi通信模式详解:STA与AP全面讲解
  • 通用 ARM Cortex-M 全系列 Makefile 模板
  • XUnity.AutoTranslator终极使用指南:零基础5分钟实现游戏汉化
  • 树莓派4b引脚功能图轻松学:图文并茂的入门指导
  • 鱼竿什么牌子质量好而且价格便宜?鱼竿什么品牌好用?质量好的鱼竿推荐 - 品牌2026
  • 3.2.3 页框分配
  • PaddlePaddle镜像如何对接Kubernetes做集群管理?
  • PaddlePaddle镜像支持多卡并行训练吗?代码示例奉上
  • 巴菲特-芒格的区块链技术看法:潜在的颠覆性影响
  • 标配麒麟9020A!华为Mate 70 Air 16GB内存版开售:4699元起
  • 3.2.4 页面置换算法
  • 2025年山东威海鱼竿生产厂家权威推荐!手感好的鱼竿推荐精选解析 - 品牌2026
  • 解决Arduino IDE烧录ESP32常见问题:操作指南
  • GEO源码搭建实力强,源码云科技成企业合作首选 - 源码云科技
  • PaddlePaddle镜像集成VisualDL:可视化训练过程更直观
  • 3.2.5 抖动和工作集
  • 【计算机毕业设计案例】基于springboot的茶食酒馆网站在线预订 + 菜品展示 + 会员管理(程序+文档+讲解+定制)
  • 【毕业设计】基于springboot的旅拍在线婚纱摄影网站的设计与实现(源码+文档+远程调试,全bao定制等)
  • 手竿什么品牌质量最好?手竿鱼竿品牌排行榜前十位,中国手竿十大品牌盘点 - 品牌2026
  • PaddlePaddle镜像与MLflow集成:实现模型生命周期管理
  • 3.2.2 请求分页管理方式
  • 新手买钓鱼竿怎么选?新手鱼竿买什么牌子好?2025年新手鱼竿推荐性价比高的鱼竿推荐 - 品牌2026
  • 【毕业设计】基于springboot的马蜂窝书店网站(源码+文档+远程调试,全bao定制等)