当前位置: 首页 > news >正文

从头开始构建的力量

从头开始构建的力量

原文:towardsdatascience.com/the-power-of-building-from-scratch/

在我们的作者聚焦系列中,我们与社区成员聊天,了解他们在数据科学和 AI 领域的职业道路、他们的写作以及他们的灵感来源。今天,我们非常高兴与Mauro Di Pietro进行对话。*

Mauro 是一位拥有十年欧洲和亚洲银行业经验的数据科学家和内容创作者。他学习量化金融,但毕业后自学编程,这激发了他编写教程的热情,将复杂主题分解成简单且引人入胜的解释。


您用 Python 和 Ollama 编写了一系列令人印象深刻的关于从头开始构建AI 代理的文章。是什么激励您避免使用像 OpenAI API 或付费云服务这样的工具?

我喜欢自己动手制作东西,并且我是“开源”的超级粉丝。

我来自机器学习的早期时代,当时数据科学家们习惯于自己训练模型。我对那些日子感到非常怀旧,那时候“你需要的一切”不是注意力,而是一个小数据集、Scikit-learn和有限的计算能力就足以进行良好的分类。我特别怀念数据探索的部分,因为我擅长绘图。如今,我们都在使用ChatGPT,我实际上已经多年没有训练过模型了……所以,我更喜欢在可能的情况下从头开始构建。

此外,我在银行业工作,习惯于处理高度敏感的数据。当你想要投资于控制和定制时,利用开源工具从头开始构建是一个更好的选择,而不是依赖付费云服务。你对自己的基础设施拥有完全的控制权,避免了供应商锁定,并能够更紧密地控制数据隐私和安全。更重要的是,它是免费的。因此,只要我能选择,我总是会选择“开源/从头开始”的方法。

关于“从头开始”的方法:您从零开始背后的哲学是什么,您是如何平衡教育清晰度与现实世界复杂性的?

我相信,只有当你尝试自己做事时,你才能真正学到东西。成长很少来自于第一次就做对。

在实际应用中,事情永远不会按计划进行,因此人们应该了解理论与实践之间的差距。为了在这两者之间取得妥协,将理论视为一个灵活的基础而不是一个僵化的框架是至关重要的。理论提供了在理想条件下工作的模型,但现实世界的情况伴随着噪声、不确定性和约束(如预算、时间和人类行为)。最终,在理论与实践的灰色地带,聪明的想法可以产生真正的价值。因此,为了处理现实世界的复杂性,首先你需要掌握教育示例。

但这不仅仅是人工智能:这适用于一切……生活是一个试错的过程。我们通过经验进化:尝试、失败、调整,然后再尝试。这就是人类(和机器)的学习。

你已经探索了单一代理、多代理和基于链的架构。随着你通过这些模型的发展,你对代理设计的看法是如何演变的?

目前,单一代理(Single Agents)是最佳选择,也是最接近生产就绪的。特别是,当用例领域定义良好且可以由单一控制点有效管理时,单一代理比多代理系统更优越。它们更容易设计、测试和维护。

另一方面,多代理系统在决策过程中引入了额外的复杂性,这可能是多余的,甚至可能适得其反。

在一个系统中添加的代理越多,控制起来就越困难,输出的质量也会受到影响。让我们记住,任何来自机器学习模型的结果都必须始终得到验证。

所以,除非任务从分布式智能中获益,否则我建议首先尝试单一代理。

当你使用的是经常处于人工智能研究和开发前沿的工具和方法时,你是如何保持与时俱进和灵感的?

哦,这是最难的部分,因为我是一个非常懒惰的人。推动我保持行业前沿的是好奇心、激情和恐惧错过(FOMO)……我不想被落下!

就像任何其他作家一样,我读了很多书,特别是为了发现新的趋势。此外,我始终与社区互动,以了解其他人如何处理类似的问题。例如,很多读者通过 LinkedIn 联系我,请求帮助运行我文章中的代码。我总是试图了解他们的用例,一起讨论最佳可能的方案,有时会涌现出新的想法。

创新通常来自跨学科曝光,通过同行和用户的反馈。因此,我认为保持灵感的最佳方式是与人们交谈。

然后,一旦你让灵感像汽油一样流淌,为了真正保持“与时俱进”,你需要通过动手实验(即复制文章、为开源项目做出贡献、构建原型)来磨砺自己。

展望未来,你最兴奋的是构建哪些类型的问题或系统,或者看到其他人使用人工智能代理构建的系统?

我认为代理(Agents)就像是“婴儿人工智能”。随着现代自然语言处理和计算机视觉的发展,我们离拥有第一个通用人工智能软件的所有成分已经非常接近了。

当我还是个孩子,90 年代的时候,每家每户都有一台电脑,所有家庭成员都要共用。嗯,我相信这很快就会再次发生。很快,每个家庭都将拥有一个个人人工智能助手,它连接着所有的设备(手机、家庭、汽车……)。最终,机器人技术将在硬件方面迎头赶上,那个家庭人工智能助手将变成我们一直梦寐以求的个人机器人。

事实上,我对人工智能取代人类在小日常任务上感到非常兴奋。我迫不及待地想看到我的个人机器人发送电子邮件、预约和安排我一天的活动,而我则享受着早餐(因为我还是会自己动手做,因为“从零开始”的方法永远不会过时!)。


想了解更多关于 Mauro 的工作并关注他最新的文章,请在这里和LinkedIn上关注他。

http://www.jsqmd.com/news/543462/

相关文章:

  • 大型语言模型-LLMs-是如何学习的-玩游戏
  • 【Axure视频教程】拖动和滚动效果
  • 2026北京走时校准科普|全高端腕表品牌故障解析+六城正规网点实测 - 时光修表匠
  • MacOS上快速部署Milvus向量数据库:从零到AI应用开发环境搭建
  • 大型语言模型课程
  • 从图像中提取结构化车辆数据
  • 避坑指南:Buildroot添加自定义文件时90%人会犯的3个错误(附正确姿势)
  • 聊聊2026年江苏靠谱的老车翻新加工厂,这些品牌值得关注 - 工业推荐榜
  • 大型语言模型与心理健康
  • FRCRN与ComfyUI联动:构建可视化语音降噪工作流
  • 抽象类-数据科学家必须了解以成功为目标的软件工程概念
  • 双模型对比:ollama-QwQ-32B与Qwen在OpenClaw中的任务执行效率
  • 出色的-Plotly-编码系列-第八部分--如何平衡主导柱状图类别
  • Windows下OpenClaw实战:30分钟接入Qwen3.5-4B-Claude模型
  • 代理-AI-101-开始构建-AI-代理的旅程
  • 2026年江苏全车整备厂商盘点,具备全车优质整备服务的公司怎么选择 - myqiye
  • ollama-QwQ-32B模型量化+OpenClaw:低资源设备部署指南
  • 别再乱调参数了!彻底搞懂TextMeshPro字体图集的Dynamic与Static模式选择
  • InstructPix2Pix实战:个人照片优化,一键去瑕疵、美白牙齿
  • 2026年预制叠合板厂推荐,太原业臻建材服务区域覆盖山西 - mypinpai
  • OpenClaw技能商店:基于nanobot开发并分享自定义模块
  • 2026 优质 GEO 优化服务商 TOP5:技术创新与落地成效双优评选 - 速递信息
  • macOS风格光标主题:从视觉革新到交互未来的全面探索
  • SeqGPT-560M中文理解深度测评:对古汉语、方言、行业黑话的泛化能力分析
  • 基于MATLAB与Abaqus的粗糙表面建模与仿真全流程解析
  • 基于SAMC21G18的TM1629共阳数码管驱动实现
  • 【后端】【Django DRF】实战RBAC:构建企业级权限管理系统的关键步骤
  • 160+实用功能:OneMore插件如何让OneNote笔记管理效率翻倍?[特殊字符]
  • 踩过PCB小目标检测的坑后,我用YOLOv8几何增强把召回率从62%干到94%
  • 南北阁Nanbeige 4.1-3B在重装系统场景中的应用:自动化恢复工具开发