当前位置：首页 > news >正文

从头开始构建的力量

news 2026/7/3 5:41:10

从头开始构建的力量

原文：towardsdatascience.com/the-power-of-building-from-scratch/

在我们的作者聚焦系列中，我们与社区成员聊天，了解他们在数据科学和 AI 领域的职业道路、他们的写作以及他们的灵感来源。今天，我们非常高兴与Mauro Di Pietro进行对话。*

Mauro 是一位拥有十年欧洲和亚洲银行业经验的数据科学家和内容创作者。他学习量化金融，但毕业后自学编程，这激发了他编写教程的热情，将复杂主题分解成简单且引人入胜的解释。

您用 Python 和 Ollama 编写了一系列令人印象深刻的关于从头开始构建AI 代理的文章。是什么激励您避免使用像 OpenAI API 或付费云服务这样的工具？

我喜欢自己动手制作东西，并且我是“开源”的超级粉丝。

我来自机器学习的早期时代，当时数据科学家们习惯于自己训练模型。我对那些日子感到非常怀旧，那时候“你需要的一切”不是注意力，而是一个小数据集、Scikit-learn和有限的计算能力就足以进行良好的分类。我特别怀念数据探索的部分，因为我擅长绘图。如今，我们都在使用ChatGPT，我实际上已经多年没有训练过模型了……所以，我更喜欢在可能的情况下从头开始构建。

此外，我在银行业工作，习惯于处理高度敏感的数据。当你想要投资于控制和定制时，利用开源工具从头开始构建是一个更好的选择，而不是依赖付费云服务。你对自己的基础设施拥有完全的控制权，避免了供应商锁定，并能够更紧密地控制数据隐私和安全。更重要的是，它是免费的。因此，只要我能选择，我总是会选择“开源/从头开始”的方法。

关于“从头开始”的方法：您从零开始背后的哲学是什么，您是如何平衡教育清晰度与现实世界复杂性的？

我相信，只有当你尝试自己做事时，你才能真正学到东西。成长很少来自于第一次就做对。

在实际应用中，事情永远不会按计划进行，因此人们应该了解理论与实践之间的差距。为了在这两者之间取得妥协，将理论视为一个灵活的基础而不是一个僵化的框架是至关重要的。理论提供了在理想条件下工作的模型，但现实世界的情况伴随着噪声、不确定性和约束（如预算、时间和人类行为）。最终，在理论与实践的灰色地带，聪明的想法可以产生真正的价值。因此，为了处理现实世界的复杂性，首先你需要掌握教育示例。

但这不仅仅是人工智能：这适用于一切……生活是一个试错的过程。我们通过经验进化：尝试、失败、调整，然后再尝试。这就是人类（和机器）的学习。

你已经探索了单一代理、多代理和基于链的架构。随着你通过这些模型的发展，你对代理设计的看法是如何演变的？

目前，单一代理（Single Agents）是最佳选择，也是最接近生产就绪的。特别是，当用例领域定义良好且可以由单一控制点有效管理时，单一代理比多代理系统更优越。它们更容易设计、测试和维护。

另一方面，多代理系统在决策过程中引入了额外的复杂性，这可能是多余的，甚至可能适得其反。

在一个系统中添加的代理越多，控制起来就越困难，输出的质量也会受到影响。让我们记住，任何来自机器学习模型的结果都必须始终得到验证。

所以，除非任务从分布式智能中获益，否则我建议首先尝试单一代理。

当你使用的是经常处于人工智能研究和开发前沿的工具和方法时，你是如何保持与时俱进和灵感的？

哦，这是最难的部分，因为我是一个非常懒惰的人。推动我保持行业前沿的是好奇心、激情和恐惧错过（FOMO）……我不想被落下！

就像任何其他作家一样，我读了很多书，特别是为了发现新的趋势。此外，我始终与社区互动，以了解其他人如何处理类似的问题。例如，很多读者通过 LinkedIn 联系我，请求帮助运行我文章中的代码。我总是试图了解他们的用例，一起讨论最佳可能的方案，有时会涌现出新的想法。

创新通常来自跨学科曝光，通过同行和用户的反馈。因此，我认为保持灵感的最佳方式是与人们交谈。

然后，一旦你让灵感像汽油一样流淌，为了真正保持“与时俱进”，你需要通过动手实验（即复制文章、为开源项目做出贡献、构建原型）来磨砺自己。

展望未来，你最兴奋的是构建哪些类型的问题或系统，或者看到其他人使用人工智能代理构建的系统？

我认为代理（Agents）就像是“婴儿人工智能”。随着现代自然语言处理和计算机视觉的发展，我们离拥有第一个通用人工智能软件的所有成分已经非常接近了。

当我还是个孩子，90 年代的时候，每家每户都有一台电脑，所有家庭成员都要共用。嗯，我相信这很快就会再次发生。很快，每个家庭都将拥有一个个人人工智能助手，它连接着所有的设备（手机、家庭、汽车……）。最终，机器人技术将在硬件方面迎头赶上，那个家庭人工智能助手将变成我们一直梦寐以求的个人机器人。

事实上，我对人工智能取代人类在小日常任务上感到非常兴奋。我迫不及待地想看到我的个人机器人发送电子邮件、预约和安排我一天的活动，而我则享受着早餐（因为我还是会自己动手做，因为“从零开始”的方法永远不会过时！）。

想了解更多关于 Mauro 的工作并关注他最新的文章，请在这里和LinkedIn上关注他。

http://www.jsqmd.com/news/543462/

相关文章：

大型语言模型-LLMs-是如何学习的-玩游戏

【Axure视频教程】拖动和滚动效果

2026北京走时校准科普｜全高端腕表品牌故障解析+六城正规网点实测 - 时光修表匠

MacOS上快速部署Milvus向量数据库：从零到AI应用开发环境搭建

大型语言模型课程

从图像中提取结构化车辆数据

避坑指南：Buildroot添加自定义文件时90%人会犯的3个错误（附正确姿势）

聊聊2026年江苏靠谱的老车翻新加工厂，这些品牌值得关注 - 工业推荐榜

大型语言模型与心理健康

FRCRN与ComfyUI联动：构建可视化语音降噪工作流

抽象类-数据科学家必须了解以成功为目标的软件工程概念

双模型对比：ollama-QwQ-32B与Qwen在OpenClaw中的任务执行效率

出色的-Plotly-编码系列-第八部分--如何平衡主导柱状图类别

Windows下OpenClaw实战：30分钟接入Qwen3.5-4B-Claude模型

代理-AI-101-开始构建-AI-代理的旅程

2026年江苏全车整备厂商盘点，具备全车优质整备服务的公司怎么选择 - myqiye

ollama-QwQ-32B模型量化+OpenClaw：低资源设备部署指南

别再乱调参数了！彻底搞懂TextMeshPro字体图集的Dynamic与Static模式选择

InstructPix2Pix实战：个人照片优化，一键去瑕疵、美白牙齿

2026年预制叠合板厂推荐，太原业臻建材服务区域覆盖山西 - mypinpai

OpenClaw技能商店：基于nanobot开发并分享自定义模块

2026 优质 GEO 优化服务商 TOP5：技术创新与落地成效双优评选 - 速递信息

macOS风格光标主题：从视觉革新到交互未来的全面探索

SeqGPT-560M中文理解深度测评：对古汉语、方言、行业黑话的泛化能力分析

基于MATLAB与Abaqus的粗糙表面建模与仿真全流程解析

基于SAMC21G18的TM1629共阳数码管驱动实现

【后端】【Django DRF】实战RBAC：构建企业级权限管理系统的关键步骤

160+实用功能：OneMore插件如何让OneNote笔记管理效率翻倍？[特殊字符]

踩过PCB小目标检测的坑后，我用YOLOv8几何增强把召回率从62%干到94%

南北阁Nanbeige 4.1-3B在重装系统场景中的应用：自动化恢复工具开发