当前位置: 首页 > news >正文

华为昇腾让DeepSeek推理降价75%,Coding Agent军备赛也开打了

每天更新,带你读懂科技圈。
今日看点:华为昇腾 950DT 芯片被指令级拆解,DeepSeek 推理成本或降 75%;小米 MiMo Code 声称在 200+ 步任务上超越 Claude Code;智谱发布 GLM-5.2 旗舰模型、1M 上下文直追国际一线;PagerDuty CAIO 直言现在的 AI 事件响应工具缺了最关键的一层。


⭐ 今日精选

1. 华为昇腾 950DT 芯片首份指令级拆解:凭什么能让 DeepSeek 降价 75%?

华为最新的 AI 推理芯片昇腾 950DT 还没上线华为云,就被人架上了显微镜。指令级拆解报告显示:AI 推理场景下,950DT 单卡能让 DeepSeek 这类大模型的推理成本压到原来的四分之一。

字节跳动据说已经提前锁单。国产 AI 芯片喊了很多年,这次至少从纸面上看,是真正摸到了跟英伟达掰手腕的门槛。当然,纸面参数和实际落地差多远,还得等上线再说。但不管怎样,这是近两年最实打实的一次国产芯片进展。

2. Coding Agent 耐力赛开打:小米 MiMo Code 声称 200 步后超越 Claude Code

Coding Agent 有个肉眼可见的毛病:30 步以内贼好用,50 步开始飘,100 步基本废。小米新出的 MiMo Code 直接放话——我们在 200 步以后还能稳定产出,超越 Claude Code。

The New Stack 管这叫"耐力鸿沟"(endurance gap)。几乎所有 AI 编程工具都在这里翻车:短任务强得离谱,长程工程就崩。如果有人能真正解决这个问题,Coding Agent 才能真正从"代码片段生成器"变成"工程师搭档"。

3. 智谱 GLM-5.2 发布:1M 上下文 + 对标 Claude Opus 4.6

智谱这次升级很直接:GLM-5.2 把可用上下文窗口拉到 1M tokens,编程和长程推理都大幅提升。官方对标清单里直接写了 Claude Opus 4.6,没在藏。

结果 token plan 直接卖爆——V2EX 上有人吐槽跟爬虫搏斗了一早上也没抢到。模型强是好事,但连 token 都买不到,这说明国内开发者为好工具付费的意愿在快速升温。


🤖 AI前沿

Claude 为什么越来越"混蛋"了?

BitTorrent 创始人 Bram Cohen 写了篇很生气的文章,说 Claude 最近态度越来越傲慢,“像个知道自己比你聪明就懒得搭理你的同事”。HN 直接炸了。

有人觉得这是对齐调参的副作用——让模型更有"个性"总要付出代价。也有人认为 Anthropic 在 persona 设计上确实该反思了。

我其实比较好奇的是另一个问题:AI 助手到底该是什么性格?太听话像客服机器人,太有个性像杠精。这个平衡比 benchmark 刷分难多了。

AI 就是代码——别指望提示词能让它变聪明

The Register 今天的文章给"提示词万能论"泼了盆冷水。道理很简单:一个模型的智力上限由代码和训练数据决定,提示词只是把你抽屉里原本就有的东西翻出来,不会凭空制造能力。

那些天天研究提示词黑魔法的人看到这篇可能不太高兴。但事实就是这样——工程手段就是工程手段,不是炼金术。

Agent 自己做决策时,数据库成了最大拖累

大模型从聊天工具变成能自主编排应用栈的 Agent 以后,一个尴尬的情况出现了:数据库扛不住。

状态管理、事务一致性、并发控制——这些数据库的老问题,在 Agent 场景下被放大了好几个数量级。你让 Agent 自己调 API、改数据,它可不会等你慢慢做事务回滚。数据库圈该紧张起来了。

AI 钓鱼已经全自动化了

AI 能帮你写代码,也能帮黑客写钓鱼邮件——批量、自动、千人千面。有分析系统梳理了 AI 在钓鱼攻击全流程的应用,也给出了技术+人员的分层防御思路。简单说就是:矛和盾都在进化,躺平的人先中招。


🛠️ 开发与工程

Vibe Coder vs. Software Engineer:一个 HN 帖子引发的战争

"Vibe Coder"这个词最近很火——专指那些靠 AI 对话写代码、但不太管底层原理的开发者。一篇 HN 讨论里,传统工程师和 Vibe Coder 之间的火药味快成代际战争了。

AI 确实在模糊"会用工具"和"懂技术"之间的线。但我的判断是:能看懂 AI 产出的工程师不会失业,只会越来越贵。因为看懂的难度,其实被 AI 拉高了。

zinnia:Rust 写的 64 位 Unix-like 内核

Lobste.rs 上有人分享了一个叫 zinnia 的开源项目——用 Rust 从零构建的模块化 64 位类 Unix 内核。离实用还很远,但信号很明确:Rust 在系统编程上已经不只是"可以试试"了。


☁️ 基础设施与云原生

PagerDuty CAIO:AI 事件响应工具都缺了最关键的一环

70% 的线上故障是代码变更搞出来的。PagerDuty 的首席 AI 官说得很直白:现在几乎所有 AI 故障响应工具都只在监控指标上花功夫,没人去分析变更和故障之间的因果关系。你收到告警了,但没人告诉你——“就是昨天那个 PR 改了一行配置导致的”。

AI Agent 的审计追踪到底该怎么设计?

Agent 开始自己做决策、调 API、改数据了,传统日志突然显得很不够。The New Stack 提出把审计追踪从"出事了才翻"的被动模式,升级成能驱动业务决策的"收入资产"。听着有点营销话术的味,但思路是成立的。

Uber 单账户 30+/秒并发更新怎么做到的?

Uber 公开了一套分布式账务系统的技术细节,核心是靠批处理策略撑住了单账户每秒 30+ 次更新的极端场景。做高并发交易的同学可以翻原文。


🏭 大厂动态

SpaceX IPO 效应正在扩散。TechCrunch 说一批 AI 公司正试图搭这班车,加速自己的上市。一级市场退出压力叠加上 AI 商业模式慢慢跑通,2026 下半年大概率会有一波 AI 公司 IPO。


📦 产品与行业

高瓴创投投了一家叫 SoulX 的消费级柔性机器人公司,几千万。首款产品 MoYa 是个"睡眠安抚机器人"——不用摄像头,靠模拟拥抱帮人缓解焦虑。不是工业机器人,也不是扫地机器人,主打情感陪伴。

从电影里的"大白"到现实里的 MoYa,路刚刚开始走。


📝 写在最后

今天这几条线索如果串起来,其实就一句话:AI 正在从秀肌肉变成真刀真枪。

昇腾 950DT 让国产算力有了第一次硬碰硬的资本。MiMo Code 把 Coding Agent 的竞争从百米冲刺拖进了马拉松。PagerDuty 和审计追踪的讨论说明——AI 落地的坑,比 PPT 上画的多得多。

下周再回来看,哪些会被遗忘、哪些会成为节点,谁也不知道。但至少今天,这几件事值得记住。

觉得有用?点个在看,让更多人看到 🎯
关注我,不错过每天的科技干货


参考资料

[1] 华为昇腾 950DT 芯片指令级拆解: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651286966&idx=1&sn=33044df3c1d2b3664baf784d61cca573
[2] 小米 MiMo Code 声称超越 Claude Code: https://thenewstack.io/coding-agent-endurance-gap/
[3] 智谱 GLM-5.2 发布: https://www.v2ex.com/t/1220302#reply21
[4] 自主智能体遇阻数据库: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651286966&idx=2&sn=66c6a43ee91dca691395c664568f0407
[5] PagerDuty CAIO AI事件响应: https://thenewstack.io/ai-incident-management-harness/
[6] AI Agent 日志与审计追踪: https://thenewstack.io/audit-trails-revenue-asset/
[7] Uber 批处理系统: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651286966&idx=4&sn=f895b338df56a0a3bce75d7b866eeaec
[8] Vibe Coder vs. Software Engineer: https://yusufaytas.com/vibe-coder-vs-software-engineer
[9] Claude 为什么变"混蛋": https://bramcohen.com/p/why-is-claude-turning-into-an-asshole
[10] AI 就是代码: https://www.theregister.com/ai-and-ml/2026/06/14/ai-is-code-and-cant-be-prompted-into-being-smarter/5254141
[11] zinnia Rust 内核: https://zinnia-os.org/
[12] AI 驱动的网络钓鱼: https://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651286966&idx=3&sn=c581788f8e8e12501f59854e6846725c
[13] AI 公司 IPO 热潮: https://techcrunch.com/2026/06/14/as-ai-companies-race-to-go-public-who-else-is-along-for-the-ride/
[14] 高瓴投柔性机器人 SoulX: https://36kr.com/p/3851572421432324?f=rss

http://www.jsqmd.com/news/1017315/

相关文章:

  • 石家庄汽车音响店亲测:2026年5月案例分享首推石家庄大苹果汽车音响 - 资讯纵览
  • 大连翡翠回收实测测评!2026高价变现靠谱渠道盘点 - 薛定谔的梨花猫
  • 为什么你的小程序图片裁剪功能需要we-cropper这个终极方案?
  • 2026 成都持证黄金回收门店汇总,仪器鉴定当场结算安心变现 - 奢侈品回收评测
  • 终极资源聚合方案:一站式搜索上百个平台的完整指南
  • 终极免费方案:OBS多平台同步直播插件完整指南
  • Mythos门控架构:大模型能力与策略解耦的工程实践
  • garde未来路线图:即将发布的5个令人期待的新功能
  • 靠谱的openclaw哪个最强
  • Visual C++运行库修复工具:5分钟快速解决Windows软件启动错误的完整方案
  • 深入解析FlexRay控制器:从协议原理到PXS20实战配置
  • 2026 佛山黄金回收实力榜单,全套设备持证回收,稳妥盘活黄金资产 - 奢侈品回收测评
  • 重庆二手钻石回收口碑榜,正规实体店权威排序 - 讯息早知道
  • FlexRay控制器内存错误注入与协议状态管理深度解析
  • Chatwoot 实测:免费部署一套全渠道客服系统,替代 Intercom 每年省几万
  • 【本地 AI 智能体】 OpenClaw 零基础 Windows 安装配置全流程(包含安装包)
  • 嵌入式实时调试:ColdFire2/2M硬件断点与调试中断实战解析
  • DeepLab_v3常见问题完全指南:训练不收敛、内存不足、精度低的终极解决方案
  • ImageGlass图像浏览器:支持90+格式的现代开源解决方案
  • ZigBee集群库(ZCL)核心概念、API与智能能源开发实战
  • 全网首份指令级拆解:华为昇腾950DT如何撬动DeepSeek 75%降价与字节锁单
  • PowerPC e300核心指令集与手册修订深度解析:嵌入式开发避坑指南
  • 好用的openclaw哪个公司好
  • 2026推荐:肇庆井水检测单位,农村饮用水井水检测中心 - 公共场所卫生检测
  • 2026无锡江诗丹顿回收测评 7家门店对比 当场打款推荐 - 开心测评
  • 如何快速掌握Upkie:开源双足轮式机器人的完整实践指南
  • 5步搭建智能微信群消息转发系统:告别重复劳动,实现信息同步自动化
  • NLP语义校准协议:从分词失真到可解释决策的工程实践
  • d3d8to9:让经典Direct3D 8游戏在现代Windows系统上重生
  • 5分钟掌握UV Squares:Blender UV编辑的智能网格转换革命