当前位置: 首页 > news >正文

62-260515 AI 科技日报 (Qwen3.6 模型推理速度再提升,MTP加速至1.8倍)

62-260515 AI 科技日报 (Qwen3.6 模型推理速度再提升,MTP加速至1.8倍)

共收录21条资讯

AI模型

  1. Qwen3.6 MTP推理加速至1.8倍,新GGUF发布— 在llama.cpp中,Qwen3.6 MTP GGUF模型通过优化新参数--spec-draft-p-min,推理速度提升了1.8倍。 🔗
  2. ChatGPT免费用户暂别GPT-5.5— ChatGPT免费版用户现在只能使用GPT-5.4模型,暂时无法访问最新的GPT-5.5。 🔗
  3. 小米开源自动驾驶大模型Xiaomi OneVL— 小米具身智能团队开源了多模态视觉语言模型Xiaomi OneVL,专为自动驾驶场景中的感知与决策任务设计。 🔗

产品发布

  1. 谷歌Gemini Spark新截图曝光— 从泄露的截图看,谷歌Gemini Spark将主打高级工具使用和技能创建能力,但目前版本尚不支持浏览器控制。 🔗
  2. Codex新功能:Mac锁屏后任务继续跑— OpenAI Codex正在测试一个新特性,允许在Mac电脑锁屏后,正在运行的任务不受影响。 🔗
  3. Codex登陆手机ChatGPT,免费开放— OpenAI编程助手Codex集成到ChatGPT移动端,向所有用户免费开放,支持远程对桌面端对话发送指令和查看进度。 🔗
  4. 阿里云发布Qoder 1.0智能体工作台— 阿里云推出Qoder 1.0,将其定位从AI IDE升级为智能体自主开发工作台,采用Agent-first设计,并内置了团队级知识引擎。 🔗
  5. Runway推出视频创作智能体Runway Agent— Runway发布了能够理解复杂创意描述、并自主规划和执行视频生成任务的AI智能体Runway Agent。 🔗

研究论文

  1. 新范式:让LLM学会“自我教学”— 研究提出Pedagogical RL,其核心是让大语言模型先学习正确答案的分布规律,再从中采样,而非单纯通过尝试和错误来学习。 🔗
  2. 一篇关于Agentic AI通往AGI的立场论文— 一篇新的立场论文探讨了将AI代理(Agentic AI)作为实现通用人工智能(AGI)的一条可行路径。 🔗
  3. 大模型内部的“形状旋转计算器”— 研究发现,大语言模型内部可能隐藏着一种通过“旋转形状”来执行数学计算的机制。 🔗

工具推荐

  1. OpenClaw新版本:TS安全库速度飙升— OpenClaw新版TypeScript安全文件系统库将文件操作速度提升10倍,整体性能提升3.5倍。 🔗
  2. MCP服务器选对了,能省30%的token— 基准测试表明,在Claude中选用合适的MCP服务器,可以减少高达30%的token消耗并提高任务成功率。 🔗
  3. 开源Skill:AI自动撰写软著申请材料— 一个开源工具能够读取本地代码项目,自动生成软件著作权申请所需的操作手册和代码材料。 🔗
  4. 实时Qwen3-TTS,无需vLLM或Triton— 不依赖vLLM或Triton,即可实现Qwen3-TTS实时语音合成的方法。 🔗
  5. 月之暗面推出Kimi WebBridge浏览器插件— 月之暗面发布Kimi WebBridge插件,利用AI自动执行登录、点击、填表等浏览器操作,实现网页任务自动化。 🔗

行业动态

  1. DeepSeek-V4技术报告工程细节视频流出— 一份视频分享了DeepSeek-V4技术报告中的部分工程优化细节和模型训练实践技巧。 🔗
  2. 新概念:Agent体验(AX)— 开发者提出AX(Agent体验)概念,旨在衡量代码库对AI代理的友好程度与可操作性。 🔗
  3. Yann LeCun:开源是AI的未来— Yann LeCun转发并强烈支持一篇倡导开源AI的文章,认为反对开源的论点本身是有问题的。 🔗
  4. 《华盛顿邮报》披露AI公司的“秘密指令”— 《华盛顿邮报》报道揭示了部分AI公司用于引导其聊天机器人行为的内部指令。 🔗
  5. 科学家在《纽约时报》呼吁加强AI监管— 来自MIT等机构的科学家在《纽约时报》联合发文,呼吁对AI技术实施更强有力的监督与监管。 🔗

一起学习AI。

http://www.jsqmd.com/news/826507/

相关文章:

  • 开源智能体框架xbrain:模块化设计与工程实践指南
  • 基于DB-GPT-Hub的文本到SQL微调实战:从原理到企业级部署
  • AI Agent Harness Engineering 的安全攻防:你的智能体如何被欺骗、劫持与利用
  • 指纹浏览器开发教程五:浏览器内存信息相关能力该怎么改
  • 基于MCP协议构建AI技能服务器:从原理到实战开发指南
  • SLO-Warden:基于错误预算的云原生服务稳定性自动化管理实践
  • 智能苔藓花园:用CircuitPython与NeoPixel打造会呼吸的天气可视化装置
  • Kaggle竞赛实战技能库:从数据预处理到模型集成的完整工程化实践
  • FAST开发方法在系统分析中四个阶段
  • Windows Cleaner:3步解决C盘爆红,快速释放系统空间的实用指南
  • 2026年公考软件大盘点:技术架构与用户体验深度评测
  • 04 AI 时代的岗位分工与协作机制
  • SpleeterGui终极指南:3步实现AI音乐人声分离的免费神器
  • 我们团队的技术债已经堆成山,我用这四步说服老板给时间重构
  • Swift集成飞书API:原生SDK实现iOS/macOS应用无缝协同
  • 使用git filter-repo删除已提交到git中的敏感信息,api key,配置文件等
  • 二分查找与二分答案模板
  • 【BUUCTF】【WEB】Nmap
  • AI时代PPT实战:产品思维与AI辅助的高效演示方法论
  • Maven依赖裁剪插件paperclip-plugin-acp实战:Spring Boot瘦身利器
  • 书成紫微动,律定凤凰驯:从无心创作到天命显化的海棠山铁哥之路
  • Go语言构建高并发实时流媒体服务器:dundas/liveport架构与实战
  • Ketcher分子编辑器实战指南:从基础绘图到高级生物分子设计
  • BilibiliDown:零基础小白也能轻松下载B站视频的完整指南
  • 西安电子科技大学网络对抗原理选修课实验2-基于Snort的入侵检测实验
  • 2026年评价高的洛阳流行舞蹈培训/洛阳舞蹈培训/洛阳零基础舞蹈培训/洛阳爵士舞培训哪家专业 - 行业平台推荐
  • 如何通过Perseus实现碧蓝航线皮肤解锁与游戏深度定制
  • AI技能库实战指南:结构化Prompt与自动化流程提升内容创作效率
  • Proxima向量检索库:硬件优化与量化技术实战解析
  • 代码审查时最该关注的不是语法,而是这五个“坏味道”