当前位置: 首页 > news >正文

Lecture 2:A Modern Multi-Core Processor (Part I)

  1. 处理器分类
    1. 超标量(Superscalar):利用指令流内部的指令级并行性。在同一指令流中并行处理不同的指令(在单个核心内)——并行性由硬件在执行中自动发现;比如在一个指令IO的时候转去执行与该IO指令无关的指令
    2. SIMD:多个算术逻辑单元(ALU)由相同指令控制(在单个核心内)——适用于数据并行工作负载:将控制成本分摊到多个ALU上——向量化由编译器完成(显式SIMD)或由硬件在运行时完成(隐式SIMD)
    3. 多核(Multi-core):使用多个处理核心——提供线程级并行性:在每个核心上同时执行完全不同的指令流——软件通过创建线程向硬件暴露并行性(例如,通过线程API)
  2. 硬件支持的多线程
    1. 内核保存多个线程的执行上下文 - 内核仍然拥有相同数量的 ALU 资源:多线程不增加 ALU 数量,而是通过线程切换掩盖延迟;空间换时间
    2. 交错多线程(也称时间多线、时间片多线程、粗粒度/细粒度多线程):每个时钟周期,内核选择一个线程,并在内核的 ALU 上执行该线程的一条指令
    3. 同时多线程(SMT) - 每个时钟周期,内核选择多个线程的指令在 ALU 上执行
  3. SMT与超标量技术区分:
    1. 超标量(Superscalar)通过在一个线程内并行执行多条独立指令,挖掘指令级并行性(ILP)
    2. 同时多线程(SMT)通过在一个周期内混合执行多个线程的指令,挖掘线程级并行性(TLP)
    3. 两者都共享同一组物理执行资源(如 ALU、FPU、Load/Store 单元等),并不增加这些资源的数量
  4. simple processor: DataCache, Fetch/Decode, ALU,Execution Context
Superscalar core SIMD execution capability Heterogeneous superscalar Multi-threaded core Multi-threaded, superscalar core Multi-core, with multi-threaded, superscalar cores GPU
multi F/D single F/D multi F/D single F/D multi F/D multi F/D single F/D
multi scalarALU multi vectorALU scalarALU+vectorALU single ALU scalarALU+vectorALU scalarALU+vectorALU multi vectorALU
single Context single Context single Context multi Context multi Context multi Context multi Context
single Cache single Cache single Cache single Cache single Cache single Cache + Shared Cache single Cache
http://www.jsqmd.com/news/330327/

相关文章:

  • 【状态估计】扩展EKF和无迹卡尔曼滤波UKF ieee33电力系统动态状态估计【含Matlab源码 15032期】
  • IEEE论文投稿Latex工程预先检查平台
  • 基于Simulink的根轨迹法控制器设计与仿真建模示例
  • 图文详解Trae配置Java开发环境
  • 完整教程:python+django/flask+vue的书城图书阅读器系统,亮点含目录章节pycharm
  • 电子学会青少年软件编程(C语言)等级考试试卷(三级)2025年12月
  • Ansys maxwell 变压器教学资料 包含 两套文件 1.全部基础功能的操作教学以及模型...
  • 数字化转型下的订单管理全流程解决方案 - 教程
  • P9339 [JOIST 2023] 曲奇 / Cookies 题解
  • AI应用之测试用例(4)
  • 人工智能其实没那么玄乎:看完这篇你就全懂了
  • 完整教程:Laravel下载和安装图解(非常详细)
  • 会干活的机器人来了!motbo机器人到底有啥本事?
  • 【干扰】稀疏重构的空域-极化域联合抗主瓣干扰方法【含Matlab源码 15035期】复现含文献
  • 一天一个开源项目(第9篇):NexaSDK - 跨平台设备端 AI 运行时,让前沿模型在本地运行
  • 广州市PHP定制开发行业解析:概念、实践与常见问题
  • 当15岁成为“红线”,法国社交平台新规落地
  • 效果-Sapphire
  • 印尼IGRS强制令生效,分级不准恐遭全网阻断
  • 商业应用(4)蓝莓产季管理水果基地管理—东方仙盟练气期
  • 汉字不止二维!克莱因瓶解锁汉字拓扑密码:从部首粒子到宇宙演化新语言
  • 自己平台接入国家网络身份认证公共服务接入
  • Agent Skills
  • day73(2.1)——leetcode面试经典150
  • 云雀播放器 2026.1.9 | 高颜值音乐播放器动画非常流畅 全球超1亿用户
  • 【状态估计】基于matlab扩展EKF和无迹卡尔曼滤波UKF ieee33电力系统动态状态估计【含Matlab源码 15032期】
  • Flutter艺术探索-Flutter在鸿蒙端运行原理:OpenHarmony平台集成
  • GrokAI1.1.14-release.09 | 实测可无敏感生图,可生成视频
  • 一个同步机无传感滑膜观测器模型加代码,该模型基于28035芯片,采用了典型的smo+pll方案...
  • 模型训练过程