当前位置: 首页 > news >正文

揭秘 Intel 8087 浮点芯片加法器:69 位运算提速 100 倍,性能优化有何奥秘?

Intel 8087 浮点芯片核心的加法器

1980 年,Intel 推出了 Intel 8087 浮点协处理器,能让数学运算速度提升高达 100 倍。除基本算术和开方运算外,还能计算超越函数,这依赖于一个 69 位的加法器。专利中描述,浮点执行单元的算术核心围绕着一个由加法器及其相关寄存器、移位器和控制电路组成的纳米机器。显微镜下的 8087 芯片裸片,边缘键合线将芯片与 40 个外部引脚相连,裸片图案由金属布线、多晶硅和硅构成。芯片顶部的总线接口单元与系统其他部分相连,负责与主 8086 处理器和内存协调,指令由中间的大型微代码只读存储器定义。裸片下半部分是“数据路径”,分为指数和小数数据路径,加法器位于小数数据路径中间,指数加法需将指数复制到小数数据路径。

加法器的结构

构建二进制加法器不难,难的是让它运行更快,关键在于处理进位。8087 的加法器将加法运算拆分为 4 位一组的块,采用两种技术加快块内计算速度,减少进位步骤。加法器有两个输入,每一位的和通过对输入及进位进行异或运算得到,中间值被称为“传播”。1959 年,曼彻斯特大学研究人员为 Atlas 计算机开发了曼彻斯特进位链技术,基于生成、传播和删除的概念构建,信号可并行计算。8087 采用优化的曼彻斯特进位链电路,将生成和删除情况合并。进位链被分成 4 位一组的块,由“进位跳过”电路刷新进位。加法器为优化性能,使用 NMOS 晶体管,进位线预充电到 5V 再拉低,块中最后一个多路复用器有四个输入。生成“propagate”信号的电路存在复杂情况,“B”输入可被“forceZero”信号阻断。加法器划分为 4 位一组的块,使用曼彻斯特进位链和进位跳过电路优化性能,但仍需两个时钟周期完成一次加法运算。

硅片中的加法器

4 位块电路在裸片上垂直堆叠形成完整加法器。金属层呈现为白色线条,8087 只有一层金属层,金属布线紧密排列。左侧粗垂直金属走线是接地,右侧是电源,水平走线为加法器块内部提供布线,两侧垂直线是控制信号及与芯片底部电路的连接。移除金属层后,能看到硅和多晶硅电路,多晶硅与掺杂硅交叉形成晶体管,电路复杂不规则,通过水平金属线连接。图片左右两侧无晶体管,多晶硅线加宽以降低电阻,硅被“浪费”用于垂直布线。

加法器的规模

尽管 8087 名义上小数采用 64 位值,但加法器接收 69 位输入并生成 70 位输出。原因包括使用三个额外低位比特用于舍入,B 寄存器值可加倍需多一位,小数总线和 B 值取反需多一位。两个大数相加结果可能需多一位,和移位器可将输出右移两位缩减至 68 位,“额外”的位由专用寄存器支持。

周边电路

加法器输入来自小数总线和 B 寄存器,输出存储在和寄存器中。8087 为加快乘法运算使用基 4 Booth 乘法,乘数存储在跳过移位器中,根据位情况加上不同值,加法器输出由和移位器右移两位后存储在和寄存器。除法通过重复减法、加法和移位操作实现,结果比特位在商寄存器中累加。平方根实现类似手工开平方,跳过移位器提供两位附加到加法器输入右侧,进行减法或加法操作,平方根在 B 寄存器中形成。乘法、除法和开平方运算的循环操作在硬件中实现,指令需大量微代码准备参数、处理指数、处理特殊情况并存储结果。

结论

8087 专利强调加法器的重要性,其性能对 8087 整体性能至关重要。虽有更快加法方法,但对 8087 有限晶体管数量不可行,8087 在复杂度和性能之间平衡,采用带有进位跳过加法器的曼彻斯特进位链。

http://www.jsqmd.com/news/1011334/

相关文章:

  • 2026年北京市CPPM和SCMP课程咨询入口:众智商学院官网、400电话和冯老师 - 众智商学院官方
  • Recommended Articles推荐系统实战:语义+行为双驱动轻量架构
  • 遗传算法工程落地指南:从理论到可运行代码的实战降维
  • 抑郁症状动态建模:基于Reddit行为-语言耦合的临床级NLP分析
  • 基于PLC的智能照明控制系统设计4123(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)_文章底部可以扫码
  • 2026吉安厂区电能质量测试评估放心机构 TOP + 实地测评 + 详细地址电话 - 中检检测集团
  • AI工程师必读的10篇底层论文:从Transformer到RAG的工程穿透力地图
  • 2026揭阳厂区电能质量测试评估放心机构 TOP + 实地测评 + 详细地址电话 - 中检检测集团
  • AI模型上线后系统性风险防控:从部署集成到合规治理
  • 南宁卖黄金必看避坑指南!避开90%变现套路,高价稳妥出手闲置金 - 薛定谔的梨花猫
  • 题解:AtCoder AT_awc0028_d Course Enrollment Order
  • 掌握AI教材写作技巧!低查重工具助力,轻松打造专属优质教材!
  • 如何用MAA明日方舟助手一键完成全日常任务:终极免费自动化指南
  • 题解:学而思编程 小明的U盘
  • 2026年陕西地区技工院校权威观察:新纪元如何构建“教学-实训-就业”闭环生态 - 品研笔录
  • Mythos:首个可规模化漏洞挖掘的AI安全智能体
  • 飞腾D2000+银河麒麟V10开发笔记:网络编程时获取本机IP的几种方法对比
  • 2026邯郸本地水质检测饮用水检测哪家强?TOP 正规机构榜单 + 联系方式 - 中安检测集团
  • TranslucentTB终极教程:如何快速解决Windows任务栏透明化工具的VCLibs依赖问题
  • CVPR、ICCV、ECCV三大顶会到底怎么选?给计算机视觉研究新手的投稿全攻略
  • 2026怀化厂区电能质量测试评估放心机构 TOP + 实地测评 + 详细地址电话 - 中检检测集团
  • 从‘半选’状态聊起:如何用QSS为PyQt5/PySide2的QCheckBox设计一套专业的UI组件库?
  • 别再看官方文档了!手把手教你为SuperMap GIS项目选对国产服务器和CPU(附避坑清单)
  • 视频转PPT:如何从3小时会议录像中提取出完美演示文稿
  • skill 知识
  • 2026太阳能路灯实力厂家:市政/农村/景区/庭院/小区路灯,匠心品质与亮化工程优选 - 品牌发掘
  • 终极QQ音乐解密指南:3分钟解锁你的加密音乐库
  • dendrogram如何提升销售预测准确率:产品相似性建模实战
  • 2026济南本地水质检测饮用水检测哪家强?TOP 正规机构榜单 + 联系方式 - 中安检测集团
  • Ferret多模态模型:实现像素级UI理解与指哪打哪的视觉-语言对齐