基于硬件的分支预测包含两个关键部分:分支条件预测和分支目标预测。分支条件预测决定是否执行分支,而分支目标预测则确定分支的目标地址。这两部分同样重要。
分支条件预测
分支条件预测分为静态预测和动态预测。静态预测指的是分支总是被执行或总是被忽略,但在现代CPU技术中,静态预测已不常用且过时,因此我们应关注动态预测。
最简单的动态预测方法是使用1位状态机。当状态为1时,预测为执行分支,反之则预测为不执行分支。如果预测错误,状态将被翻转。
为了提升预测准确性,可以使用2位状态机来替代1位状态机。一个常见的2位状态机如下:
当状态为11或10时,预测为执行分支,否则预测为不执行分支。状态只有在两次预测失败后才会改变。这种方法在for-for循环中特别有效。使用1位预测器,内循环的最后一次迭代总会失败,但使用2位预测器则不会。
到目前为止,我们讨论的预测器只考虑了分支自身的“局部”历史。条件分支的行为也受程序到达该分支路径的影响。这意味着最后几个条件分支或“全局”历史的行为也会影响预测的准确性。
一种常见的解决方案是(m,n)相关预测器,其中m表示最近发生的“全局”分支历史,n表示n位“局部”预测器。一个(2,2)相关预测器如下:
2位全局分支历史记录跟踪最近两个分支的行为,并用于索引要使用的2位预测器。各组2位预测器由分支地址的最后4位进行索引,这意味着每组有16个2位预测器。最终的预测结果取决于全局分支历史和局部分支地址。
白瓜面试
白瓜面试 – AI面试助手,辅助笔试面试神器
40 查看详情
“终极”解决方案是锦标赛预测器Tournament Predictor。正如其名,两个预测器同时工作并相互竞争。一个2位预测器用于选择哪个预测器提供结果。如果选择的预测器连续两次预测错误,而另一个预测正确,则第二个预测器将被选中用于分支预测。相对而言,锦标赛预测器比其他类型的预测器更准确。
这有点像俄罗斯套娃的概念。
分支目标预测 Branch Target Prediction
分支目标预测涉及尽快获取分支目标地址。如果没有分支目标预测,即使我们知道应该执行分支,我们也不知道该跳到哪里。
一个常见的实现是使用分支目标缓冲区Branch Target Buffer(BTB)来存储预测的分支目标地址。BTB由分支指令的程序计数(PC)进行索引,预测的目标地址将在一个周期内可用。
总结
只有当条件预测和目标预测同时存在时,分支预测才能有效发挥作用。
以上就是CPU pipeline面试题Q4:如何实现基于硬件的分支预测?的详细内容,更多请关注创想鸟其它相关文章!
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 chuangxiangniao@163.com 举报,一经查实,本站将立刻删除。
发布者:程序猿,转转请注明出处:https://www.chuangxiangniao.com/p/461806.html
微信扫一扫
支付宝扫一扫