跳转至

Homepage

【2025 香山入门指南 · 我在 827 做访存】(六)并行计算的诱惑

在“2025 香山入门指南”系列文章中,我们希望构建一个基于 2025 年 6 月昆明湖 V2 版本的香山(XiangShan,提交哈希为 6318236)上手指南,通过一系列引导性的入门指南,来引导新同学们学习、了解并最终掌握香山。

827 是昆明湖项目访存组的主要办公室,“我在 827 做访存”系列以此为题介绍香山访存部分的设计。本文是本专题的第六部分,主要介绍向量访存。计算机硬件的发展史本质上是对运算速度的追求,随着传统串行计算在功耗与散热方面触及物理瓶颈,并行计算成为提升性能的必然路径。文中介绍了 SISD、SIMD、MISD 及 MIMD 四种体系结构,并重点阐述了现代处理器中关键的向量计算技术。不同于传统固定位宽的 SIMD 指令集,RISC-V Vector(RVV)通过引入可变矢量长度的概念,允许硬件根据实际场景调整寄存器长度,实现了软件代码与硬件实现的解耦。文章还以香山昆明湖 V2 处理器为例,简要解析了其紧耦合向量单元的向量访存单元的实现机制,包括利用拆分与合并模块处理向量访存指令,以及针对不同访存模式的优化策略。

【2025 香山入门指南 · 我在 827 做访存】(五)原子不可分

在“2025 香山入门指南”系列文章中,我们希望构建一个基于 2025 年 6 月昆明湖 V2 版本的香山(XiangShan,提交哈希为 6318236)上手指南,通过一系列引导性的入门指南,来引导新同学们学习、了解并最终掌握香山。

827 是昆明湖项目访存组的主要办公室,“我在 827 做访存”系列以此为题介绍香山访存部分的设计。本文是本专题的第五部分,主要介绍了原子操作相关内容。本文系统阐述了计算机系统中多线程并发中的数据竞争问题与 RISC-V 原子指令集的基础概念,简要解析了香山昆明湖 V2 的原子内存操作指令的硬件实现机制并给出了一些硬件实现原子内存操作指令加速的可能的选项。

[XiangShan Biweekly 90] 20251124

Welcome to XiangShan biweekly column! Through this column, we will regularly share the latest development progress of XiangShan. We look forward to your contribution.

This is the 90th issue of the biweekly report.

In terms of XiangShan development, the frontend has implemented some new performance features in V3, while fixing multiple performance bugs caused by BPU refactoring~~hoping that the performance can reach the pre-refactoring level (x2) by the next biweekly report~~. The backend is advancing the design of the new vector unit in V3, while fixing some legacy bugs in V2. The MemBlock has added the berti prefetcher, while continuing to promote code refactoring in various modules and fixing some V2 functional bugs.

【香山双周报 90】20251124 期

欢迎来到香山双周报专栏,我们将通过这一专栏定期介绍香山的开发进展。我们期待您的贡献。

本次是第 90 期双周报。

香山开发方面,前端在 V3 实现了一些新的性能特性,同时修复了多个 BPU 重构带来的性能 bug~~希望下次双周报时性能能够达到重构前水平(×2)~~。后端正在推进 V3 新向量单元的设计,同时修复了一些 V2 的遗留 bug。访存新增了 berti 预取器,同时继续推动各个模块的代码重构,还修复了一些 V2 功能 bug。

【2025 香山入门指南 · 我在 827 做访存】(四)超越容量的界限

在“2025 香山入门指南”系列文章中,我们希望构建一个基于 2025 年 6 月昆明湖 V2 版本的香山(XiangShan,提交哈希为 6318236)上手指南,通过一系列引导性的入门指南,来引导新同学们学习、了解并最终掌握香山。

827 是昆明湖项目访存组的主要办公室,“我在 827 做访存”系列以此为题介绍香山访存部分的设计。本文是本专题的第四部分,主要介绍了内存管理单元相关内容。本文将以现代计算机系统中的内存管理为起点,探讨操作系统如何利用虚拟内存与分页机制实现高效的内存管理,解析 RISC-V CPU 中的 MMU 如何通过页表遍历自动完成地址翻译。同时,针对地址翻译带来的性能挑战,文章将详细解读 TLB 的加速原理,并结合香山昆明湖架构的实例进行分析介绍。

【2025 香山入门指南 · 我在 827 做访存】(三)更大更快更强的缓存

在“2025 香山入门指南”系列文章中,我们希望构建一个基于 2025 年 6 月昆明湖 V2 版本的香山(XiangShan,提交哈希为 6318236)上手指南,通过一系列引导性的入门指南,来引导新同学们学习、了解并最终掌握香山。

827 是昆明湖项目访存组的主要办公室,“我在 827 做访存”系列以此为题介绍香山访存部分的设计。本文是本专题的第三部分,主要介绍了缓存相关内容。缓存是位于 CPU 与内存之间的高速存储器,已成为现代处理器不可或缺的核心组件,其作用主要在于提升 CPU 的数据访问效率。本章主要阐述了缓存的基本原理,介绍了现代处理器中多核多级缓存所面临的缓存一致性问题,并简要分析了缓存性能的优化策略。

[XiangShan Biweekly 89] 20251110

Welcome to XiangShan biweekly column! Through this column, we will regularly share the latest development progress of XiangShan. We look forward to your contribution.

This is the 89th issue of the biweekly report.

XiangShan development-wise, the frontend team continued to fix performance bugs caused by BPU refactoring~~hoping that performance can reach pre-refactoring levels by the next biweekly report~~. The backend team is advancing the new design implementation of the V3 vector unit while optimizing the timing of the V2 backend. The MemBlock team is continuously pushing forward with the V3 refactoring and testing of various modules, fixing some V2 functional bugs, optimizing timing, and improving code quality.

【香山双周报 89】20251110 期

欢迎来到香山双周报专栏,我们将通过这一专栏定期介绍香山的开发进展。我们期待您的贡献。

本次是第 89 期双周报。

香山开发方面,前端继续修复 BPU 重构带来的性能 bug~~希望下次双周报时性能能够达到重构前水平~~。后端推进 V3 向量单元的新设计实现,同时优化了 V2 后端的时序。访存持续推进 V3 各个模块的重构与测试,并且修复了一些 V2 功能 bug,优化了时序,提升了代码质量。

【2025 香山入门指南 · 我在 827 做访存】(二)访存流水线

在“2025 香山入门指南”系列文章中,我们希望构建一个基于 2025 年 6 月昆明湖 V2 版本的香山(XiangShan,提交哈希为 6318236)上手指南,通过一系列引导性的入门指南,来引导新同学们学习、了解并最终掌握香山。

827 是昆明湖项目访存组的主要办公室,“我在 827 做访存”系列以此为题介绍香山访存部分的设计。本文是本专题的第二部分,主要介绍了访存流水线相关内容。访存流水线是处理器实现访存的重要机制。通过将访存操作分解为多个阶段,访存流水线能够提高内存访问的并行度和效率,从而提升整体系统性能。

【2025 香山入门指南 · 我在 827 做访存】(一)乱序访存

在“2025 香山入门指南”系列文章中,我们希望构建一个基于 2025 年 6 月昆明湖 V2 版本的香山(XiangShan,提交哈希为 6318236)上手指南,通过一系列引导性的入门指南,来引导新同学们学习、了解并最终掌握香山。

827 是昆明湖项目访存组的主要办公室,“我在 827 做访存”系列以此为题介绍香山访存部分的设计。本文是本专题的第一部分,主要介绍了现代处理器中访存的概念,简要分析了高性能处理器乱序访存的情况与基础的内存一致性规范。