XiangShan 前端开发环境
在这一章中,我们将介绍如何编译和仿真香山代码、如何生成可运行的 Workload,并介绍一些开发中用到的辅助工具。
如果遇到问题,可以参考 Troubleshooting 以及 https://github.com/OpenXiangShan/XiangShan/issues 中的问题及解答。
This chapter has English version.
TLDR
使用以下脚本来布署香山开发环境,部署脚本只需运行一次.:
git clone https://github.com/OpenXiangShan/xs-env
cd xs-env
sudo -s ./setup-tools.sh # use apt to install dependencies, you may modify it to use different pkg manager
source setup.sh # prepare tools, test develop env using a small project
由于香山 master
分支更新频繁,此仓库中的 submodule 默认追踪香山主线分支上的一个稳定提交,并不是香山及其他工具的最新版本。要更新各子仓库到最新版本,可以运行:
source update-submodule.sh
环境部署成功后,每次要使用开发环境时,只需使用以下命令配置环境变量:
cd xs-env
source ./env.sh # setup XiangShan environment variables
初始环境准备
请准备一台性能较强的服务器,以下为服务器的一些配置要求:
- 操作系统:Ubuntu 20.04 LTS (其他版本未测试,不建议使用)
- CPU:不限,性能将决定编译与生成的速度
- 内存:最低 32G,推荐 64G 及以上
- 磁盘空间:20G 及以上
- 网络:请自行配置顺畅的网络环境
提示:内存过小、SWAP空间不足会导致编译错误。参见:https://github.com/OpenXiangShan/XiangShan/issues/891
(如果有条件,登录时推荐使用桌面环境或者开启 X11 转发以试用一些带有 GUI 界面的工具)
如您在国内环境执行下方操作遇到网络问题,可以使用我们在Gitee和GitLink上的镜像。
在服务器上安装 git, 随后使用 git 克隆以下仓库到本地:
git clone https://github.com/OpenXiangShan/xs-env.git
cd xs-env
该仓库中包含有一个脚本自动安装香山项目的依赖,请在运行前按需修改。
sudo -s ./setup-tools.sh
提示:这个脚本的执行需要 sudo 权限来安装香山项目依赖的软件包,请阅读理解脚本内容后执行,以防搅乱环境
安装完依赖以后执行make
脚本
./setup.sh
执行 ls
确认其中拥有以下目录:
XiangShan NEMU nexus-am
配置环境变量:
source env.sh
上述命令设置了NOOP_HOME
,NEMU_HOME
,AM_HOME
三个环境变量。您可以将这些环境变量加入到.bashrc
中,也可以在每次使用香山前重新运行env.sh
这一脚本配置环境变量(推荐)。在完成开发环境配置后, 每次使用开发环境前只需source env.sh
配置环境变量即可。
在后续步骤出现问题时,可以参考 Troubleshooting-Guide 来自行排查。
生成香山核的 Verilog 代码
在 /xs-env/XiangShan
下执行
make init
提示:请务必确保这一过程期间到 github 的网络连接顺畅。submodule 的克隆不完整将会导致后续的编译错误。参见:https://github.com/OpenXiangShan/XiangShan/issues/837
在国内网络环境下载scala相关依赖可能遇到问题,可将该patch应用到XiangShan项目的build.sc
文件。
生成可综合的单核代码
在 /xs-env/XiangShan
下运行 make verilog
,该命令将会编译香山的 Chisel 代码,生成 Verilog,输出的文件在 XiangShan/build/rtl/XSTop.sv
提示:
make verilog
命令生成的Verilog文件用于生成FPGA的bitstream和流片,去除了Difftest等仿真用的调试模块。 如果需要生成带有Difftest的用于仿真的Verilog文件,可以使用make sim-verilog
命令。提示2:如果您没有可以容纳香山核的FPGA,可以跳过这里,直接使用香山提供的软件仿真环境进行仿真: 生成香山核的仿真程序。
生成可综合的双核代码
在 /xs-env/XiangShan
下运行 make verilog NUM_CORES=2
,该命令将会生成香山双核的 Verilog,输出的文件在 XiangShan/build/rtl/XSTop.sv
提示:生成完整香山核的 Verilog 代码所需的时间会稍久,推荐大家使用 Tmux 等工具在后台运行上述命令。可以在命令行参数中添加
CONFIG=MinimalConfig
,将会生成一个最小配置的香山的 Verilog 代码。(参见:香山参数系统说明)提示2:这里生成的仍然是用于FPGA和流片的Verilog。
仿真环境下验证香山
使用 AM 生成 workload
AM 是一个裸机运行时环境,用户可以使用 AM 来编译在香山裸机上运行的程序。使用 AM 编译程序的示例如下:
进入 /xs-env/nexus-am/apps
目录,可以看到在该目录下有一些预置的 workload,以 coremark 为例,进入/xs-env/nexus-am/apps/coremark
,执行 make ARCH=riscv64-xs -j8
,即可在当前 build
目录下看到 3 个文件:
coremark-riscv64-xs.elf 应用程序的 ELF 文件
coremark-riscv64-xs.bin 应用程序的二进制运行镜像
coremark-riscv64-xs.txt 应用程序的反汇编
生成的coremark-riscv64-xs.bin
可以作为仿真中的程序输入。要使用 AM 生成自定义的 workload,请参考
使用 AM 生成自定义 workload
生成 Linux Kernel 作为 workload
我们提供的环境中没有默认包含编译 Linux Kernel 相关的仓库,需要用户自行下载。
提示:我们在
xs-env/XiangShan/ready-to-run
中提供了预先编译好的 workload,包括启动 linux 并运行 hello.c 的 workload。
使用 NEMU 模拟器运行 workload
我们使用 NEMU 模拟器作为香山的实现参考。NEMU 模拟器是一个解释型的指令集模拟器。相比其他的 RISC-V 解释型指令集模拟器(如 spike),NEMU 在运行速度上有数量级的优势。
在使用 NEMU 模拟器运行 workload 时,我们需要将模拟器的虚拟外设与香山的外设地址空间对齐。进入 /xs-env/NEMU
目录,运行以下命令:
make clean
make riscv64-xs_defconfig
make -j
提示:新旧版本的 NEMU 使用略有区别。要从旧版本的 NEMU 迁移到新版本的 NEMU,可以参考以下文档: 新版本 NEMU 使用指南
接下来运行 ./build/riscv64-nemu-interpreter -b MY_WORKLOAD.bin
其中将 MY_WORKLOAD.bin
替换为想要运行镜像的路径,例如上一节中生成的 coremark,即可让 NEMU 模拟器运行指定的程序了。例如:
./build/riscv64-nemu-interpreter -b $NOOP_HOME/ready-to-run/linux.bin
生成香山核的仿真程序
我们使用 Verilator 生成香山核的仿真程序,进入 XiangShan
目录,运行命令
make emu CONFIG=MinimalConfig EMU_TRACE=1 -j32
./build/
目录下看到一个名为 emu
的仿真程序。其中,CONFIG=MinimalConfig
指定了香山核使用的配置(参见:香山参数系统说明),EMU_TRACE=1
会为仿真程序添加波形输出功能,允许在仿真过程中启用波形输出。
EMU_TRACE=1
默认生成的波形格式为 vcd,可以使用 gtkwave 等开源工具或 dve 等商业工具进行查看。另外,也可以通过 EMU_TRACE=vcd
以及 EMU_TRACE=VCD
命令生成 vcd 格式的波形,二者的作用和 EMU_TRACE=1
相同。由于 vcd 波形体积较大,需要占用大量硬盘空间;同时使用 gtkwave 等开源工具打开波形的速度较慢,我们提供 EMU_TRACE=fst
或 EMU_TRACE=FST
命令生成 fst 格式的波形。fst 格式的波形大小不到 vcd 格式波形大小的 10%,但缺点是该格式的波形为 gtkwave 专属,只能由 gtkwave 打开。
更多参数请参考
Makefile
脚本代码。可以先阅读加速仿真一节。
要仿真默认配置的完整香山核,可以使用以下命令:
make emu -j32
注意!生成 Verilog 所需的时间会稍久,推荐大家使用 Tmux 等工具在后台运行上述命令
香山也支持使用 VCS 进行仿真验证,但缺少 LightSSS 等验证工具,参考:VCS 的使用方法
在香山核仿真程序上仿真运行 workload
与香山核协同仿真的 NEMU 模拟器配置与独立运行时略有不同。我们使用以下的命令编译仿真中使用的 NEMU:
在 /xs-env/NEMU
下运行:
make clean
make riscv64-xs-ref_defconfig
make -j
build
目录下生成文件 riscv64-nemu-interpreter-so
,从而接入到香山仿真差分测试中。
利用前面生成好的香山仿真程序,NEMU 动态链接库与 workload,可以默认在差分测试框架打开的情况下让香山核运行指定的应用程序,进入/xs-env/XiangShan
目录运行指令 ./build/emu -i MY_WORKLOAD.bin
其中将 MY_WORKLOAD.bin
替换为想要运行镜像的路径,比如前面生成的 coremark,即可让香山仿真运行指定的程序了。例如:
./build/emu -i $NOOP_HOME/ready-to-run/linux.bin
生成波形
我们可以使用 --dump-wave
参数打开波形,并使用 -b
和 -e
参数设置生成波形的开始和结束周期,例如想要生成 10000 ~ 11000 周期的波形,可以使用如下命令:
./build/emu -i MY_WORKLOAD.bin --dump-wave -b 10000 -e 11000
其中 -b
和 -e
的默认值为 0,注意仅当 -e
参数大于 -b
时才会真正记录波形;波形文件将会生成在 ./build/
目录下,根据 EMU_TRACE
的不同参数,格式为 vcd 或 fst。vcd 波形文件可以后续使用 gtkwave 等开源工具或者 dve 等商业工具进行查看,fst 波形文件目前只能由 gtkwave 打开。
注意:在仿真中生成波形需要在生成仿真程序时使用
EMU_TRACE
相关的参数,详见生成香山核的仿真程序一节
日志功能简介
如果编译 emu 时打开了打印日志的功能(前述流程默认关闭),那么在运行 emu 时,将会打印日志。为了避免在终端输出日志,占用终端 IO 带宽,导致终端卡死,请将终端输出重定向到文件中。使用如下命令:
./build/emu -i MY_WORKLOAD.bin -b 10000 -e 11000 2>&1 | tee > MY_LOGNAME.log
提示:可以使用 LogViewer 工具查看日志
性能计数器的查看和分析
当 workload 执行结束后,将会打印性能计数器结果。如果将性能计数器的内容重定向到文件中,就可以使用可视化工具参看结构化的性能计数器信息。
提示: 在运行
emu
时, 可以添加--force-dump-result
参数来强制输出性能计数器结果到标准输出流。
我们提供了一个可视化性能计数器的结果的工具。注意!该工具具有 GUI 界面,如果想要使用请做好 X11 转发相关配置。