December 14, 2020

解决proxmox直通AMD Navi系列个别显卡时休眠无法唤醒 断开无法连接的问题

AMD在linux kernel 5.6里提交了针对这个问题的补丁 但是proxmox 仍然没有用上更新的LINUX KERNEL,也许openzfs一样 大家都在搞价值冲突.

现代文明之间的冲突最凶狠的毁灭对方的方式都是从摧毁对方的核心价值入手 学术 科技 民主 科学 ,要么搞教条主义 民粹主义 要么搞政治正确 摧毁实践经验 不讲实现环境 希望这些鬼东西不要跑来开源社区祸害绵延

`https://www.nicksherlock.com/2020/11/working-around-the-amd-gpu-reset-bug-on-proxmox/

上面这篇介绍了gnif针对现状给pve的内核临时制作的补丁来缓解题目中面对的问题.赞👍 他提到的具体步骤如下:

# Get latest Proxmox kernel headers:

apt install pve-headers-$(uname -r)

# Did that fail? If so make sure you have Proxmox repository

# Get required build tools:

apt install git dkms build-essential

# Perform the build:

git clone https://github.com/gnif/vendor-reset.git && cd vendor-reset && dkms install .

# Enable vendor-reset to be loaded automatically on startup:

echo "vendor-reset" >> /etc/modules && update-initramfs -u

# Reboot to load the module:

shutdown -r now

之后你会发现原本直通关掉的vm无法重启直通AMDGPU设备的问题得到了改进 不需要以来脚本或者命令集合来开闭pcie设备