情况1:
加载模型后,报OOM错误的,一般是模型参数与自己显卡不匹配(比如分辨率过高)或者是模型参数开高了,比如批量大小(Batch Size),开启了Gan,梯度裁剪等参数。根本原因是显存不足,具体错误如下图,错误信息带有when OOM happens字样。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=3d8eb2114fd162d985ee621421dea950/4645ad86e950352af9dad9dd1643fbf2b0118be0.jpg?tbpicau=2025-02-28-05_b3337e4d77bf3b5d8ab1715a4c6b0e63)
![](http://tiebapic.baidu.com/forum/w%3D580/sign=8d2e973ac8b1cb133e693c1bed5556da/d1d84ac551da81cb805d7f181766d0160b2431e0.jpg?tbpicau=2025-02-28-05_76ee8ac5e35f65a77ab98d7a1844064c)
这种情况就需要改变模型参数 ,比如降低批量大小(Batch Size),关闭gan等消耗显存的参数。或者使用适合自己显卡参数的模型。
具体修改方法如下:在选择显卡和模型后,按照提示“两秒钟内按回车”,看到提示后迅速按下回车键,修改对应的参数,比如降低批量大小,直到能正常训练为止!
情况2:
OOM错误还有另一种情况,这种较少,就是虚拟内存不足导致。
解决方法就是手动设置虚拟内存64G起。大部分都是第一种情况!
加载模型后,报OOM错误的,一般是模型参数与自己显卡不匹配(比如分辨率过高)或者是模型参数开高了,比如批量大小(Batch Size),开启了Gan,梯度裁剪等参数。根本原因是显存不足,具体错误如下图,错误信息带有when OOM happens字样。
![](http://tiebapic.baidu.com/forum/w%3D580/sign=3d8eb2114fd162d985ee621421dea950/4645ad86e950352af9dad9dd1643fbf2b0118be0.jpg?tbpicau=2025-02-28-05_b3337e4d77bf3b5d8ab1715a4c6b0e63)
![](http://tiebapic.baidu.com/forum/w%3D580/sign=8d2e973ac8b1cb133e693c1bed5556da/d1d84ac551da81cb805d7f181766d0160b2431e0.jpg?tbpicau=2025-02-28-05_76ee8ac5e35f65a77ab98d7a1844064c)
这种情况就需要改变模型参数 ,比如降低批量大小(Batch Size),关闭gan等消耗显存的参数。或者使用适合自己显卡参数的模型。
具体修改方法如下:在选择显卡和模型后,按照提示“两秒钟内按回车”,看到提示后迅速按下回车键,修改对应的参数,比如降低批量大小,直到能正常训练为止!
情况2:
OOM错误还有另一种情况,这种较少,就是虚拟内存不足导致。
解决方法就是手动设置虚拟内存64G起。大部分都是第一种情况!