vllm报错out of memory解决 通过调低–gpu-memory-utilization的比例(默认为0.9),可以避免此问题 12345678model = LLM( args.model_name_or_path, trust_remote_code=True, tensor_parallel_size=num_gpus, max_model_len = 2048, gpu_memory_utilization=0.8) vllm报错out of memory解决 https://abigail61.github.io/2024/11/23/原创-- vllm报错out of memory解决/ 作者 Yajing Luo 发布于 2024年11月23日 许可协议 服务器上虚拟环境里的jupyter notebook连接不上kernal,显示not connection to kernel 上一篇 python爬取百度百科属性框 下一篇