GGUF量化版,降低显存需求,16g显存可以运行