Merge pull request #1352 from jlw463195395/master

修复deepseekcoder爆显存,加入int8,int4通用加载量化。
这个提交包含在:
binary-husky
2023-12-06 21:37:05 +08:00
提交者 GitHub
当前提交 d0c2923ab1
共有 4 个文件被更改,包括 53 次插入5 次删除

查看文件

@@ -120,7 +120,6 @@ CHATGLM_PTUNING_CHECKPOINT = "" # 例如"/home/hmp/ChatGLM2-6B/ptuning/output/6b
LOCAL_MODEL_DEVICE = "cpu" # 可选 "cuda"
LOCAL_MODEL_QUANT = "FP16" # 默认 "FP16" "INT4" 启用量化INT4版本 "INT8" 启用量化INT8版本
# 设置gradio的并行线程数不需要修改
CONCURRENT_COUNT = 100