你们telechat的gptq量化模型又不能使用transformers的方式加载,麻烦写推理示例的时候留意一下,别直接拿原始权重的加载方式就复制过来了
· Sign up or log in to comment