Qwen3.5-27B Quantized GGUF (IQ4_KS / IQ5_K / IQ6_K)

模型说明

该仓库提供 Qwen3.5-27B 的 GGUF 量化版本，适配 llama.cpp 生态，包含 IQ4_KS、IQ5_K、IQ6_K 三种规格。权重由 BF16 GGUF 输入文件通过 imatrix 方式量化，重点平衡了体积、推理速度与精度表现，适用于不同显存预算下的文本生成任务。

本仓库采用 ik_llama.cpp Docker 镜像（hotwa/ik:latest）进行两阶段量化：

核心量化参数：

该流程使用 imatrix 对不同权重的重要性进行建模，可在同等量化位宽下减少关键层信息损失，提升量化后推理稳定性。

量化校准文件为 calibration_data_v5_rc_code.txt，总计 4152 blocks，构成如下：

基础校准数据下载源：

社区常用版本：https://gist.githubusercontent.com/tristandruyen/9e207a95c7d75ddf37525d353e00659c/raw/571fda718462de863e5a0171078c175420c7649a/calibration_data_v5_rc.txt
官方备用源：https://raw.githubusercontent.com/ggerganov/llama.cpp/master/examples/calibration/calibration_data.txt

选择这三部分数据的目的：

该组合在“通用文本 + 代码任务”之间做了平衡，适合 Qwen3.5-27B Distill 模型的实际使用场景。

该仓库用于发布可直接推理的 GGUF 权重，不包含训练过程文件。推理时请使用支持 GGUF 的推理框架（如 llama.cpp 相关实现）。