kernels-community
/

quantization

danieldk HF Staff commited on 7 days ago

Commit

2f56f34

1 Parent(s): a965094

Export Marlin and quantization utilities

Files changed (1) hide show

torch-ext/quantization/__init__.py CHANGED Viewed

@@ -19,6 +19,11 @@ from .scalar_type import (
 )
 from ._ops import ops
 __all__ = [
     "ScalarType",
@@ -32,7 +37,11 @@ __all__ = [
     "gptq_marlin_repack",
     "marlin_gemm",
     "marlin_qqq_gemm",
     "ops",
     "scalar_types",
     "scaled_fp8_quant",
     "scaled_int8_quant",

 )
 from ._ops import ops
+from .utils import marlin_utils
+from .utils import marlin_utils_fp4
+from .utils import marlin_utils_fp8
+from .utils import quant_utils
 __all__ = [
     "ScalarType",
     "gptq_marlin_repack",
     "marlin_gemm",
     "marlin_qqq_gemm",
+    "marlin_utils",
+    "marlin_utils_fp4",
+    "marlin_utils_fp8",
     "ops",
+    "quant_utils",
     "scalar_types",
     "scaled_fp8_quant",
     "scaled_int8_quant",