Small update

matthewdouglas · matthewdouglas · commit 36344b0d8ce7 · 2025-04-14T12:50:24.000-04:00
diff --git a/setup.py b/setup.py
@@ -6,5 +6,5 @@
     package_dir={"": "src"},
     packages=find_packages(where="src"),
     install_requires=["bitsandbytes"],
-    entry_points={"bitsandbytes.backends": ["bitsandbytes_intel = bitsandbytes_intel:_autoload"]},
+    entry_points={"torch.backends": ["bitsandbytes_intel = bitsandbytes_intel:_autoload"]},
 )
diff --git a/src/bitsandbytes_intel/cpu_xpu_common.py b/src/bitsandbytes_intel/cpu_xpu_common.py
@@ -10,7 +10,6 @@
     create_dynamic_map,
     get_4bit_type,
 )
-from bitsandbytes.utils import reverse_4bit_compress_format
 
 try:
     # to support Intel CPU/GPU (XPU) backend
@@ -69,6 +68,15 @@ def _maybe_torch_compile(func):
     return func
 
 
+def reverse_4bit_compress_format(weight):
+    out_1 = torch.empty(weight.size(0), dtype=torch.int32, device=weight.device)
+    out_2 = torch.empty(weight.size(0), dtype=torch.int32, device=weight.device)
+    out_1 = (weight & 0xF0) >> 4
+    out_2 = (weight & 0xF) << 4
+    out = out_1 | out_2
+    return out
+
+
 @_maybe_torch_compile
 def double_quant_impl(A, col_stats=None, row_stats=None, out_col=None, out_row=None, threshold=0.0):
     """

Original file line number	Diff line number	Diff line change
`@@ -6,5 +6,5 @@`
`6`	`6`	`package_dir={"": "src"},`
`7`	`7`	`packages=find_packages(where="src"),`
`8`	`8`	`install_requires=["bitsandbytes"],`
`9`		`- entry_points={"bitsandbytes.backends": ["bitsandbytes_intel = bitsandbytes_intel:_autoload"]},`
	`9`	`+ entry_points={"torch.backends": ["bitsandbytes_intel = bitsandbytes_intel:_autoload"]},`
`10`	`10`	`)`