invoke-ai · RyanJDick · Nov 13, 2024 · Oct 27, 2024 · Oct 28, 2024 · Nov 6, 2024
diff --git a/invokeai/backend/flux/modules/autoencoder.py b/invokeai/backend/flux/modules/autoencoder.py
@@ -312,12 +312,25 @@ def encode(self, x: Tensor, sample: bool = True, generator: torch.Generator | No
             Tensor: Encoded latent tensor. Shape: (batch_size, z_channels, latent_height, latent_width).
         """
 
+        # VAE is broken in float16, use same logic in model loading to pick bfloat16 or float32
+        if x.dtype == torch.float16:
+            try:
+                x = x.to(torch.bfloat16)
+            except TypeError:
+                x = x.to(torch.float32)
         z = self.reg(self.encoder(x), sample=sample, generator=generator)
         z = self.scale_factor * (z - self.shift_factor)
         return z
 
     def decode(self, z: Tensor) -> Tensor:
         z = z / self.scale_factor + self.shift_factor
+
+        # VAE is broken in float16, use same logic in model loading to pick bfloat16 or float32
+        if z.dtype == torch.float16:
+            try:
+                z = z.to(torch.bfloat16)
+            except TypeError:
+                z = z.to(torch.float32)
         return self.decoder(z)
 
     def forward(self, x: Tensor) -> Tensor:

@@ -35,6 +35,7 @@ def __init__(
         self._logger = logger
         self._ram_cache = ram_cache
         self._torch_dtype = TorchDevice.choose_torch_dtype()
+        self._torch_device = TorchDevice.choose_torch_device()
 
     def load_model(self, model_config: AnyModelConfig, submodel_type: Optional[SubModelType] = None) -> LoadedModel:
         """

@@ -84,7 +84,15 @@ def _load_model(
             model = AutoEncoder(ae_params[config.config_path])
             sd = load_file(model_path)
             model.load_state_dict(sd, assign=True)
-            model.to(dtype=self._torch_dtype)
+            # VAE is broken in float16, which mps defaults too
+            if self._torch_dtype == torch.float16:
+                try:
+                    vae_dtype = torch.tensor([1.0], dtype=torch.bfloat16, device=self._torch_device).dtype
+                except TypeError:
+                    vae_dtype = torch.tensor([1.0], dtype=torch.float32, device=self._torch_device).dtype
+            else:
+                vae_dtype = self._torch_dtype
+            model.to(vae_dtype)
 
         return model