From b5b9e4bee463d7742c38b3f763e483c521270e05 Mon Sep 17 00:00:00 2001
From: Gabe Goodhart <ghart@us.ibm.com>
Date: Mon, 23 Sep 2024 12:54:50 -0600
Subject: [PATCH] fix(convert): Remove unused tensor name mappings

Branch: GraniteMoE

Co-Authored-By: git@compilade.net
Signed-off-by: Gabe Goodhart <ghart@us.ibm.com>
---
 gguf-py/gguf/tensor_mapping.py | 18 ++++++++----------
 1 file changed, 8 insertions(+), 10 deletions(-)

diff --git a/gguf-py/gguf/tensor_mapping.py b/gguf-py/gguf/tensor_mapping.py
index 901c03c7ce11c4..4e850726e9ba4a 100644
--- a/gguf-py/gguf/tensor_mapping.py
+++ b/gguf-py/gguf/tensor_mapping.py
@@ -293,11 +293,10 @@ class TensorNameMap:
         ),
 
         MODEL_TENSOR.FFN_UP_EXP: (
-            "layers.{bid}.feed_forward.experts.w3",                # mixtral (merged)
-            "transformer.decoder_layer.{bid}.moe.linear_v",        # Grok (merged)
-            "transformer.blocks.{bid}.ffn.experts.mlp.v1",         # dbrx
-            "model.layers.{bid}.mlp.experts.up_proj",              # qwen2moe olmoe (merged)
-            "model.layers.{bid}.block_sparse_moe.input_linear.up", # granitemoe
+            "layers.{bid}.feed_forward.experts.w3",          # mixtral (merged)
+            "transformer.decoder_layer.{bid}.moe.linear_v",  # Grok (merged)
+            "transformer.blocks.{bid}.ffn.experts.mlp.v1",   # dbrx
+            "model.layers.{bid}.mlp.experts.up_proj",        # qwen2moe olmoe (merged)
         ),
 
         MODEL_TENSOR.FFN_UP_SHEXP: (
@@ -326,11 +325,10 @@ class TensorNameMap:
         ),
 
         MODEL_TENSOR.FFN_GATE_EXP: (
-            "layers.{bid}.feed_forward.experts.w1",                  # mixtral (merged)
-            "transformer.decoder_layer.{bid}.moe.linear",            # Grok (merged)
-            "transformer.blocks.{bid}.ffn.experts.mlp.w1",           # dbrx
-            "model.layers.{bid}.mlp.experts.gate_proj",              # qwen2moe olmoe (merged)
-            "model.layers.{bid}.block_sparse_moe.input_linear.gate", # granitemoe
+            "layers.{bid}.feed_forward.experts.w1",         # mixtral (merged)
+            "transformer.decoder_layer.{bid}.moe.linear",   # Grok (merged)
+            "transformer.blocks.{bid}.ffn.experts.mlp.w1",  # dbrx
+            "model.layers.{bid}.mlp.experts.gate_proj",     # qwen2moe olmoe (merged)
         ),
 
         MODEL_TENSOR.FFN_GATE_SHEXP: (