From 8d6d4bc4971502f1f4a30de0428be16632393c5b Mon Sep 17 00:00:00 2001
From: Lila <lilalovesall@gmail.com>
Date: Sun, 22 Sep 2024 15:56:12 +0100
Subject: [PATCH] improvements to create_tables

---
 fast64_internal/sm64/animation/classes.py   | 211 ++++++++++++--------
 fast64_internal/sm64/animation/exporting.py |  11 +-
 fast64_internal/sm64/sm64_classes.py        |   2 +-
 3 files changed, 134 insertions(+), 90 deletions(-)

diff --git a/fast64_internal/sm64/animation/classes.py b/fast64_internal/sm64/animation/classes.py
index 118499211..557133b79 100644
--- a/fast64_internal/sm64/animation/classes.py
+++ b/fast64_internal/sm64/animation/classes.py
@@ -5,6 +5,7 @@
 import dataclasses
 import os
 import re
+import typing
 import numpy as np
 
 from bpy.types import Action
@@ -27,7 +28,7 @@ class CArrayDeclaration:
 
 @dataclasses.dataclass
 class SM64_AnimPair:
-    values: np.array = dataclasses.field(compare=False)
+    values: np.ndarray[typing.Any, np.dtype[np.int16]] = dataclasses.field(compare=False)
 
     # Importing
     address: int = 0
@@ -67,12 +68,17 @@ class SM64_AnimData:
     def key(self):
         return (self.indice_reference, self.values_reference)
 
+    def create_tables(self, start_address=-1):
+        indice_tables, value_tables = create_tables([self], start_address=start_address)
+        assert (
+            len(value_tables) == 1 and len(indice_tables) == 1
+        ), "Single animation data export should only return 1 of each table."
+        return indice_tables[0], value_tables[0]
+
     def to_c(self, dma_structure: bool = False):
         text_data = StringIO()
 
-        value_table, indice_tables = create_tables([self])
-        indice_table = indice_tables[0]
-
+        indice_table, value_table = self.create_tables()
         if dma_structure:
             text_data.write(indice_table.to_c())
             text_data.write("\n")
@@ -84,12 +90,11 @@ def to_c(self, dma_structure: bool = False):
 
         return text_data.getvalue()
 
-    def to_binary(self) -> bytearray:
-        value_table, indice_tables = create_tables([self])
-        indice_table = indice_tables[0]
+    def to_binary(self, start_address=-1):
+        indice_table, value_table = self.create_tables(start_address)
         values_offset = len(indice_table.data) * 2
 
-        data: bytearray = bytearray()
+        data = bytearray()
         data.extend(indice_table.to_binary())
         data.extend(value_table.to_binary())
         return data, values_offset
@@ -127,9 +132,7 @@ def read_c(self, indice_decl: CArrayDeclaration, value_decl: CArrayDeclaration):
 
         for i in range(0, len(indices_values), 2):
             max_frame, offset = indices_values[i], indices_values[i + 1]
-            self.pairs.append(
-                SM64_AnimPair(values_array[offset : offset + max_frame], None, None, offset).clean_frames()
-            )
+            self.pairs.append(SM64_AnimPair(values_array[offset : offset + max_frame], -1, -1, offset).clean_frames())
         return self
 
 
@@ -195,7 +198,7 @@ def names(self) -> list[str]:
 @dataclasses.dataclass
 class SM64_AnimHeader:
     reference: str | int = ""
-    flags: SM64_AnimFlags | str = 0
+    flags: SM64_AnimFlags | str = SM64_AnimFlags(0)
     trans_divisor: int = 0
     start_frame: int = 0
     loop_start: int = 0
@@ -212,7 +215,7 @@ class SM64_AnimHeader:
     end_address: int = 0
     header_variant: int = 0
     table_index: int = 0
-    action: Action = None
+    action: Action | None = None
 
     @property
     def data_key(self):
@@ -235,6 +238,8 @@ def get_values_reference(self, override: Optional[str | int] = None, expected_ty
             reference = self.data.values_reference
         elif self.values_reference:
             reference = self.values_reference
+        else:
+            assert False, "Unknown values reference"
         assert isinstance(
             reference, expected_type
         ), f"Value reference must be a {expected_type}, but instead is equal to {reference}."
@@ -247,6 +252,8 @@ def get_indice_reference(self, override: Optional[str | int] = None, expected_ty
             reference = self.data.indice_reference
         elif self.indice_reference:
             reference = self.indice_reference
+        else:
+            assert False, "Unknown indice reference"
         assert isinstance(
             reference, expected_type
         ), f"Indice reference must be a {expected_type}, but instead is equal to {reference}."
@@ -277,7 +284,7 @@ def to_binary(
         self,
         values_override: Optional[int] = None,
         indice_override: Optional[int] = None,
-        segment_data: SegmentData = None,
+        segment_data: SegmentData | None = None,
         length: int = 0,
     ):
         assert isinstance(self.flags, SM64_AnimFlags), "Flags must be int/enum for binary"
@@ -315,7 +322,7 @@ def read_binary(
         read_headers[str(reader.start_address)] = header
         header.reference = reader.start_address
 
-        header.flags = reader.read_int(2, True)  # /*0x00*/ s16 flags;
+        header.flags = SM64_AnimFlags(reader.read_int(2, True))  # /*0x00*/ s16 flags;
         header.trans_divisor = reader.read_int(2, True)  # /*0x02*/ s16 animYTransDivisor;
         header.start_frame = reader.read_int(2, True)  # /*0x04*/ s16 startFrame;
         header.loop_start = reader.read_int(2, True)  # /*0x06*/ s16 loopStart;
@@ -324,9 +331,13 @@ def read_binary(
         # /*0x0A*/ s16 unusedBoneCount; (Unused in engine)
         header.bone_count = reader.read_int(2, True)
         if header.bone_count <= 0:
+            if bone_count is None:
+                raise PluginError(
+                    "No bone count in header and no bone count passed in from target armature, cannot figure out"
+                )
             header.bone_count = bone_count
             print("Old exports lack a defined bone count, invalid armatures won't be detected")
-        elif bone_count and header.bone_count != bone_count:
+        elif bone_count is not None and header.bone_count != bone_count:
             raise PluginError(
                 f"Imported header's bone count is {header.bone_count} but object's is {bone_count}",
             )
@@ -428,7 +439,7 @@ def read_c(
 
 @dataclasses.dataclass
 class SM64_Anim:
-    data: SM64_AnimData = None
+    data: SM64_AnimData | None = None
     headers: list[SM64_AnimHeader] = dataclasses.field(default_factory=list)
     file_name: str = ""
 
@@ -466,7 +477,7 @@ def to_binary_dma(self):
             indice_offset -= HEADER_SIZE
         return headers, anim_data
 
-    def to_binary(self, start_address: int = 0, segment_data: SegmentData = None):
+    def to_binary(self, start_address: int = 0, segment_data: SegmentData | None = None):
         data: bytearray = bytearray()
         ptrs: list[int] = []
         if self.data:
@@ -687,9 +698,7 @@ def to_binary_dma(self):
             dma_table.data.extend(data)
         return dma_table.to_binary()
 
-    def to_combined_binary(
-        self, table_address=0, data_address=-1, segment_data: SegmentData = None, null_delimiter=True
-    ):
+    def to_combined_binary(self, table_address=0, data_address=-1, segment_data: SegmentData | None = None):
         table_data: bytearray = bytearray()
         data: bytearray = bytearray()
         ptrs: list[int] = []
@@ -697,17 +706,11 @@ def to_combined_binary(
 
         # Pre calculate offsets
         table_length = len(self.elements) * 4
-        if null_delimiter:
-            table_length += 4
         if data_address == -1:
             data_address = table_address + table_length
-        if data_set:
-            headers_length = len(headers_set) * HEADER_SIZE
-            value_table, indice_tables = create_tables(data_set, self.values_reference)
-            indice_tables_offset = data_address + headers_length
-            values_table_offset = indice_tables_offset + sum(
-                len(indice_table.data) * 2 for indice_table in indice_tables
-            )
+
+        headers_length = len(headers_set) * HEADER_SIZE
+        indice_tables, value_tables = create_tables(data_set, self.values_reference, data_address + headers_length)
 
         # Add the animation table
         for i, element in enumerate(self.elements):
@@ -721,27 +724,21 @@ def to_combined_binary(
             else:
                 assert isinstance(element.reference, int), f"Reference at element {i} is not an int."
                 table_data.extend(element.reference.to_bytes(4, byteorder="big"))
-        if null_delimiter:
-            table_data.extend(bytearray([0x00] * 4))  # NULL delimiter
 
         for anim_header in headers_set:  # Add the headers
             if not anim_header.data:
                 data.extend(anim_header.to_binary())
                 continue
             ptrs.extend([data_address + len(data) + 12, data_address + len(data) + 16])
-            indice_offset = indice_tables_offset + sum(
-                len(indice_table.data) * 2 for indice_table in indice_tables[: data_set.index(anim_header.data)]
-            )
-            data.extend(anim_header.to_binary(values_table_offset, indice_offset, segment_data))
-        if data_set:  # Add the data
-            for indice_table in indice_tables:
-                data.extend(indice_table.to_binary())
-            data.extend(value_table.to_binary())
+            data.extend(anim_header.to_binary(segment_data=segment_data))
+
+        for table in indice_tables + value_tables:
+            data.extend(table.to_binary())
 
         return table_data, data, ptrs
 
     def data_and_headers_to_c(self, dma: bool):
-        files_data: dict[os.PathLike, str] = {}
+        files_data: dict[str, str] = {}
         animation: SM64_Anim
         for animation in self.get_seperate_anims_dma() if dma else self.get_seperate_anims():
             files_data[animation.file_name] = animation.to_c(dma_structure=dma)
@@ -751,15 +748,12 @@ def data_and_headers_to_c_combined(self):
         text_data = StringIO()
         headers_set, data_set = self.header_data_sets
         if data_set:
-            value_table, indice_tables = create_tables(data_set, self.values_reference)
-            text_data.write(value_table.to_c())
-            text_data.write("\n")
-            for indice_table in indice_tables:
-                text_data.write(indice_table.to_c())
+            indice_tables, value_tables = create_tables(data_set, self.values_reference)
+            for table in value_tables + indice_tables:
+                text_data.write(table.to_c())
                 text_data.write("\n")
-
         for anim_header in headers_set:
-            text_data.write(anim_header.to_c(values_override=self.values_reference))
+            text_data.write(anim_header.to_c())
             text_data.write("\n")
 
         return text_data.getvalue()
@@ -769,7 +763,7 @@ def read_binary(
         reader: RomReader,
         read_headers: dict[str, SM64_AnimHeader],
         table_index: Optional[int] = None,
-        bone_count: Optional[int] = 0,
+        bone_count: Optional[int] = None,
         size: Optional[int] = None,
     ) -> SM64_AnimHeader | None:
         print(f"Reading table at address {reader.start_address}.")
@@ -784,8 +778,8 @@ def read_binary(
             if size is None and ptr == 0:  # If no specified size and ptr is NULL, break
                 self.elements.append(SM64_AnimTableElement())
                 break
-            elif table_index is not None and i != table_index:  # Skip entries until table_index if specified
-                continue
+            elif table_index is not None and i != table_index:
+                continue  # Skip entries until table_index if specified
 
             header_reader = reader.branch(ptr)
             if header_reader is None:
@@ -828,8 +822,11 @@ def read_dma_binary(
                 dma_table.entries
             ), f"Index {table_index} outside of defined table ({len(dma_table.entries)} entries)."
             entrie = dma_table.entries[table_index]
+            header_reader = reader.branch(entrie.address)
+            if header_reader is None:
+                raise PluginError("Failed to branch into DMA entrie's address")
             return SM64_AnimHeader.read_binary(
-                reader.branch(entrie.address),
+                header_reader,
                 read_headers,
                 True,
                 bone_count,
@@ -886,39 +883,85 @@ def read_c(
             )
 
 
-def create_tables(anims_data: list[SM64_AnimData], values_name=""):
-    """Can generate multiple indices table with only one value table, which improves compression
-    This feature is used in table exports"""
+def create_tables(anims_data: list[SM64_AnimData], values_name="", start_address=-1):
+    """
+    Can generate multiple indices table with only one value table (or multiple if needed),
+    which improves compression (this feature is used in table exports).
+    Update the animation data with the correct references.
+    Returns: indice_tables, value_tables (in that order)
+    """
 
-    name = values_name if values_name else anims_data[0].values_reference
-    data = np.array([], np.int16)
+    def add_data(values_table: IntArray, size: int, anim_data: SM64_AnimData, values_address: int):
+        data = values_table.data
+        for pair in anim_data.pairs:
+            pair_values = pair.values
+            assert len(pair_values) <= MAX_U16, "Pair frame count is higher than the 16 bit max."
+
+            # It's never worth it to find an existing offset for values bigger than 1 frame.
+            # From my (@Lilaa3) testing, the only improvement in Mario resulted in just 286 bytes saved.
+            offset = None
+            if len(pair_values) == 1:
+                indices = np.isin(data[:size], pair_values[0]).nonzero()[0]
+                offset = indices[0] if indices.size > 0 else None
+
+            if offset is None:  # no existing offset found
+                offset = size
+                size = offset + len(pair_values)
+                if size > MAX_U16:
+                    return -1, None  # exceeded limit, but we may be able to recover with a new table
+                data[offset:size] = pair_values
+            pair.offset = offset
+
+        # build indice table
+        indice_values = np.empty((len(anim_data.pairs), 2), np.uint16)
+        for i, pair in enumerate(anim_data.pairs):
+            indice_values[i] = [len(pair.values), pair.offset]  # Use calculated offsets
+        indice_values = indice_values.reshape(-1)
+        indice_table = IntArray(str(anim_data.indice_reference), 6, -6, indice_values)
+
+        if values_address == -1:
+            anim_data.values_reference = value_table.name
+        else:
+            anim_data.values_reference = values_address
+        return size, indice_table
 
-    print("Generating compressed value table and offsets.")
-    for pair in [pair for anim_data in anims_data for pair in anim_data.pairs]:
-        pair_values = pair.values
-        assert len(pair_values) <= MAX_U16, "Pair frame count is higher than the 16 bit max."
-
-        # It's never worth to find an offset for values bigger than 1 frame from my testing
-        # the one use case resulted in a 286 bytes improvement
-        offset = None
-        if len(pair_values) == 1:
-            indices = np.isin(data, pair_values[0]).nonzero()[0]
-            offset = indices[0] if indices.size > 0 else None
-        if offset is None:
-            offset = len(data)
-            data = np.concatenate((data, pair_values))
-        assert offset <= MAX_U16, "Pair offset is higher than the 16 bit max."
-        pair.offset = offset
-
-    value_table = IntArray(name, 9, data=data)
-
-    print("Generating indices tables.")
     indice_tables: list[IntArray] = []
-    for anim_data in anims_data:
-        indice_values = []
-        for pair in anim_data.pairs:
-            indice_values.extend([len(pair.values), pair.offset])  # Use calculated offsets
-        indice_table = IntArray(anim_data.indice_reference, 6, -6, np.array(indice_values, dtype=np.uint16))
-        indice_tables.append(indice_table)
+    value_tables: list[IntArray] = []
+
+    values_name = values_name or str(anims_data[0].values_reference)
+    indices_address = start_address
+    if start_address != -1:
+        for anim_data in anims_data:
+            anim_data.indice_reference = indices_address
+            indices_address += len(anim_data.pairs) * 2 * 2
+    values_address = indices_address
 
-    return value_table, indice_tables
+    print("Generating compressed value table and offsets.")
+    size = 0
+    # opt: this is the max size possible, prevents tons of allocations (great for Mario), only about 65 kb
+    value_table = IntArray(values_name, 9, data=np.empty(MAX_U16, np.int16))
+    value_tables.append(value_table)
+    i = 0  # we can´t use enumarate, as we may repeat
+    while i < len(anims_data):
+        anim_data = anims_data[i]
+
+        size_before_add = size
+        size, indice_table = add_data(value_table, size, anim_data, values_address)
+        if size != -1:  # sucefully added the data to the value table
+            assert indice_table is not None
+            indice_tables.append(indice_table)
+            i += 1  # do the next animation
+        else:  # Could not add to the value table
+            if size_before_add == 0:  # If the table was empty, it is simply invalid
+                raise PluginError(f"Index table cannot fit into value table of {MAX_U16} size")
+            else:  # try again with a fresh value table
+                value_table.data.resize(size_before_add, refcheck=False)  # resize to remove unused data
+                if start_address != -1:
+                    values_address += size_before_add * 2
+                value_table = IntArray(f"{values_name}_{len(value_tables)}", 9, data=np.empty(MAX_U16, np.int16))
+                value_tables.append(value_table)
+                size = 0  # reset size
+                # don't increment i, redo
+    value_table.data.resize(size, refcheck=False)  # resize to remove unused data
+
+    return indice_tables, value_tables
diff --git a/fast64_internal/sm64/animation/exporting.py b/fast64_internal/sm64/animation/exporting.py
index 2b1c9afbd..aa436b2c9 100644
--- a/fast64_internal/sm64/animation/exporting.py
+++ b/fast64_internal/sm64/animation/exporting.py
@@ -69,6 +69,7 @@ def trim_duplicates_vectorized(arr2d: np.ndarray) -> list:
     mask = arr2d != last_elements[:, None]
     #  Reverse the order, find the last element with the same value
     trim_indices = np.argmax(mask[:, ::-1], axis=1)
+    # return list(arr2d)  # uncomment to test large sizes
     return [
         sub_array if index == 1 else sub_array[: 1 if index == 0 else (-index + 1)]
         for sub_array, index in zip(arr2d, trim_indices)
@@ -598,10 +599,10 @@ def update_table_file(
     table_path.write_text(text)
 
 
-def update_data_file(path: Path, anim_file_names: list[Path], override_files: bool = False):
+def update_data_file(path: Path, anim_file_names: list[str], override_files: bool = False):
     includes = []
     for anim_file_name in anim_file_names:
-        includes.append(f'"{anim_file_name.as_posix()}"')
+        includes.append(f'"{anim_file_name}"')
     if write_includes(path, includes, create_new=override_files):
         print(f"Updating animation data file includes at {path}")
 
@@ -670,11 +671,11 @@ def export_animation_table_binary(
     if anim_props.write_data_seperately:  # Write the data and the table into seperate address range
         data_address = get64bitAlignedAddr(int_from_str(anim_props.data_address))
         data_end_address = int_from_str(anim_props.data_end_address)
-        table_data, data = table.to_combined_binary(address, data_address, segment_data, anim_props.null_delimiter)[:2]
+        table_data, data = table.to_combined_binary(address, data_address, segment_data)[:2]
         binary_exporter.write_to_range(address, end_address, table_data)
         binary_exporter.write_to_range(data_address, data_end_address, data)
     else:  # Write table then the data in one address range
-        table_data, data = table.to_combined_binary(address, -1, segment_data, anim_props.null_delimiter)[:2]
+        table_data, data = table.to_combined_binary(address, -1, segment_data)[:2]
         binary_exporter.write_to_range(address, end_address, table_data + data)
     if anim_props.update_behavior:
         update_behaviour_binary(
@@ -694,7 +695,7 @@ def export_animation_table_insertable(
         data = table.to_binary_dma()
         InsertableBinaryData("Animation DMA Table", data).write(path)
     else:
-        table_data, data, ptrs = table.to_combined_binary(null_delimiter=anim_props.null_delimiter)
+        table_data, data, ptrs = table.to_combined_binary()
         InsertableBinaryData("Animation Table", table_data + data, 0, ptrs).write(path)
 
 
diff --git a/fast64_internal/sm64/sm64_classes.py b/fast64_internal/sm64/sm64_classes.py
index 0c597021e..725a174ee 100644
--- a/fast64_internal/sm64/sm64_classes.py
+++ b/fast64_internal/sm64/sm64_classes.py
@@ -268,7 +268,7 @@ class IntArray:
     def to_binary(self):
         return self.data.astype(">i2").tobytes()
 
-    def to_c(self):
+    def to_c(self):  # TODO: Use io stream arg
         assert self.name, "Array must have a name"
         data = self.data
         byte_count = data.itemsize