diff --git a/404.html b/404.html
index 2aa1be7..a4fd466 100644
--- a/404.html
+++ b/404.html
@@ -392,6 +392,27 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="/snipe/Sketch/" class="md-nav__link">
+        
+  
+  <span class="md-ellipsis">
+    Sketch
+  </span>
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
diff --git a/ReferenceQC/index.html b/ReferenceQC/index.html
index 53adee2..2bae99d 100644
--- a/ReferenceQC/index.html
+++ b/ReferenceQC/index.html
@@ -18,7 +18,7 @@
         <link rel="prev" href="../SnipeSig/">
       
       
-        <link rel="next" href="../cli/">
+        <link rel="next" href="../Sketch/">
       
       
       <link rel="icon" href="../assets/images/favicon.png">
@@ -448,6 +448,39 @@
     </span>
   </a>
   
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.PreparedQC" class="md-nav__link">
+    <span class="md-ellipsis">
+      PreparedQC
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PreparedQC">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.PreparedQC.__init__" class="md-nav__link">
+    <span class="md-ellipsis">
+      __init__
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.PreparedQC.download_osf_db" class="md-nav__link">
+    <span class="md-ellipsis">
+      download_osf_db
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
 </li>
       
         <li class="md-nav__item">
@@ -503,6 +536,24 @@
     </span>
   </a>
   
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.ReferenceQC.load_genome_sig_to_dict" class="md-nav__link">
+    <span class="md-ellipsis">
+      load_genome_sig_to_dict
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.ReferenceQC.nonref_consume_from_vars" class="md-nav__link">
+    <span class="md-ellipsis">
+      nonref_consume_from_vars
+    </span>
+  </a>
+  
 </li>
         
           <li class="md-nav__item">
@@ -537,6 +588,27 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../Sketch/" class="md-nav__link">
+        
+  
+  <span class="md-ellipsis">
+    Sketch
+  </span>
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -597,6 +669,39 @@
     </span>
   </a>
   
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.PreparedQC" class="md-nav__link">
+    <span class="md-ellipsis">
+      PreparedQC
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="PreparedQC">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.PreparedQC.__init__" class="md-nav__link">
+    <span class="md-ellipsis">
+      __init__
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.PreparedQC.download_osf_db" class="md-nav__link">
+    <span class="md-ellipsis">
+      download_osf_db
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
 </li>
       
         <li class="md-nav__item">
@@ -652,6 +757,24 @@
     </span>
   </a>
   
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.ReferenceQC.load_genome_sig_to_dict" class="md-nav__link">
+    <span class="md-ellipsis">
+      load_genome_sig_to_dict
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.reference_QC.ReferenceQC.nonref_consume_from_vars" class="md-nav__link">
+    <span class="md-ellipsis">
+      nonref_consume_from_vars
+    </span>
+  </a>
+  
 </li>
         
           <li class="md-nav__item">
@@ -718,6 +841,676 @@ <h1 id="python-api-documentation">Python API Documentation<a class="headerlink"
 
 
 
+<div class="doc doc-object doc-class">
+
+
+
+<h2 id="snipe.api.reference_QC.PreparedQC" class="doc doc-heading">
+            <code>PreparedQC</code>
+
+
+<a href="#snipe.api.reference_QC.PreparedQC" class="headerlink" title="Permanent link">&para;</a></h2>
+
+
+    <div class="doc doc-contents ">
+            <p class="doc doc-class-bases">
+              Bases: <code>ReferenceQC</code></p>
+
+
+        <p>Class for quality control (QC) analysis of sample signature against prepared snipe profiles.</p>
+
+
+
+
+
+
+              <details class="quote">
+                <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1546">1546</a></span>
+<span class="normal"><a href="#__codelineno-0-1547">1547</a></span>
+<span class="normal"><a href="#__codelineno-0-1548">1548</a></span>
+<span class="normal"><a href="#__codelineno-0-1549">1549</a></span>
+<span class="normal"><a href="#__codelineno-0-1550">1550</a></span>
+<span class="normal"><a href="#__codelineno-0-1551">1551</a></span>
+<span class="normal"><a href="#__codelineno-0-1552">1552</a></span>
+<span class="normal"><a href="#__codelineno-0-1553">1553</a></span>
+<span class="normal"><a href="#__codelineno-0-1554">1554</a></span>
+<span class="normal"><a href="#__codelineno-0-1555">1555</a></span>
+<span class="normal"><a href="#__codelineno-0-1556">1556</a></span>
+<span class="normal"><a href="#__codelineno-0-1557">1557</a></span>
+<span class="normal"><a href="#__codelineno-0-1558">1558</a></span>
+<span class="normal"><a href="#__codelineno-0-1559">1559</a></span>
+<span class="normal"><a href="#__codelineno-0-1560">1560</a></span>
+<span class="normal"><a href="#__codelineno-0-1561">1561</a></span>
+<span class="normal"><a href="#__codelineno-0-1562">1562</a></span>
+<span class="normal"><a href="#__codelineno-0-1563">1563</a></span>
+<span class="normal"><a href="#__codelineno-0-1564">1564</a></span>
+<span class="normal"><a href="#__codelineno-0-1565">1565</a></span>
+<span class="normal"><a href="#__codelineno-0-1566">1566</a></span>
+<span class="normal"><a href="#__codelineno-0-1567">1567</a></span>
+<span class="normal"><a href="#__codelineno-0-1568">1568</a></span>
+<span class="normal"><a href="#__codelineno-0-1569">1569</a></span>
+<span class="normal"><a href="#__codelineno-0-1570">1570</a></span>
+<span class="normal"><a href="#__codelineno-0-1571">1571</a></span>
+<span class="normal"><a href="#__codelineno-0-1572">1572</a></span>
+<span class="normal"><a href="#__codelineno-0-1573">1573</a></span>
+<span class="normal"><a href="#__codelineno-0-1574">1574</a></span>
+<span class="normal"><a href="#__codelineno-0-1575">1575</a></span>
+<span class="normal"><a href="#__codelineno-0-1576">1576</a></span>
+<span class="normal"><a href="#__codelineno-0-1577">1577</a></span>
+<span class="normal"><a href="#__codelineno-0-1578">1578</a></span>
+<span class="normal"><a href="#__codelineno-0-1579">1579</a></span>
+<span class="normal"><a href="#__codelineno-0-1580">1580</a></span>
+<span class="normal"><a href="#__codelineno-0-1581">1581</a></span>
+<span class="normal"><a href="#__codelineno-0-1582">1582</a></span>
+<span class="normal"><a href="#__codelineno-0-1583">1583</a></span>
+<span class="normal"><a href="#__codelineno-0-1584">1584</a></span>
+<span class="normal"><a href="#__codelineno-0-1585">1585</a></span>
+<span class="normal"><a href="#__codelineno-0-1586">1586</a></span>
+<span class="normal"><a href="#__codelineno-0-1587">1587</a></span>
+<span class="normal"><a href="#__codelineno-0-1588">1588</a></span>
+<span class="normal"><a href="#__codelineno-0-1589">1589</a></span>
+<span class="normal"><a href="#__codelineno-0-1590">1590</a></span>
+<span class="normal"><a href="#__codelineno-0-1591">1591</a></span>
+<span class="normal"><a href="#__codelineno-0-1592">1592</a></span>
+<span class="normal"><a href="#__codelineno-0-1593">1593</a></span>
+<span class="normal"><a href="#__codelineno-0-1594">1594</a></span>
+<span class="normal"><a href="#__codelineno-0-1595">1595</a></span>
+<span class="normal"><a href="#__codelineno-0-1596">1596</a></span>
+<span class="normal"><a href="#__codelineno-0-1597">1597</a></span>
+<span class="normal"><a href="#__codelineno-0-1598">1598</a></span>
+<span class="normal"><a href="#__codelineno-0-1599">1599</a></span>
+<span class="normal"><a href="#__codelineno-0-1600">1600</a></span>
+<span class="normal"><a href="#__codelineno-0-1601">1601</a></span>
+<span class="normal"><a href="#__codelineno-0-1602">1602</a></span>
+<span class="normal"><a href="#__codelineno-0-1603">1603</a></span>
+<span class="normal"><a href="#__codelineno-0-1604">1604</a></span>
+<span class="normal"><a href="#__codelineno-0-1605">1605</a></span>
+<span class="normal"><a href="#__codelineno-0-1606">1606</a></span>
+<span class="normal"><a href="#__codelineno-0-1607">1607</a></span>
+<span class="normal"><a href="#__codelineno-0-1608">1608</a></span>
+<span class="normal"><a href="#__codelineno-0-1609">1609</a></span>
+<span class="normal"><a href="#__codelineno-0-1610">1610</a></span>
+<span class="normal"><a href="#__codelineno-0-1611">1611</a></span>
+<span class="normal"><a href="#__codelineno-0-1612">1612</a></span>
+<span class="normal"><a href="#__codelineno-0-1613">1613</a></span>
+<span class="normal"><a href="#__codelineno-0-1614">1614</a></span>
+<span class="normal"><a href="#__codelineno-0-1615">1615</a></span>
+<span class="normal"><a href="#__codelineno-0-1616">1616</a></span>
+<span class="normal"><a href="#__codelineno-0-1617">1617</a></span>
+<span class="normal"><a href="#__codelineno-0-1618">1618</a></span>
+<span class="normal"><a href="#__codelineno-0-1619">1619</a></span>
+<span class="normal"><a href="#__codelineno-0-1620">1620</a></span>
+<span class="normal"><a href="#__codelineno-0-1621">1621</a></span>
+<span class="normal"><a href="#__codelineno-0-1622">1622</a></span>
+<span class="normal"><a href="#__codelineno-0-1623">1623</a></span>
+<span class="normal"><a href="#__codelineno-0-1624">1624</a></span>
+<span class="normal"><a href="#__codelineno-0-1625">1625</a></span>
+<span class="normal"><a href="#__codelineno-0-1626">1626</a></span>
+<span class="normal"><a href="#__codelineno-0-1627">1627</a></span>
+<span class="normal"><a href="#__codelineno-0-1628">1628</a></span>
+<span class="normal"><a href="#__codelineno-0-1629">1629</a></span>
+<span class="normal"><a href="#__codelineno-0-1630">1630</a></span>
+<span class="normal"><a href="#__codelineno-0-1631">1631</a></span>
+<span class="normal"><a href="#__codelineno-0-1632">1632</a></span>
+<span class="normal"><a href="#__codelineno-0-1633">1633</a></span>
+<span class="normal"><a href="#__codelineno-0-1634">1634</a></span>
+<span class="normal"><a href="#__codelineno-0-1635">1635</a></span>
+<span class="normal"><a href="#__codelineno-0-1636">1636</a></span>
+<span class="normal"><a href="#__codelineno-0-1637">1637</a></span>
+<span class="normal"><a href="#__codelineno-0-1638">1638</a></span>
+<span class="normal"><a href="#__codelineno-0-1639">1639</a></span>
+<span class="normal"><a href="#__codelineno-0-1640">1640</a></span>
+<span class="normal"><a href="#__codelineno-0-1641">1641</a></span>
+<span class="normal"><a href="#__codelineno-0-1642">1642</a></span>
+<span class="normal"><a href="#__codelineno-0-1643">1643</a></span>
+<span class="normal"><a href="#__codelineno-0-1644">1644</a></span>
+<span class="normal"><a href="#__codelineno-0-1645">1645</a></span>
+<span class="normal"><a href="#__codelineno-0-1646">1646</a></span>
+<span class="normal"><a href="#__codelineno-0-1647">1647</a></span>
+<span class="normal"><a href="#__codelineno-0-1648">1648</a></span>
+<span class="normal"><a href="#__codelineno-0-1649">1649</a></span>
+<span class="normal"><a href="#__codelineno-0-1650">1650</a></span>
+<span class="normal"><a href="#__codelineno-0-1651">1651</a></span>
+<span class="normal"><a href="#__codelineno-0-1652">1652</a></span>
+<span class="normal"><a href="#__codelineno-0-1653">1653</a></span>
+<span class="normal"><a href="#__codelineno-0-1654">1654</a></span>
+<span class="normal"><a href="#__codelineno-0-1655">1655</a></span>
+<span class="normal"><a href="#__codelineno-0-1656">1656</a></span>
+<span class="normal"><a href="#__codelineno-0-1657">1657</a></span>
+<span class="normal"><a href="#__codelineno-0-1658">1658</a></span>
+<span class="normal"><a href="#__codelineno-0-1659">1659</a></span>
+<span class="normal"><a href="#__codelineno-0-1660">1660</a></span>
+<span class="normal"><a href="#__codelineno-0-1661">1661</a></span>
+<span class="normal"><a href="#__codelineno-0-1662">1662</a></span>
+<span class="normal"><a href="#__codelineno-0-1663">1663</a></span>
+<span class="normal"><a href="#__codelineno-0-1664">1664</a></span>
+<span class="normal"><a href="#__codelineno-0-1665">1665</a></span>
+<span class="normal"><a href="#__codelineno-0-1666">1666</a></span>
+<span class="normal"><a href="#__codelineno-0-1667">1667</a></span>
+<span class="normal"><a href="#__codelineno-0-1668">1668</a></span>
+<span class="normal"><a href="#__codelineno-0-1669">1669</a></span>
+<span class="normal"><a href="#__codelineno-0-1670">1670</a></span>
+<span class="normal"><a href="#__codelineno-0-1671">1671</a></span>
+<span class="normal"><a href="#__codelineno-0-1672">1672</a></span>
+<span class="normal"><a href="#__codelineno-0-1673">1673</a></span>
+<span class="normal"><a href="#__codelineno-0-1674">1674</a></span>
+<span class="normal"><a href="#__codelineno-0-1675">1675</a></span>
+<span class="normal"><a href="#__codelineno-0-1676">1676</a></span>
+<span class="normal"><a href="#__codelineno-0-1677">1677</a></span>
+<span class="normal"><a href="#__codelineno-0-1678">1678</a></span>
+<span class="normal"><a href="#__codelineno-0-1679">1679</a></span>
+<span class="normal"><a href="#__codelineno-0-1680">1680</a></span>
+<span class="normal"><a href="#__codelineno-0-1681">1681</a></span>
+<span class="normal"><a href="#__codelineno-0-1682">1682</a></span>
+<span class="normal"><a href="#__codelineno-0-1683">1683</a></span>
+<span class="normal"><a href="#__codelineno-0-1684">1684</a></span>
+<span class="normal"><a href="#__codelineno-0-1685">1685</a></span>
+<span class="normal"><a href="#__codelineno-0-1686">1686</a></span>
+<span class="normal"><a href="#__codelineno-0-1687">1687</a></span>
+<span class="normal"><a href="#__codelineno-0-1688">1688</a></span>
+<span class="normal"><a href="#__codelineno-0-1689">1689</a></span>
+<span class="normal"><a href="#__codelineno-0-1690">1690</a></span>
+<span class="normal"><a href="#__codelineno-0-1691">1691</a></span>
+<span class="normal"><a href="#__codelineno-0-1692">1692</a></span>
+<span class="normal"><a href="#__codelineno-0-1693">1693</a></span>
+<span class="normal"><a href="#__codelineno-0-1694">1694</a></span>
+<span class="normal"><a href="#__codelineno-0-1695">1695</a></span>
+<span class="normal"><a href="#__codelineno-0-1696">1696</a></span>
+<span class="normal"><a href="#__codelineno-0-1697">1697</a></span>
+<span class="normal"><a href="#__codelineno-0-1698">1698</a></span>
+<span class="normal"><a href="#__codelineno-0-1699">1699</a></span>
+<span class="normal"><a href="#__codelineno-0-1700">1700</a></span>
+<span class="normal"><a href="#__codelineno-0-1701">1701</a></span>
+<span class="normal"><a href="#__codelineno-0-1702">1702</a></span>
+<span class="normal"><a href="#__codelineno-0-1703">1703</a></span>
+<span class="normal"><a href="#__codelineno-0-1704">1704</a></span>
+<span class="normal"><a href="#__codelineno-0-1705">1705</a></span>
+<span class="normal"><a href="#__codelineno-0-1706">1706</a></span>
+<span class="normal"><a href="#__codelineno-0-1707">1707</a></span>
+<span class="normal"><a href="#__codelineno-0-1708">1708</a></span>
+<span class="normal"><a href="#__codelineno-0-1709">1709</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1546"><a id="__codelineno-0-1546" name="__codelineno-0-1546"></a><span class="k">class</span> <span class="nc">PreparedQC</span><span class="p">(</span><span class="n">ReferenceQC</span><span class="p">):</span>
+</span><span id="__span-0-1547"><a id="__codelineno-0-1547" name="__codelineno-0-1547"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1548"><a id="__codelineno-0-1548" name="__codelineno-0-1548"></a><span class="sd">    Class for quality control (QC) analysis of sample signature against prepared snipe profiles.</span>
+</span><span id="__span-0-1549"><a id="__codelineno-0-1549" name="__codelineno-0-1549"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1550"><a id="__codelineno-0-1550" name="__codelineno-0-1550"></a>
+</span><span id="__span-0-1551"><a id="__codelineno-0-1551" name="__codelineno-0-1551"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="n">sample_sig</span><span class="p">:</span> <span class="n">SnipeSig</span><span class="p">,</span> <span class="n">snipe_db_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;~/.snipe/dbs/&#39;</span><span class="p">,</span> <span class="n">ref_id</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">amplicon_id</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+</span><span id="__span-0-1552"><a id="__codelineno-0-1552" name="__codelineno-0-1552"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1553"><a id="__codelineno-0-1553" name="__codelineno-0-1553"></a><span class="sd">        Initialize the PreparedQC instance.</span>
+</span><span id="__span-0-1554"><a id="__codelineno-0-1554" name="__codelineno-0-1554"></a>
+</span><span id="__span-0-1555"><a id="__codelineno-0-1555" name="__codelineno-0-1555"></a><span class="sd">        **Parameters**</span>
+</span><span id="__span-0-1556"><a id="__codelineno-0-1556" name="__codelineno-0-1556"></a>
+</span><span id="__span-0-1557"><a id="__codelineno-0-1557" name="__codelineno-0-1557"></a><span class="sd">        - `sample_sig` (`SnipeSig`): The sample k-mer signature.</span>
+</span><span id="__span-0-1558"><a id="__codelineno-0-1558" name="__codelineno-0-1558"></a><span class="sd">        - `snipe_db_path` (`str`): Path to the local Snipe database directory.</span>
+</span><span id="__span-0-1559"><a id="__codelineno-0-1559" name="__codelineno-0-1559"></a><span class="sd">        - `ref_id` (`Optional[str]`): Reference identifier for selecting specific profiles.</span>
+</span><span id="__span-0-1560"><a id="__codelineno-0-1560" name="__codelineno-0-1560"></a><span class="sd">        - `enable_logging` (`bool`): Flag to enable detailed logging.</span>
+</span><span id="__span-0-1561"><a id="__codelineno-0-1561" name="__codelineno-0-1561"></a><span class="sd">        - `**kwargs`: Additional keyword arguments.</span>
+</span><span id="__span-0-1562"><a id="__codelineno-0-1562" name="__codelineno-0-1562"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1563"><a id="__codelineno-0-1563" name="__codelineno-0-1563"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">snipe_db_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">expanduser</span><span class="p">(</span><span class="n">snipe_db_path</span><span class="p">)</span>
+</span><span id="__span-0-1564"><a id="__codelineno-0-1564" name="__codelineno-0-1564"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">ref_id</span> <span class="o">=</span> <span class="n">ref_id</span>
+</span><span id="__span-0-1565"><a id="__codelineno-0-1565" name="__codelineno-0-1565"></a>
+</span><span id="__span-0-1566"><a id="__codelineno-0-1566" name="__codelineno-0-1566"></a>        <span class="c1"># Ensure the local database directory exists</span>
+</span><span id="__span-0-1567"><a id="__codelineno-0-1567" name="__codelineno-0-1567"></a>        <span class="n">os</span><span class="o">.</span><span class="n">makedirs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">snipe_db_path</span><span class="p">,</span> <span class="n">exist_ok</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-1568"><a id="__codelineno-0-1568" name="__codelineno-0-1568"></a>        <span class="k">if</span> <span class="n">enable_logging</span><span class="p">:</span>
+</span><span id="__span-0-1569"><a id="__codelineno-0-1569" name="__codelineno-0-1569"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Local Snipe DB path set to: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">snipe_db_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1570"><a id="__codelineno-0-1570" name="__codelineno-0-1570"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1571"><a id="__codelineno-0-1571" name="__codelineno-0-1571"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Logging is disabled for PreparedQC.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1572"><a id="__codelineno-0-1572" name="__codelineno-0-1572"></a>
+</span><span id="__span-0-1573"><a id="__codelineno-0-1573" name="__codelineno-0-1573"></a>        <span class="c1"># Initialize without a reference signature for now; it can be set after downloading</span>
+</span><span id="__span-0-1574"><a id="__codelineno-0-1574" name="__codelineno-0-1574"></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="__span-0-1575"><a id="__codelineno-0-1575" name="__codelineno-0-1575"></a>            <span class="n">sample_sig</span><span class="o">=</span><span class="n">sample_sig</span><span class="p">,</span>
+</span><span id="__span-0-1576"><a id="__codelineno-0-1576" name="__codelineno-0-1576"></a>            <span class="n">reference_sig</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>  <span class="c1"># To be set after downloading</span>
+</span><span id="__span-0-1577"><a id="__codelineno-0-1577" name="__codelineno-0-1577"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">,</span>
+</span><span id="__span-0-1578"><a id="__codelineno-0-1578" name="__codelineno-0-1578"></a>            <span class="o">**</span><span class="n">kwargs</span>
+</span><span id="__span-0-1579"><a id="__codelineno-0-1579" name="__codelineno-0-1579"></a>        <span class="p">)</span>
+</span><span id="__span-0-1580"><a id="__codelineno-0-1580" name="__codelineno-0-1580"></a>
+</span><span id="__span-0-1581"><a id="__codelineno-0-1581" name="__codelineno-0-1581"></a>    <span class="k">def</span> <span class="nf">download_osf_db</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">url</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">save_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;~/.snipe/dbs&#39;</span><span class="p">,</span> <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-1582"><a id="__codelineno-0-1582" name="__codelineno-0-1582"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1583"><a id="__codelineno-0-1583" name="__codelineno-0-1583"></a><span class="sd">        Download a file from OSF using the provided URL. The file is saved with its original name </span>
+</span><span id="__span-0-1584"><a id="__codelineno-0-1584" name="__codelineno-0-1584"></a><span class="sd">        as specified by the OSF server via the Content-Disposition header.</span>
+</span><span id="__span-0-1585"><a id="__codelineno-0-1585" name="__codelineno-0-1585"></a>
+</span><span id="__span-0-1586"><a id="__codelineno-0-1586" name="__codelineno-0-1586"></a><span class="sd">        **Parameters**</span>
+</span><span id="__span-0-1587"><a id="__codelineno-0-1587" name="__codelineno-0-1587"></a>
+</span><span id="__span-0-1588"><a id="__codelineno-0-1588" name="__codelineno-0-1588"></a><span class="sd">        - `url` (`str`): The OSF URL to download the file from.</span>
+</span><span id="__span-0-1589"><a id="__codelineno-0-1589" name="__codelineno-0-1589"></a><span class="sd">        - `save_path` (`str`): The directory path where the file will be saved. Supports user (~) and environment variables.</span>
+</span><span id="__span-0-1590"><a id="__codelineno-0-1590" name="__codelineno-0-1590"></a><span class="sd">                               Default is the local Snipe database directory.</span>
+</span><span id="__span-0-1591"><a id="__codelineno-0-1591" name="__codelineno-0-1591"></a><span class="sd">        - `force` (`bool`): If True, overwrite the file if it already exists. Default is False.</span>
+</span><span id="__span-0-1592"><a id="__codelineno-0-1592" name="__codelineno-0-1592"></a>
+</span><span id="__span-0-1593"><a id="__codelineno-0-1593" name="__codelineno-0-1593"></a><span class="sd">        **Returns**</span>
+</span><span id="__span-0-1594"><a id="__codelineno-0-1594" name="__codelineno-0-1594"></a>
+</span><span id="__span-0-1595"><a id="__codelineno-0-1595" name="__codelineno-0-1595"></a><span class="sd">        - `Optional[str]`: The path to the downloaded file if successful, else None.</span>
+</span><span id="__span-0-1596"><a id="__codelineno-0-1596" name="__codelineno-0-1596"></a>
+</span><span id="__span-0-1597"><a id="__codelineno-0-1597" name="__codelineno-0-1597"></a><span class="sd">        **Raises**</span>
+</span><span id="__span-0-1598"><a id="__codelineno-0-1598" name="__codelineno-0-1598"></a>
+</span><span id="__span-0-1599"><a id="__codelineno-0-1599" name="__codelineno-0-1599"></a><span class="sd">        - `requests.exceptions.RequestException`: If an error occurs during the HTTP request.</span>
+</span><span id="__span-0-1600"><a id="__codelineno-0-1600" name="__codelineno-0-1600"></a><span class="sd">        - `Exception`: For any other exceptions that may arise.</span>
+</span><span id="__span-0-1601"><a id="__codelineno-0-1601" name="__codelineno-0-1601"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1602"><a id="__codelineno-0-1602" name="__codelineno-0-1602"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-1603"><a id="__codelineno-0-1603" name="__codelineno-0-1603"></a>            <span class="c1"># Expand user (~) and environment variables in save_path</span>
+</span><span id="__span-0-1604"><a id="__codelineno-0-1604" name="__codelineno-0-1604"></a>            <span class="n">expanded_save_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">expanduser</span><span class="p">(</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">expandvars</span><span class="p">(</span><span class="n">save_path</span><span class="p">))</span>
+</span><span id="__span-0-1605"><a id="__codelineno-0-1605" name="__codelineno-0-1605"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Expanded save path: </span><span class="si">{</span><span class="n">expanded_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1606"><a id="__codelineno-0-1606" name="__codelineno-0-1606"></a>
+</span><span id="__span-0-1607"><a id="__codelineno-0-1607" name="__codelineno-0-1607"></a>            <span class="c1"># Ensure the download URL ends with &#39;/download&#39;</span>
+</span><span id="__span-0-1608"><a id="__codelineno-0-1608" name="__codelineno-0-1608"></a>            <span class="n">parsed_url</span> <span class="o">=</span> <span class="n">urlparse</span><span class="p">(</span><span class="n">url</span><span class="p">)</span>
+</span><span id="__span-0-1609"><a id="__codelineno-0-1609" name="__codelineno-0-1609"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">parsed_url</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s1">&#39;/download&#39;</span><span class="p">):</span>
+</span><span id="__span-0-1610"><a id="__codelineno-0-1610" name="__codelineno-0-1610"></a>                <span class="n">download_url</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">url</span><span class="o">.</span><span class="n">rstrip</span><span class="p">(</span><span class="s1">&#39;/&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">/download&quot;</span>
+</span><span id="__span-0-1611"><a id="__codelineno-0-1611" name="__codelineno-0-1611"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1612"><a id="__codelineno-0-1612" name="__codelineno-0-1612"></a>                <span class="n">download_url</span> <span class="o">=</span> <span class="n">url</span>
+</span><span id="__span-0-1613"><a id="__codelineno-0-1613" name="__codelineno-0-1613"></a>
+</span><span id="__span-0-1614"><a id="__codelineno-0-1614" name="__codelineno-0-1614"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Download URL: </span><span class="si">{</span><span class="n">download_url</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1615"><a id="__codelineno-0-1615" name="__codelineno-0-1615"></a>
+</span><span id="__span-0-1616"><a id="__codelineno-0-1616" name="__codelineno-0-1616"></a>            <span class="c1"># Ensure the save directory exists</span>
+</span><span id="__span-0-1617"><a id="__codelineno-0-1617" name="__codelineno-0-1617"></a>            <span class="n">os</span><span class="o">.</span><span class="n">makedirs</span><span class="p">(</span><span class="n">expanded_save_path</span><span class="p">,</span> <span class="n">exist_ok</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-1618"><a id="__codelineno-0-1618" name="__codelineno-0-1618"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Save path verified/created: </span><span class="si">{</span><span class="n">expanded_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1619"><a id="__codelineno-0-1619" name="__codelineno-0-1619"></a>
+</span><span id="__span-0-1620"><a id="__codelineno-0-1620" name="__codelineno-0-1620"></a>            <span class="c1"># Initiate the GET request with streaming</span>
+</span><span id="__span-0-1621"><a id="__codelineno-0-1621" name="__codelineno-0-1621"></a>            <span class="k">with</span> <span class="n">requests</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">download_url</span><span class="p">,</span> <span class="n">stream</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">allow_redirects</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span> <span class="k">as</span> <span class="n">response</span><span class="p">:</span>
+</span><span id="__span-0-1622"><a id="__codelineno-0-1622" name="__codelineno-0-1622"></a>                <span class="n">response</span><span class="o">.</span><span class="n">raise_for_status</span><span class="p">()</span>  <span class="c1"># Raise an exception for HTTP errors</span>
+</span><span id="__span-0-1623"><a id="__codelineno-0-1623" name="__codelineno-0-1623"></a>
+</span><span id="__span-0-1624"><a id="__codelineno-0-1624" name="__codelineno-0-1624"></a>                <span class="c1"># Attempt to extract filename from Content-Disposition</span>
+</span><span id="__span-0-1625"><a id="__codelineno-0-1625" name="__codelineno-0-1625"></a>                <span class="n">content_disposition</span> <span class="o">=</span> <span class="n">response</span><span class="o">.</span><span class="n">headers</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;Content-Disposition&#39;</span><span class="p">)</span>
+</span><span id="__span-0-1626"><a id="__codelineno-0-1626" name="__codelineno-0-1626"></a>                <span class="n">filename</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_extract_filename</span><span class="p">(</span><span class="n">content_disposition</span><span class="p">,</span> <span class="n">parsed_url</span><span class="o">.</span><span class="n">path</span><span class="p">)</span>
+</span><span id="__span-0-1627"><a id="__codelineno-0-1627" name="__codelineno-0-1627"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Filename determined: </span><span class="si">{</span><span class="n">filename</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1628"><a id="__codelineno-0-1628" name="__codelineno-0-1628"></a>
+</span><span id="__span-0-1629"><a id="__codelineno-0-1629" name="__codelineno-0-1629"></a>                <span class="c1"># Define the full save path</span>
+</span><span id="__span-0-1630"><a id="__codelineno-0-1630" name="__codelineno-0-1630"></a>                <span class="n">full_save_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">expanded_save_path</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
+</span><span id="__span-0-1631"><a id="__codelineno-0-1631" name="__codelineno-0-1631"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Full save path: </span><span class="si">{</span><span class="n">full_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1632"><a id="__codelineno-0-1632" name="__codelineno-0-1632"></a>
+</span><span id="__span-0-1633"><a id="__codelineno-0-1633" name="__codelineno-0-1633"></a>                <span class="c1"># Check if the file already exists</span>
+</span><span id="__span-0-1634"><a id="__codelineno-0-1634" name="__codelineno-0-1634"></a>                <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">full_save_path</span><span class="p">):</span>
+</span><span id="__span-0-1635"><a id="__codelineno-0-1635" name="__codelineno-0-1635"></a>                    <span class="k">if</span> <span class="n">force</span><span class="p">:</span>
+</span><span id="__span-0-1636"><a id="__codelineno-0-1636" name="__codelineno-0-1636"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Overwriting existing file: </span><span class="si">{</span><span class="n">full_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1637"><a id="__codelineno-0-1637" name="__codelineno-0-1637"></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1638"><a id="__codelineno-0-1638" name="__codelineno-0-1638"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;File already exists: </span><span class="si">{</span><span class="n">full_save_path</span><span class="si">}</span><span class="s2">. Skipping download.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1639"><a id="__codelineno-0-1639" name="__codelineno-0-1639"></a>                        <span class="k">return</span> <span class="n">full_save_path</span>
+</span><span id="__span-0-1640"><a id="__codelineno-0-1640" name="__codelineno-0-1640"></a>
+</span><span id="__span-0-1641"><a id="__codelineno-0-1641" name="__codelineno-0-1641"></a>                <span class="c1"># Get the total file size for the progress bar</span>
+</span><span id="__span-0-1642"><a id="__codelineno-0-1642" name="__codelineno-0-1642"></a>                <span class="n">total_size</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">response</span><span class="o">.</span><span class="n">headers</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;Content-Length&#39;</span><span class="p">,</span> <span class="mi">0</span><span class="p">))</span>
+</span><span id="__span-0-1643"><a id="__codelineno-0-1643" name="__codelineno-0-1643"></a>
+</span><span id="__span-0-1644"><a id="__codelineno-0-1644" name="__codelineno-0-1644"></a>                <span class="c1"># Initialize the progress bar</span>
+</span><span id="__span-0-1645"><a id="__codelineno-0-1645" name="__codelineno-0-1645"></a>                <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">full_save_path</span><span class="p">,</span> <span class="s1">&#39;wb&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">file</span><span class="p">,</span> <span class="n">tqdm</span><span class="p">(</span>
+</span><span id="__span-0-1646"><a id="__codelineno-0-1646" name="__codelineno-0-1646"></a>                    <span class="n">total</span><span class="o">=</span><span class="n">total_size</span><span class="p">,</span> 
+</span><span id="__span-0-1647"><a id="__codelineno-0-1647" name="__codelineno-0-1647"></a>                    <span class="n">unit</span><span class="o">=</span><span class="s1">&#39;B&#39;</span><span class="p">,</span> 
+</span><span id="__span-0-1648"><a id="__codelineno-0-1648" name="__codelineno-0-1648"></a>                    <span class="n">unit_scale</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> 
+</span><span id="__span-0-1649"><a id="__codelineno-0-1649" name="__codelineno-0-1649"></a>                    <span class="n">unit_divisor</span><span class="o">=</span><span class="mi">1024</span><span class="p">,</span>
+</span><span id="__span-0-1650"><a id="__codelineno-0-1650" name="__codelineno-0-1650"></a>                    <span class="n">desc</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-1651"><a id="__codelineno-0-1651" name="__codelineno-0-1651"></a>                    <span class="n">ncols</span><span class="o">=</span><span class="mi">100</span>
+</span><span id="__span-0-1652"><a id="__codelineno-0-1652" name="__codelineno-0-1652"></a>                <span class="p">)</span> <span class="k">as</span> <span class="n">bar</span><span class="p">:</span>
+</span><span id="__span-0-1653"><a id="__codelineno-0-1653" name="__codelineno-0-1653"></a>                    <span class="k">for</span> <span class="n">chunk</span> <span class="ow">in</span> <span class="n">response</span><span class="o">.</span><span class="n">iter_content</span><span class="p">(</span><span class="n">chunk_size</span><span class="o">=</span><span class="mi">1024</span><span class="p">):</span>
+</span><span id="__span-0-1654"><a id="__codelineno-0-1654" name="__codelineno-0-1654"></a>                        <span class="k">if</span> <span class="n">chunk</span><span class="p">:</span>  <span class="c1"># Filter out keep-alive chunks</span>
+</span><span id="__span-0-1655"><a id="__codelineno-0-1655" name="__codelineno-0-1655"></a>                            <span class="n">file</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">chunk</span><span class="p">)</span>
+</span><span id="__span-0-1656"><a id="__codelineno-0-1656" name="__codelineno-0-1656"></a>                            <span class="n">bar</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">chunk</span><span class="p">))</span>
+</span><span id="__span-0-1657"><a id="__codelineno-0-1657" name="__codelineno-0-1657"></a>
+</span><span id="__span-0-1658"><a id="__codelineno-0-1658" name="__codelineno-0-1658"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;File downloaded successfully: </span><span class="si">{</span><span class="n">full_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1659"><a id="__codelineno-0-1659" name="__codelineno-0-1659"></a>                <span class="k">return</span> <span class="n">full_save_path</span>
+</span><span id="__span-0-1660"><a id="__codelineno-0-1660" name="__codelineno-0-1660"></a>
+</span><span id="__span-0-1661"><a id="__codelineno-0-1661" name="__codelineno-0-1661"></a>        <span class="k">except</span> <span class="n">requests</span><span class="o">.</span><span class="n">exceptions</span><span class="o">.</span><span class="n">RequestException</span> <span class="k">as</span> <span class="n">req_err</span><span class="p">:</span>
+</span><span id="__span-0-1662"><a id="__codelineno-0-1662" name="__codelineno-0-1662"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Request error occurred while downloading </span><span class="si">{</span><span class="n">url</span><span class="si">}</span><span class="s2">: </span><span class="si">{</span><span class="n">req_err</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1663"><a id="__codelineno-0-1663" name="__codelineno-0-1663"></a>            <span class="k">raise</span>
+</span><span id="__span-0-1664"><a id="__codelineno-0-1664" name="__codelineno-0-1664"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-1665"><a id="__codelineno-0-1665" name="__codelineno-0-1665"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;An unexpected error occurred while downloading </span><span class="si">{</span><span class="n">url</span><span class="si">}</span><span class="s2">: </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1666"><a id="__codelineno-0-1666" name="__codelineno-0-1666"></a>            <span class="k">raise</span>
+</span><span id="__span-0-1667"><a id="__codelineno-0-1667" name="__codelineno-0-1667"></a>
+</span><span id="__span-0-1668"><a id="__codelineno-0-1668" name="__codelineno-0-1668"></a>    <span class="k">def</span> <span class="nf">_extract_filename</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">content_disposition</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">url_path</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-1669"><a id="__codelineno-0-1669" name="__codelineno-0-1669"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1670"><a id="__codelineno-0-1670" name="__codelineno-0-1670"></a><span class="sd">        Extract filename from Content-Disposition header or fallback to URL path.</span>
+</span><span id="__span-0-1671"><a id="__codelineno-0-1671" name="__codelineno-0-1671"></a>
+</span><span id="__span-0-1672"><a id="__codelineno-0-1672" name="__codelineno-0-1672"></a><span class="sd">        **Parameters**</span>
+</span><span id="__span-0-1673"><a id="__codelineno-0-1673" name="__codelineno-0-1673"></a>
+</span><span id="__span-0-1674"><a id="__codelineno-0-1674" name="__codelineno-0-1674"></a><span class="sd">        - `content_disposition` (`Optional[str]`): The Content-Disposition header value.</span>
+</span><span id="__span-0-1675"><a id="__codelineno-0-1675" name="__codelineno-0-1675"></a><span class="sd">        - `url_path` (`str`): The path component of the URL.</span>
+</span><span id="__span-0-1676"><a id="__codelineno-0-1676" name="__codelineno-0-1676"></a>
+</span><span id="__span-0-1677"><a id="__codelineno-0-1677" name="__codelineno-0-1677"></a><span class="sd">        **Returns**</span>
+</span><span id="__span-0-1678"><a id="__codelineno-0-1678" name="__codelineno-0-1678"></a>
+</span><span id="__span-0-1679"><a id="__codelineno-0-1679" name="__codelineno-0-1679"></a><span class="sd">        - `str`: The extracted filename.</span>
+</span><span id="__span-0-1680"><a id="__codelineno-0-1680" name="__codelineno-0-1680"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1681"><a id="__codelineno-0-1681" name="__codelineno-0-1681"></a>        <span class="n">filename</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1682"><a id="__codelineno-0-1682" name="__codelineno-0-1682"></a>        <span class="k">if</span> <span class="n">content_disposition</span><span class="p">:</span>
+</span><span id="__span-0-1683"><a id="__codelineno-0-1683" name="__codelineno-0-1683"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Parsing Content-Disposition header for filename.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1684"><a id="__codelineno-0-1684" name="__codelineno-0-1684"></a>            <span class="n">parts</span> <span class="o">=</span> <span class="n">content_disposition</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;;&#39;</span><span class="p">)</span>
+</span><span id="__span-0-1685"><a id="__codelineno-0-1685" name="__codelineno-0-1685"></a>            <span class="k">for</span> <span class="n">part</span> <span class="ow">in</span> <span class="n">parts</span><span class="p">:</span>
+</span><span id="__span-0-1686"><a id="__codelineno-0-1686" name="__codelineno-0-1686"></a>                <span class="n">part</span> <span class="o">=</span> <span class="n">part</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-1687"><a id="__codelineno-0-1687" name="__codelineno-0-1687"></a>                <span class="k">if</span> <span class="n">part</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s1">&#39;filename*=&#39;</span><span class="p">):</span>
+</span><span id="__span-0-1688"><a id="__codelineno-0-1688" name="__codelineno-0-1688"></a>                    <span class="c1"># Handle RFC 5987 encoding (e.g., filename*=UTF-8&#39;&#39;example.txt)</span>
+</span><span id="__span-0-1689"><a id="__codelineno-0-1689" name="__codelineno-0-1689"></a>                    <span class="n">encoded_filename</span> <span class="o">=</span> <span class="n">part</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;=&#39;</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-1690"><a id="__codelineno-0-1690" name="__codelineno-0-1690"></a>                    <span class="k">if</span> <span class="s2">&quot;&#39;&#39;&quot;</span> <span class="ow">in</span> <span class="n">encoded_filename</span><span class="p">:</span>
+</span><span id="__span-0-1691"><a id="__codelineno-0-1691" name="__codelineno-0-1691"></a>                        <span class="n">filename</span> <span class="o">=</span> <span class="n">encoded_filename</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s2">&quot;&#39;&#39;&quot;</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="__span-0-1692"><a id="__codelineno-0-1692" name="__codelineno-0-1692"></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1693"><a id="__codelineno-0-1693" name="__codelineno-0-1693"></a>                        <span class="n">filename</span> <span class="o">=</span> <span class="n">encoded_filename</span>
+</span><span id="__span-0-1694"><a id="__codelineno-0-1694" name="__codelineno-0-1694"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Filename extracted from headers (RFC 5987): </span><span class="si">{</span><span class="n">filename</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1695"><a id="__codelineno-0-1695" name="__codelineno-0-1695"></a>                    <span class="k">break</span>
+</span><span id="__span-0-1696"><a id="__codelineno-0-1696" name="__codelineno-0-1696"></a>                <span class="k">elif</span> <span class="n">part</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s1">&#39;filename=&#39;</span><span class="p">):</span>
+</span><span id="__span-0-1697"><a id="__codelineno-0-1697" name="__codelineno-0-1697"></a>                    <span class="c1"># Remove &#39;filename=&#39; and any surrounding quotes</span>
+</span><span id="__span-0-1698"><a id="__codelineno-0-1698" name="__codelineno-0-1698"></a>                    <span class="n">filename</span> <span class="o">=</span> <span class="n">part</span><span class="o">.</span><span class="n">split</span><span class="p">(</span><span class="s1">&#39;=&#39;</span><span class="p">,</span> <span class="mi">1</span><span class="p">)[</span><span class="mi">1</span><span class="p">]</span><span class="o">.</span><span class="n">strip</span><span class="p">(</span><span class="s1">&#39; &quot;&#39;</span><span class="p">)</span>
+</span><span id="__span-0-1699"><a id="__codelineno-0-1699" name="__codelineno-0-1699"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Filename extracted from headers: </span><span class="si">{</span><span class="n">filename</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1700"><a id="__codelineno-0-1700" name="__codelineno-0-1700"></a>                    <span class="k">break</span>
+</span><span id="__span-0-1701"><a id="__codelineno-0-1701" name="__codelineno-0-1701"></a>
+</span><span id="__span-0-1702"><a id="__codelineno-0-1702" name="__codelineno-0-1702"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">filename</span><span class="p">:</span>
+</span><span id="__span-0-1703"><a id="__codelineno-0-1703" name="__codelineno-0-1703"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Falling back to filename derived from URL path.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1704"><a id="__codelineno-0-1704" name="__codelineno-0-1704"></a>            <span class="n">filename</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">basename</span><span class="p">(</span><span class="n">url_path</span><span class="p">)</span>
+</span><span id="__span-0-1705"><a id="__codelineno-0-1705" name="__codelineno-0-1705"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">filename</span><span class="p">:</span>
+</span><span id="__span-0-1706"><a id="__codelineno-0-1706" name="__codelineno-0-1706"></a>                <span class="n">filename</span> <span class="o">=</span> <span class="s1">&#39;downloaded_file&#39;</span>
+</span><span id="__span-0-1707"><a id="__codelineno-0-1707" name="__codelineno-0-1707"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Filename derived from URL: </span><span class="si">{</span><span class="n">filename</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1708"><a id="__codelineno-0-1708" name="__codelineno-0-1708"></a>
+</span><span id="__span-0-1709"><a id="__codelineno-0-1709" name="__codelineno-0-1709"></a>        <span class="k">return</span> <span class="n">filename</span>
+</span></code></pre></div></td></tr></table></div>
+              </details>
+
+
+
+  <div class="doc doc-children">
+
+
+
+
+
+
+
+
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.reference_QC.PreparedQC.__init__" class="doc doc-heading">
+            <code class="highlight language-python"><span class="fm">__init__</span><span class="p">(</span><span class="o">*</span><span class="p">,</span> <span class="n">sample_sig</span><span class="p">,</span> <span class="n">snipe_db_path</span><span class="o">=</span><span class="s1">&#39;~/.snipe/dbs/&#39;</span><span class="p">,</span> <span class="n">ref_id</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">amplicon_id</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></code>
+
+<a href="#snipe.api.reference_QC.PreparedQC.__init__" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Initialize the PreparedQC instance.</p>
+<p><strong>Parameters</strong></p>
+<ul>
+<li><code>sample_sig</code> (<code>SnipeSig</code>): The sample k-mer signature.</li>
+<li><code>snipe_db_path</code> (<code>str</code>): Path to the local Snipe database directory.</li>
+<li><code>ref_id</code> (<code>Optional[str]</code>): Reference identifier for selecting specific profiles.</li>
+<li><code>enable_logging</code> (<code>bool</code>): Flag to enable detailed logging.</li>
+<li><code>**kwargs</code>: Additional keyword arguments.</li>
+</ul>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1551">1551</a></span>
+<span class="normal"><a href="#__codelineno-0-1552">1552</a></span>
+<span class="normal"><a href="#__codelineno-0-1553">1553</a></span>
+<span class="normal"><a href="#__codelineno-0-1554">1554</a></span>
+<span class="normal"><a href="#__codelineno-0-1555">1555</a></span>
+<span class="normal"><a href="#__codelineno-0-1556">1556</a></span>
+<span class="normal"><a href="#__codelineno-0-1557">1557</a></span>
+<span class="normal"><a href="#__codelineno-0-1558">1558</a></span>
+<span class="normal"><a href="#__codelineno-0-1559">1559</a></span>
+<span class="normal"><a href="#__codelineno-0-1560">1560</a></span>
+<span class="normal"><a href="#__codelineno-0-1561">1561</a></span>
+<span class="normal"><a href="#__codelineno-0-1562">1562</a></span>
+<span class="normal"><a href="#__codelineno-0-1563">1563</a></span>
+<span class="normal"><a href="#__codelineno-0-1564">1564</a></span>
+<span class="normal"><a href="#__codelineno-0-1565">1565</a></span>
+<span class="normal"><a href="#__codelineno-0-1566">1566</a></span>
+<span class="normal"><a href="#__codelineno-0-1567">1567</a></span>
+<span class="normal"><a href="#__codelineno-0-1568">1568</a></span>
+<span class="normal"><a href="#__codelineno-0-1569">1569</a></span>
+<span class="normal"><a href="#__codelineno-0-1570">1570</a></span>
+<span class="normal"><a href="#__codelineno-0-1571">1571</a></span>
+<span class="normal"><a href="#__codelineno-0-1572">1572</a></span>
+<span class="normal"><a href="#__codelineno-0-1573">1573</a></span>
+<span class="normal"><a href="#__codelineno-0-1574">1574</a></span>
+<span class="normal"><a href="#__codelineno-0-1575">1575</a></span>
+<span class="normal"><a href="#__codelineno-0-1576">1576</a></span>
+<span class="normal"><a href="#__codelineno-0-1577">1577</a></span>
+<span class="normal"><a href="#__codelineno-0-1578">1578</a></span>
+<span class="normal"><a href="#__codelineno-0-1579">1579</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1551"><a id="__codelineno-0-1551" name="__codelineno-0-1551"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="n">sample_sig</span><span class="p">:</span> <span class="n">SnipeSig</span><span class="p">,</span> <span class="n">snipe_db_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;~/.snipe/dbs/&#39;</span><span class="p">,</span> <span class="n">ref_id</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">amplicon_id</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+</span><span id="__span-0-1552"><a id="__codelineno-0-1552" name="__codelineno-0-1552"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1553"><a id="__codelineno-0-1553" name="__codelineno-0-1553"></a><span class="sd">    Initialize the PreparedQC instance.</span>
+</span><span id="__span-0-1554"><a id="__codelineno-0-1554" name="__codelineno-0-1554"></a>
+</span><span id="__span-0-1555"><a id="__codelineno-0-1555" name="__codelineno-0-1555"></a><span class="sd">    **Parameters**</span>
+</span><span id="__span-0-1556"><a id="__codelineno-0-1556" name="__codelineno-0-1556"></a>
+</span><span id="__span-0-1557"><a id="__codelineno-0-1557" name="__codelineno-0-1557"></a><span class="sd">    - `sample_sig` (`SnipeSig`): The sample k-mer signature.</span>
+</span><span id="__span-0-1558"><a id="__codelineno-0-1558" name="__codelineno-0-1558"></a><span class="sd">    - `snipe_db_path` (`str`): Path to the local Snipe database directory.</span>
+</span><span id="__span-0-1559"><a id="__codelineno-0-1559" name="__codelineno-0-1559"></a><span class="sd">    - `ref_id` (`Optional[str]`): Reference identifier for selecting specific profiles.</span>
+</span><span id="__span-0-1560"><a id="__codelineno-0-1560" name="__codelineno-0-1560"></a><span class="sd">    - `enable_logging` (`bool`): Flag to enable detailed logging.</span>
+</span><span id="__span-0-1561"><a id="__codelineno-0-1561" name="__codelineno-0-1561"></a><span class="sd">    - `**kwargs`: Additional keyword arguments.</span>
+</span><span id="__span-0-1562"><a id="__codelineno-0-1562" name="__codelineno-0-1562"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1563"><a id="__codelineno-0-1563" name="__codelineno-0-1563"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">snipe_db_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">expanduser</span><span class="p">(</span><span class="n">snipe_db_path</span><span class="p">)</span>
+</span><span id="__span-0-1564"><a id="__codelineno-0-1564" name="__codelineno-0-1564"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">ref_id</span> <span class="o">=</span> <span class="n">ref_id</span>
+</span><span id="__span-0-1565"><a id="__codelineno-0-1565" name="__codelineno-0-1565"></a>
+</span><span id="__span-0-1566"><a id="__codelineno-0-1566" name="__codelineno-0-1566"></a>    <span class="c1"># Ensure the local database directory exists</span>
+</span><span id="__span-0-1567"><a id="__codelineno-0-1567" name="__codelineno-0-1567"></a>    <span class="n">os</span><span class="o">.</span><span class="n">makedirs</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">snipe_db_path</span><span class="p">,</span> <span class="n">exist_ok</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-1568"><a id="__codelineno-0-1568" name="__codelineno-0-1568"></a>    <span class="k">if</span> <span class="n">enable_logging</span><span class="p">:</span>
+</span><span id="__span-0-1569"><a id="__codelineno-0-1569" name="__codelineno-0-1569"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Local Snipe DB path set to: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">snipe_db_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1570"><a id="__codelineno-0-1570" name="__codelineno-0-1570"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1571"><a id="__codelineno-0-1571" name="__codelineno-0-1571"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Logging is disabled for PreparedQC.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1572"><a id="__codelineno-0-1572" name="__codelineno-0-1572"></a>
+</span><span id="__span-0-1573"><a id="__codelineno-0-1573" name="__codelineno-0-1573"></a>    <span class="c1"># Initialize without a reference signature for now; it can be set after downloading</span>
+</span><span id="__span-0-1574"><a id="__codelineno-0-1574" name="__codelineno-0-1574"></a>    <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="__span-0-1575"><a id="__codelineno-0-1575" name="__codelineno-0-1575"></a>        <span class="n">sample_sig</span><span class="o">=</span><span class="n">sample_sig</span><span class="p">,</span>
+</span><span id="__span-0-1576"><a id="__codelineno-0-1576" name="__codelineno-0-1576"></a>        <span class="n">reference_sig</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>  <span class="c1"># To be set after downloading</span>
+</span><span id="__span-0-1577"><a id="__codelineno-0-1577" name="__codelineno-0-1577"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">,</span>
+</span><span id="__span-0-1578"><a id="__codelineno-0-1578" name="__codelineno-0-1578"></a>        <span class="o">**</span><span class="n">kwargs</span>
+</span><span id="__span-0-1579"><a id="__codelineno-0-1579" name="__codelineno-0-1579"></a>    <span class="p">)</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.reference_QC.PreparedQC.download_osf_db" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">download_osf_db</span><span class="p">(</span><span class="n">url</span><span class="p">,</span> <span class="n">save_path</span><span class="o">=</span><span class="s1">&#39;~/.snipe/dbs&#39;</span><span class="p">,</span> <span class="n">force</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span></code>
+
+<a href="#snipe.api.reference_QC.PreparedQC.download_osf_db" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Download a file from OSF using the provided URL. The file is saved with its original name 
+as specified by the OSF server via the Content-Disposition header.</p>
+<p><strong>Parameters</strong></p>
+<ul>
+<li><code>url</code> (<code>str</code>): The OSF URL to download the file from.</li>
+<li><code>save_path</code> (<code>str</code>): The directory path where the file will be saved. Supports user (~) and environment variables.
+                       Default is the local Snipe database directory.</li>
+<li><code>force</code> (<code>bool</code>): If True, overwrite the file if it already exists. Default is False.</li>
+</ul>
+<p><strong>Returns</strong></p>
+<ul>
+<li><code>Optional[str]</code>: The path to the downloaded file if successful, else None.</li>
+</ul>
+<p><strong>Raises</strong></p>
+<ul>
+<li><code>requests.exceptions.RequestException</code>: If an error occurs during the HTTP request.</li>
+<li><code>Exception</code>: For any other exceptions that may arise.</li>
+</ul>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1581">1581</a></span>
+<span class="normal"><a href="#__codelineno-0-1582">1582</a></span>
+<span class="normal"><a href="#__codelineno-0-1583">1583</a></span>
+<span class="normal"><a href="#__codelineno-0-1584">1584</a></span>
+<span class="normal"><a href="#__codelineno-0-1585">1585</a></span>
+<span class="normal"><a href="#__codelineno-0-1586">1586</a></span>
+<span class="normal"><a href="#__codelineno-0-1587">1587</a></span>
+<span class="normal"><a href="#__codelineno-0-1588">1588</a></span>
+<span class="normal"><a href="#__codelineno-0-1589">1589</a></span>
+<span class="normal"><a href="#__codelineno-0-1590">1590</a></span>
+<span class="normal"><a href="#__codelineno-0-1591">1591</a></span>
+<span class="normal"><a href="#__codelineno-0-1592">1592</a></span>
+<span class="normal"><a href="#__codelineno-0-1593">1593</a></span>
+<span class="normal"><a href="#__codelineno-0-1594">1594</a></span>
+<span class="normal"><a href="#__codelineno-0-1595">1595</a></span>
+<span class="normal"><a href="#__codelineno-0-1596">1596</a></span>
+<span class="normal"><a href="#__codelineno-0-1597">1597</a></span>
+<span class="normal"><a href="#__codelineno-0-1598">1598</a></span>
+<span class="normal"><a href="#__codelineno-0-1599">1599</a></span>
+<span class="normal"><a href="#__codelineno-0-1600">1600</a></span>
+<span class="normal"><a href="#__codelineno-0-1601">1601</a></span>
+<span class="normal"><a href="#__codelineno-0-1602">1602</a></span>
+<span class="normal"><a href="#__codelineno-0-1603">1603</a></span>
+<span class="normal"><a href="#__codelineno-0-1604">1604</a></span>
+<span class="normal"><a href="#__codelineno-0-1605">1605</a></span>
+<span class="normal"><a href="#__codelineno-0-1606">1606</a></span>
+<span class="normal"><a href="#__codelineno-0-1607">1607</a></span>
+<span class="normal"><a href="#__codelineno-0-1608">1608</a></span>
+<span class="normal"><a href="#__codelineno-0-1609">1609</a></span>
+<span class="normal"><a href="#__codelineno-0-1610">1610</a></span>
+<span class="normal"><a href="#__codelineno-0-1611">1611</a></span>
+<span class="normal"><a href="#__codelineno-0-1612">1612</a></span>
+<span class="normal"><a href="#__codelineno-0-1613">1613</a></span>
+<span class="normal"><a href="#__codelineno-0-1614">1614</a></span>
+<span class="normal"><a href="#__codelineno-0-1615">1615</a></span>
+<span class="normal"><a href="#__codelineno-0-1616">1616</a></span>
+<span class="normal"><a href="#__codelineno-0-1617">1617</a></span>
+<span class="normal"><a href="#__codelineno-0-1618">1618</a></span>
+<span class="normal"><a href="#__codelineno-0-1619">1619</a></span>
+<span class="normal"><a href="#__codelineno-0-1620">1620</a></span>
+<span class="normal"><a href="#__codelineno-0-1621">1621</a></span>
+<span class="normal"><a href="#__codelineno-0-1622">1622</a></span>
+<span class="normal"><a href="#__codelineno-0-1623">1623</a></span>
+<span class="normal"><a href="#__codelineno-0-1624">1624</a></span>
+<span class="normal"><a href="#__codelineno-0-1625">1625</a></span>
+<span class="normal"><a href="#__codelineno-0-1626">1626</a></span>
+<span class="normal"><a href="#__codelineno-0-1627">1627</a></span>
+<span class="normal"><a href="#__codelineno-0-1628">1628</a></span>
+<span class="normal"><a href="#__codelineno-0-1629">1629</a></span>
+<span class="normal"><a href="#__codelineno-0-1630">1630</a></span>
+<span class="normal"><a href="#__codelineno-0-1631">1631</a></span>
+<span class="normal"><a href="#__codelineno-0-1632">1632</a></span>
+<span class="normal"><a href="#__codelineno-0-1633">1633</a></span>
+<span class="normal"><a href="#__codelineno-0-1634">1634</a></span>
+<span class="normal"><a href="#__codelineno-0-1635">1635</a></span>
+<span class="normal"><a href="#__codelineno-0-1636">1636</a></span>
+<span class="normal"><a href="#__codelineno-0-1637">1637</a></span>
+<span class="normal"><a href="#__codelineno-0-1638">1638</a></span>
+<span class="normal"><a href="#__codelineno-0-1639">1639</a></span>
+<span class="normal"><a href="#__codelineno-0-1640">1640</a></span>
+<span class="normal"><a href="#__codelineno-0-1641">1641</a></span>
+<span class="normal"><a href="#__codelineno-0-1642">1642</a></span>
+<span class="normal"><a href="#__codelineno-0-1643">1643</a></span>
+<span class="normal"><a href="#__codelineno-0-1644">1644</a></span>
+<span class="normal"><a href="#__codelineno-0-1645">1645</a></span>
+<span class="normal"><a href="#__codelineno-0-1646">1646</a></span>
+<span class="normal"><a href="#__codelineno-0-1647">1647</a></span>
+<span class="normal"><a href="#__codelineno-0-1648">1648</a></span>
+<span class="normal"><a href="#__codelineno-0-1649">1649</a></span>
+<span class="normal"><a href="#__codelineno-0-1650">1650</a></span>
+<span class="normal"><a href="#__codelineno-0-1651">1651</a></span>
+<span class="normal"><a href="#__codelineno-0-1652">1652</a></span>
+<span class="normal"><a href="#__codelineno-0-1653">1653</a></span>
+<span class="normal"><a href="#__codelineno-0-1654">1654</a></span>
+<span class="normal"><a href="#__codelineno-0-1655">1655</a></span>
+<span class="normal"><a href="#__codelineno-0-1656">1656</a></span>
+<span class="normal"><a href="#__codelineno-0-1657">1657</a></span>
+<span class="normal"><a href="#__codelineno-0-1658">1658</a></span>
+<span class="normal"><a href="#__codelineno-0-1659">1659</a></span>
+<span class="normal"><a href="#__codelineno-0-1660">1660</a></span>
+<span class="normal"><a href="#__codelineno-0-1661">1661</a></span>
+<span class="normal"><a href="#__codelineno-0-1662">1662</a></span>
+<span class="normal"><a href="#__codelineno-0-1663">1663</a></span>
+<span class="normal"><a href="#__codelineno-0-1664">1664</a></span>
+<span class="normal"><a href="#__codelineno-0-1665">1665</a></span>
+<span class="normal"><a href="#__codelineno-0-1666">1666</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1581"><a id="__codelineno-0-1581" name="__codelineno-0-1581"></a><span class="k">def</span> <span class="nf">download_osf_db</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">url</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">save_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s1">&#39;~/.snipe/dbs&#39;</span><span class="p">,</span> <span class="n">force</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-1582"><a id="__codelineno-0-1582" name="__codelineno-0-1582"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1583"><a id="__codelineno-0-1583" name="__codelineno-0-1583"></a><span class="sd">    Download a file from OSF using the provided URL. The file is saved with its original name </span>
+</span><span id="__span-0-1584"><a id="__codelineno-0-1584" name="__codelineno-0-1584"></a><span class="sd">    as specified by the OSF server via the Content-Disposition header.</span>
+</span><span id="__span-0-1585"><a id="__codelineno-0-1585" name="__codelineno-0-1585"></a>
+</span><span id="__span-0-1586"><a id="__codelineno-0-1586" name="__codelineno-0-1586"></a><span class="sd">    **Parameters**</span>
+</span><span id="__span-0-1587"><a id="__codelineno-0-1587" name="__codelineno-0-1587"></a>
+</span><span id="__span-0-1588"><a id="__codelineno-0-1588" name="__codelineno-0-1588"></a><span class="sd">    - `url` (`str`): The OSF URL to download the file from.</span>
+</span><span id="__span-0-1589"><a id="__codelineno-0-1589" name="__codelineno-0-1589"></a><span class="sd">    - `save_path` (`str`): The directory path where the file will be saved. Supports user (~) and environment variables.</span>
+</span><span id="__span-0-1590"><a id="__codelineno-0-1590" name="__codelineno-0-1590"></a><span class="sd">                           Default is the local Snipe database directory.</span>
+</span><span id="__span-0-1591"><a id="__codelineno-0-1591" name="__codelineno-0-1591"></a><span class="sd">    - `force` (`bool`): If True, overwrite the file if it already exists. Default is False.</span>
+</span><span id="__span-0-1592"><a id="__codelineno-0-1592" name="__codelineno-0-1592"></a>
+</span><span id="__span-0-1593"><a id="__codelineno-0-1593" name="__codelineno-0-1593"></a><span class="sd">    **Returns**</span>
+</span><span id="__span-0-1594"><a id="__codelineno-0-1594" name="__codelineno-0-1594"></a>
+</span><span id="__span-0-1595"><a id="__codelineno-0-1595" name="__codelineno-0-1595"></a><span class="sd">    - `Optional[str]`: The path to the downloaded file if successful, else None.</span>
+</span><span id="__span-0-1596"><a id="__codelineno-0-1596" name="__codelineno-0-1596"></a>
+</span><span id="__span-0-1597"><a id="__codelineno-0-1597" name="__codelineno-0-1597"></a><span class="sd">    **Raises**</span>
+</span><span id="__span-0-1598"><a id="__codelineno-0-1598" name="__codelineno-0-1598"></a>
+</span><span id="__span-0-1599"><a id="__codelineno-0-1599" name="__codelineno-0-1599"></a><span class="sd">    - `requests.exceptions.RequestException`: If an error occurs during the HTTP request.</span>
+</span><span id="__span-0-1600"><a id="__codelineno-0-1600" name="__codelineno-0-1600"></a><span class="sd">    - `Exception`: For any other exceptions that may arise.</span>
+</span><span id="__span-0-1601"><a id="__codelineno-0-1601" name="__codelineno-0-1601"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1602"><a id="__codelineno-0-1602" name="__codelineno-0-1602"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-1603"><a id="__codelineno-0-1603" name="__codelineno-0-1603"></a>        <span class="c1"># Expand user (~) and environment variables in save_path</span>
+</span><span id="__span-0-1604"><a id="__codelineno-0-1604" name="__codelineno-0-1604"></a>        <span class="n">expanded_save_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">expanduser</span><span class="p">(</span><span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">expandvars</span><span class="p">(</span><span class="n">save_path</span><span class="p">))</span>
+</span><span id="__span-0-1605"><a id="__codelineno-0-1605" name="__codelineno-0-1605"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Expanded save path: </span><span class="si">{</span><span class="n">expanded_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1606"><a id="__codelineno-0-1606" name="__codelineno-0-1606"></a>
+</span><span id="__span-0-1607"><a id="__codelineno-0-1607" name="__codelineno-0-1607"></a>        <span class="c1"># Ensure the download URL ends with &#39;/download&#39;</span>
+</span><span id="__span-0-1608"><a id="__codelineno-0-1608" name="__codelineno-0-1608"></a>        <span class="n">parsed_url</span> <span class="o">=</span> <span class="n">urlparse</span><span class="p">(</span><span class="n">url</span><span class="p">)</span>
+</span><span id="__span-0-1609"><a id="__codelineno-0-1609" name="__codelineno-0-1609"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">parsed_url</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s1">&#39;/download&#39;</span><span class="p">):</span>
+</span><span id="__span-0-1610"><a id="__codelineno-0-1610" name="__codelineno-0-1610"></a>            <span class="n">download_url</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">url</span><span class="o">.</span><span class="n">rstrip</span><span class="p">(</span><span class="s1">&#39;/&#39;</span><span class="p">)</span><span class="si">}</span><span class="s2">/download&quot;</span>
+</span><span id="__span-0-1611"><a id="__codelineno-0-1611" name="__codelineno-0-1611"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1612"><a id="__codelineno-0-1612" name="__codelineno-0-1612"></a>            <span class="n">download_url</span> <span class="o">=</span> <span class="n">url</span>
+</span><span id="__span-0-1613"><a id="__codelineno-0-1613" name="__codelineno-0-1613"></a>
+</span><span id="__span-0-1614"><a id="__codelineno-0-1614" name="__codelineno-0-1614"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Download URL: </span><span class="si">{</span><span class="n">download_url</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1615"><a id="__codelineno-0-1615" name="__codelineno-0-1615"></a>
+</span><span id="__span-0-1616"><a id="__codelineno-0-1616" name="__codelineno-0-1616"></a>        <span class="c1"># Ensure the save directory exists</span>
+</span><span id="__span-0-1617"><a id="__codelineno-0-1617" name="__codelineno-0-1617"></a>        <span class="n">os</span><span class="o">.</span><span class="n">makedirs</span><span class="p">(</span><span class="n">expanded_save_path</span><span class="p">,</span> <span class="n">exist_ok</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-1618"><a id="__codelineno-0-1618" name="__codelineno-0-1618"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Save path verified/created: </span><span class="si">{</span><span class="n">expanded_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1619"><a id="__codelineno-0-1619" name="__codelineno-0-1619"></a>
+</span><span id="__span-0-1620"><a id="__codelineno-0-1620" name="__codelineno-0-1620"></a>        <span class="c1"># Initiate the GET request with streaming</span>
+</span><span id="__span-0-1621"><a id="__codelineno-0-1621" name="__codelineno-0-1621"></a>        <span class="k">with</span> <span class="n">requests</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">download_url</span><span class="p">,</span> <span class="n">stream</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">allow_redirects</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span> <span class="k">as</span> <span class="n">response</span><span class="p">:</span>
+</span><span id="__span-0-1622"><a id="__codelineno-0-1622" name="__codelineno-0-1622"></a>            <span class="n">response</span><span class="o">.</span><span class="n">raise_for_status</span><span class="p">()</span>  <span class="c1"># Raise an exception for HTTP errors</span>
+</span><span id="__span-0-1623"><a id="__codelineno-0-1623" name="__codelineno-0-1623"></a>
+</span><span id="__span-0-1624"><a id="__codelineno-0-1624" name="__codelineno-0-1624"></a>            <span class="c1"># Attempt to extract filename from Content-Disposition</span>
+</span><span id="__span-0-1625"><a id="__codelineno-0-1625" name="__codelineno-0-1625"></a>            <span class="n">content_disposition</span> <span class="o">=</span> <span class="n">response</span><span class="o">.</span><span class="n">headers</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;Content-Disposition&#39;</span><span class="p">)</span>
+</span><span id="__span-0-1626"><a id="__codelineno-0-1626" name="__codelineno-0-1626"></a>            <span class="n">filename</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_extract_filename</span><span class="p">(</span><span class="n">content_disposition</span><span class="p">,</span> <span class="n">parsed_url</span><span class="o">.</span><span class="n">path</span><span class="p">)</span>
+</span><span id="__span-0-1627"><a id="__codelineno-0-1627" name="__codelineno-0-1627"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Filename determined: </span><span class="si">{</span><span class="n">filename</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1628"><a id="__codelineno-0-1628" name="__codelineno-0-1628"></a>
+</span><span id="__span-0-1629"><a id="__codelineno-0-1629" name="__codelineno-0-1629"></a>            <span class="c1"># Define the full save path</span>
+</span><span id="__span-0-1630"><a id="__codelineno-0-1630" name="__codelineno-0-1630"></a>            <span class="n">full_save_path</span> <span class="o">=</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">expanded_save_path</span><span class="p">,</span> <span class="n">filename</span><span class="p">)</span>
+</span><span id="__span-0-1631"><a id="__codelineno-0-1631" name="__codelineno-0-1631"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Full save path: </span><span class="si">{</span><span class="n">full_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1632"><a id="__codelineno-0-1632" name="__codelineno-0-1632"></a>
+</span><span id="__span-0-1633"><a id="__codelineno-0-1633" name="__codelineno-0-1633"></a>            <span class="c1"># Check if the file already exists</span>
+</span><span id="__span-0-1634"><a id="__codelineno-0-1634" name="__codelineno-0-1634"></a>            <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">full_save_path</span><span class="p">):</span>
+</span><span id="__span-0-1635"><a id="__codelineno-0-1635" name="__codelineno-0-1635"></a>                <span class="k">if</span> <span class="n">force</span><span class="p">:</span>
+</span><span id="__span-0-1636"><a id="__codelineno-0-1636" name="__codelineno-0-1636"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Overwriting existing file: </span><span class="si">{</span><span class="n">full_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1637"><a id="__codelineno-0-1637" name="__codelineno-0-1637"></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1638"><a id="__codelineno-0-1638" name="__codelineno-0-1638"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;File already exists: </span><span class="si">{</span><span class="n">full_save_path</span><span class="si">}</span><span class="s2">. Skipping download.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1639"><a id="__codelineno-0-1639" name="__codelineno-0-1639"></a>                    <span class="k">return</span> <span class="n">full_save_path</span>
+</span><span id="__span-0-1640"><a id="__codelineno-0-1640" name="__codelineno-0-1640"></a>
+</span><span id="__span-0-1641"><a id="__codelineno-0-1641" name="__codelineno-0-1641"></a>            <span class="c1"># Get the total file size for the progress bar</span>
+</span><span id="__span-0-1642"><a id="__codelineno-0-1642" name="__codelineno-0-1642"></a>            <span class="n">total_size</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">response</span><span class="o">.</span><span class="n">headers</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s1">&#39;Content-Length&#39;</span><span class="p">,</span> <span class="mi">0</span><span class="p">))</span>
+</span><span id="__span-0-1643"><a id="__codelineno-0-1643" name="__codelineno-0-1643"></a>
+</span><span id="__span-0-1644"><a id="__codelineno-0-1644" name="__codelineno-0-1644"></a>            <span class="c1"># Initialize the progress bar</span>
+</span><span id="__span-0-1645"><a id="__codelineno-0-1645" name="__codelineno-0-1645"></a>            <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="n">full_save_path</span><span class="p">,</span> <span class="s1">&#39;wb&#39;</span><span class="p">)</span> <span class="k">as</span> <span class="n">file</span><span class="p">,</span> <span class="n">tqdm</span><span class="p">(</span>
+</span><span id="__span-0-1646"><a id="__codelineno-0-1646" name="__codelineno-0-1646"></a>                <span class="n">total</span><span class="o">=</span><span class="n">total_size</span><span class="p">,</span> 
+</span><span id="__span-0-1647"><a id="__codelineno-0-1647" name="__codelineno-0-1647"></a>                <span class="n">unit</span><span class="o">=</span><span class="s1">&#39;B&#39;</span><span class="p">,</span> 
+</span><span id="__span-0-1648"><a id="__codelineno-0-1648" name="__codelineno-0-1648"></a>                <span class="n">unit_scale</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> 
+</span><span id="__span-0-1649"><a id="__codelineno-0-1649" name="__codelineno-0-1649"></a>                <span class="n">unit_divisor</span><span class="o">=</span><span class="mi">1024</span><span class="p">,</span>
+</span><span id="__span-0-1650"><a id="__codelineno-0-1650" name="__codelineno-0-1650"></a>                <span class="n">desc</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-1651"><a id="__codelineno-0-1651" name="__codelineno-0-1651"></a>                <span class="n">ncols</span><span class="o">=</span><span class="mi">100</span>
+</span><span id="__span-0-1652"><a id="__codelineno-0-1652" name="__codelineno-0-1652"></a>            <span class="p">)</span> <span class="k">as</span> <span class="n">bar</span><span class="p">:</span>
+</span><span id="__span-0-1653"><a id="__codelineno-0-1653" name="__codelineno-0-1653"></a>                <span class="k">for</span> <span class="n">chunk</span> <span class="ow">in</span> <span class="n">response</span><span class="o">.</span><span class="n">iter_content</span><span class="p">(</span><span class="n">chunk_size</span><span class="o">=</span><span class="mi">1024</span><span class="p">):</span>
+</span><span id="__span-0-1654"><a id="__codelineno-0-1654" name="__codelineno-0-1654"></a>                    <span class="k">if</span> <span class="n">chunk</span><span class="p">:</span>  <span class="c1"># Filter out keep-alive chunks</span>
+</span><span id="__span-0-1655"><a id="__codelineno-0-1655" name="__codelineno-0-1655"></a>                        <span class="n">file</span><span class="o">.</span><span class="n">write</span><span class="p">(</span><span class="n">chunk</span><span class="p">)</span>
+</span><span id="__span-0-1656"><a id="__codelineno-0-1656" name="__codelineno-0-1656"></a>                        <span class="n">bar</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">chunk</span><span class="p">))</span>
+</span><span id="__span-0-1657"><a id="__codelineno-0-1657" name="__codelineno-0-1657"></a>
+</span><span id="__span-0-1658"><a id="__codelineno-0-1658" name="__codelineno-0-1658"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;File downloaded successfully: </span><span class="si">{</span><span class="n">full_save_path</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1659"><a id="__codelineno-0-1659" name="__codelineno-0-1659"></a>            <span class="k">return</span> <span class="n">full_save_path</span>
+</span><span id="__span-0-1660"><a id="__codelineno-0-1660" name="__codelineno-0-1660"></a>
+</span><span id="__span-0-1661"><a id="__codelineno-0-1661" name="__codelineno-0-1661"></a>    <span class="k">except</span> <span class="n">requests</span><span class="o">.</span><span class="n">exceptions</span><span class="o">.</span><span class="n">RequestException</span> <span class="k">as</span> <span class="n">req_err</span><span class="p">:</span>
+</span><span id="__span-0-1662"><a id="__codelineno-0-1662" name="__codelineno-0-1662"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Request error occurred while downloading </span><span class="si">{</span><span class="n">url</span><span class="si">}</span><span class="s2">: </span><span class="si">{</span><span class="n">req_err</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1663"><a id="__codelineno-0-1663" name="__codelineno-0-1663"></a>        <span class="k">raise</span>
+</span><span id="__span-0-1664"><a id="__codelineno-0-1664" name="__codelineno-0-1664"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-1665"><a id="__codelineno-0-1665" name="__codelineno-0-1665"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;An unexpected error occurred while downloading </span><span class="si">{</span><span class="n">url</span><span class="si">}</span><span class="s2">: </span><span class="si">{</span><span class="n">e</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1666"><a id="__codelineno-0-1666" name="__codelineno-0-1666"></a>        <span class="k">raise</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+
+
+  </div>
+
+    </div>
+
+</div>
+
 <div class="doc doc-object doc-class">
 
 
@@ -1043,16 +1836,7 @@ <h2 id="snipe.api.reference_QC.ReferenceQC" class="doc doc-heading">
 
               <details class="quote">
                 <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
-                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-12">  12</a></span>
-<span class="normal"><a href="#__codelineno-0-13">  13</a></span>
-<span class="normal"><a href="#__codelineno-0-14">  14</a></span>
-<span class="normal"><a href="#__codelineno-0-15">  15</a></span>
-<span class="normal"><a href="#__codelineno-0-16">  16</a></span>
-<span class="normal"><a href="#__codelineno-0-17">  17</a></span>
-<span class="normal"><a href="#__codelineno-0-18">  18</a></span>
-<span class="normal"><a href="#__codelineno-0-19">  19</a></span>
-<span class="normal"><a href="#__codelineno-0-20">  20</a></span>
-<span class="normal"><a href="#__codelineno-0-21">  21</a></span>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-21">  21</a></span>
 <span class="normal"><a href="#__codelineno-0-22">  22</a></span>
 <span class="normal"><a href="#__codelineno-0-23">  23</a></span>
 <span class="normal"><a href="#__codelineno-0-24">  24</a></span>
@@ -2301,1265 +3085,1802 @@ <h2 id="snipe.api.reference_QC.ReferenceQC" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1267">1267</a></span>
 <span class="normal"><a href="#__codelineno-0-1268">1268</a></span>
 <span class="normal"><a href="#__codelineno-0-1269">1269</a></span>
-<span class="normal"><a href="#__codelineno-0-1270">1270</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-12"><a id="__codelineno-0-12" name="__codelineno-0-12"></a><span class="k">class</span> <span class="nc">ReferenceQC</span><span class="p">:</span>
-</span><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a><span class="sd">    Class for performing quality control of sequencing data against a reference genome.</span>
-</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a>
-</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a><span class="sd">    This class computes various metrics to assess the quality and characteristics of a sequencing sample, including coverage indices and abundance ratios, by comparing sample k-mer signatures with a reference genome and an optional amplicon signature.</span>
-</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a>
-</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a><span class="sd">    **Parameters**</span>
-</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a>
-</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a><span class="sd">    - `sample_sig` (`SnipeSig`): The sample k-mer signature (must be of type `SigType.SAMPLE`).</span>
-</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a><span class="sd">    - `reference_sig` (`SnipeSig`): The reference genome k-mer signature (must be of type `SigType.GENOME`).</span>
-</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="sd">    - `amplicon_sig` (`Optional[SnipeSig]`): The amplicon k-mer signature (must be of type `SigType.AMPLICON`), if applicable.</span>
-</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a><span class="sd">    - `enable_logging` (`bool`): Flag to enable detailed logging.</span>
+<span class="normal"><a href="#__codelineno-0-1270">1270</a></span>
+<span class="normal"><a href="#__codelineno-0-1271">1271</a></span>
+<span class="normal"><a href="#__codelineno-0-1272">1272</a></span>
+<span class="normal"><a href="#__codelineno-0-1273">1273</a></span>
+<span class="normal"><a href="#__codelineno-0-1274">1274</a></span>
+<span class="normal"><a href="#__codelineno-0-1275">1275</a></span>
+<span class="normal"><a href="#__codelineno-0-1276">1276</a></span>
+<span class="normal"><a href="#__codelineno-0-1277">1277</a></span>
+<span class="normal"><a href="#__codelineno-0-1278">1278</a></span>
+<span class="normal"><a href="#__codelineno-0-1279">1279</a></span>
+<span class="normal"><a href="#__codelineno-0-1280">1280</a></span>
+<span class="normal"><a href="#__codelineno-0-1281">1281</a></span>
+<span class="normal"><a href="#__codelineno-0-1282">1282</a></span>
+<span class="normal"><a href="#__codelineno-0-1283">1283</a></span>
+<span class="normal"><a href="#__codelineno-0-1284">1284</a></span>
+<span class="normal"><a href="#__codelineno-0-1285">1285</a></span>
+<span class="normal"><a href="#__codelineno-0-1286">1286</a></span>
+<span class="normal"><a href="#__codelineno-0-1287">1287</a></span>
+<span class="normal"><a href="#__codelineno-0-1288">1288</a></span>
+<span class="normal"><a href="#__codelineno-0-1289">1289</a></span>
+<span class="normal"><a href="#__codelineno-0-1290">1290</a></span>
+<span class="normal"><a href="#__codelineno-0-1291">1291</a></span>
+<span class="normal"><a href="#__codelineno-0-1292">1292</a></span>
+<span class="normal"><a href="#__codelineno-0-1293">1293</a></span>
+<span class="normal"><a href="#__codelineno-0-1294">1294</a></span>
+<span class="normal"><a href="#__codelineno-0-1295">1295</a></span>
+<span class="normal"><a href="#__codelineno-0-1296">1296</a></span>
+<span class="normal"><a href="#__codelineno-0-1297">1297</a></span>
+<span class="normal"><a href="#__codelineno-0-1298">1298</a></span>
+<span class="normal"><a href="#__codelineno-0-1299">1299</a></span>
+<span class="normal"><a href="#__codelineno-0-1300">1300</a></span>
+<span class="normal"><a href="#__codelineno-0-1301">1301</a></span>
+<span class="normal"><a href="#__codelineno-0-1302">1302</a></span>
+<span class="normal"><a href="#__codelineno-0-1303">1303</a></span>
+<span class="normal"><a href="#__codelineno-0-1304">1304</a></span>
+<span class="normal"><a href="#__codelineno-0-1305">1305</a></span>
+<span class="normal"><a href="#__codelineno-0-1306">1306</a></span>
+<span class="normal"><a href="#__codelineno-0-1307">1307</a></span>
+<span class="normal"><a href="#__codelineno-0-1308">1308</a></span>
+<span class="normal"><a href="#__codelineno-0-1309">1309</a></span>
+<span class="normal"><a href="#__codelineno-0-1310">1310</a></span>
+<span class="normal"><a href="#__codelineno-0-1311">1311</a></span>
+<span class="normal"><a href="#__codelineno-0-1312">1312</a></span>
+<span class="normal"><a href="#__codelineno-0-1313">1313</a></span>
+<span class="normal"><a href="#__codelineno-0-1314">1314</a></span>
+<span class="normal"><a href="#__codelineno-0-1315">1315</a></span>
+<span class="normal"><a href="#__codelineno-0-1316">1316</a></span>
+<span class="normal"><a href="#__codelineno-0-1317">1317</a></span>
+<span class="normal"><a href="#__codelineno-0-1318">1318</a></span>
+<span class="normal"><a href="#__codelineno-0-1319">1319</a></span>
+<span class="normal"><a href="#__codelineno-0-1320">1320</a></span>
+<span class="normal"><a href="#__codelineno-0-1321">1321</a></span>
+<span class="normal"><a href="#__codelineno-0-1322">1322</a></span>
+<span class="normal"><a href="#__codelineno-0-1323">1323</a></span>
+<span class="normal"><a href="#__codelineno-0-1324">1324</a></span>
+<span class="normal"><a href="#__codelineno-0-1325">1325</a></span>
+<span class="normal"><a href="#__codelineno-0-1326">1326</a></span>
+<span class="normal"><a href="#__codelineno-0-1327">1327</a></span>
+<span class="normal"><a href="#__codelineno-0-1328">1328</a></span>
+<span class="normal"><a href="#__codelineno-0-1329">1329</a></span>
+<span class="normal"><a href="#__codelineno-0-1330">1330</a></span>
+<span class="normal"><a href="#__codelineno-0-1331">1331</a></span>
+<span class="normal"><a href="#__codelineno-0-1332">1332</a></span>
+<span class="normal"><a href="#__codelineno-0-1333">1333</a></span>
+<span class="normal"><a href="#__codelineno-0-1334">1334</a></span>
+<span class="normal"><a href="#__codelineno-0-1335">1335</a></span>
+<span class="normal"><a href="#__codelineno-0-1336">1336</a></span>
+<span class="normal"><a href="#__codelineno-0-1337">1337</a></span>
+<span class="normal"><a href="#__codelineno-0-1338">1338</a></span>
+<span class="normal"><a href="#__codelineno-0-1339">1339</a></span>
+<span class="normal"><a href="#__codelineno-0-1340">1340</a></span>
+<span class="normal"><a href="#__codelineno-0-1341">1341</a></span>
+<span class="normal"><a href="#__codelineno-0-1342">1342</a></span>
+<span class="normal"><a href="#__codelineno-0-1343">1343</a></span>
+<span class="normal"><a href="#__codelineno-0-1344">1344</a></span>
+<span class="normal"><a href="#__codelineno-0-1345">1345</a></span>
+<span class="normal"><a href="#__codelineno-0-1346">1346</a></span>
+<span class="normal"><a href="#__codelineno-0-1347">1347</a></span>
+<span class="normal"><a href="#__codelineno-0-1348">1348</a></span>
+<span class="normal"><a href="#__codelineno-0-1349">1349</a></span>
+<span class="normal"><a href="#__codelineno-0-1350">1350</a></span>
+<span class="normal"><a href="#__codelineno-0-1351">1351</a></span>
+<span class="normal"><a href="#__codelineno-0-1352">1352</a></span>
+<span class="normal"><a href="#__codelineno-0-1353">1353</a></span>
+<span class="normal"><a href="#__codelineno-0-1354">1354</a></span>
+<span class="normal"><a href="#__codelineno-0-1355">1355</a></span>
+<span class="normal"><a href="#__codelineno-0-1356">1356</a></span>
+<span class="normal"><a href="#__codelineno-0-1357">1357</a></span>
+<span class="normal"><a href="#__codelineno-0-1358">1358</a></span>
+<span class="normal"><a href="#__codelineno-0-1359">1359</a></span>
+<span class="normal"><a href="#__codelineno-0-1360">1360</a></span>
+<span class="normal"><a href="#__codelineno-0-1361">1361</a></span>
+<span class="normal"><a href="#__codelineno-0-1362">1362</a></span>
+<span class="normal"><a href="#__codelineno-0-1363">1363</a></span>
+<span class="normal"><a href="#__codelineno-0-1364">1364</a></span>
+<span class="normal"><a href="#__codelineno-0-1365">1365</a></span>
+<span class="normal"><a href="#__codelineno-0-1366">1366</a></span>
+<span class="normal"><a href="#__codelineno-0-1367">1367</a></span>
+<span class="normal"><a href="#__codelineno-0-1368">1368</a></span>
+<span class="normal"><a href="#__codelineno-0-1369">1369</a></span>
+<span class="normal"><a href="#__codelineno-0-1370">1370</a></span>
+<span class="normal"><a href="#__codelineno-0-1371">1371</a></span>
+<span class="normal"><a href="#__codelineno-0-1372">1372</a></span>
+<span class="normal"><a href="#__codelineno-0-1373">1373</a></span>
+<span class="normal"><a href="#__codelineno-0-1374">1374</a></span>
+<span class="normal"><a href="#__codelineno-0-1375">1375</a></span>
+<span class="normal"><a href="#__codelineno-0-1376">1376</a></span>
+<span class="normal"><a href="#__codelineno-0-1377">1377</a></span>
+<span class="normal"><a href="#__codelineno-0-1378">1378</a></span>
+<span class="normal"><a href="#__codelineno-0-1379">1379</a></span>
+<span class="normal"><a href="#__codelineno-0-1380">1380</a></span>
+<span class="normal"><a href="#__codelineno-0-1381">1381</a></span>
+<span class="normal"><a href="#__codelineno-0-1382">1382</a></span>
+<span class="normal"><a href="#__codelineno-0-1383">1383</a></span>
+<span class="normal"><a href="#__codelineno-0-1384">1384</a></span>
+<span class="normal"><a href="#__codelineno-0-1385">1385</a></span>
+<span class="normal"><a href="#__codelineno-0-1386">1386</a></span>
+<span class="normal"><a href="#__codelineno-0-1387">1387</a></span>
+<span class="normal"><a href="#__codelineno-0-1388">1388</a></span>
+<span class="normal"><a href="#__codelineno-0-1389">1389</a></span>
+<span class="normal"><a href="#__codelineno-0-1390">1390</a></span>
+<span class="normal"><a href="#__codelineno-0-1391">1391</a></span>
+<span class="normal"><a href="#__codelineno-0-1392">1392</a></span>
+<span class="normal"><a href="#__codelineno-0-1393">1393</a></span>
+<span class="normal"><a href="#__codelineno-0-1394">1394</a></span>
+<span class="normal"><a href="#__codelineno-0-1395">1395</a></span>
+<span class="normal"><a href="#__codelineno-0-1396">1396</a></span>
+<span class="normal"><a href="#__codelineno-0-1397">1397</a></span>
+<span class="normal"><a href="#__codelineno-0-1398">1398</a></span>
+<span class="normal"><a href="#__codelineno-0-1399">1399</a></span>
+<span class="normal"><a href="#__codelineno-0-1400">1400</a></span>
+<span class="normal"><a href="#__codelineno-0-1401">1401</a></span>
+<span class="normal"><a href="#__codelineno-0-1402">1402</a></span>
+<span class="normal"><a href="#__codelineno-0-1403">1403</a></span>
+<span class="normal"><a href="#__codelineno-0-1404">1404</a></span>
+<span class="normal"><a href="#__codelineno-0-1405">1405</a></span>
+<span class="normal"><a href="#__codelineno-0-1406">1406</a></span>
+<span class="normal"><a href="#__codelineno-0-1407">1407</a></span>
+<span class="normal"><a href="#__codelineno-0-1408">1408</a></span>
+<span class="normal"><a href="#__codelineno-0-1409">1409</a></span>
+<span class="normal"><a href="#__codelineno-0-1410">1410</a></span>
+<span class="normal"><a href="#__codelineno-0-1411">1411</a></span>
+<span class="normal"><a href="#__codelineno-0-1412">1412</a></span>
+<span class="normal"><a href="#__codelineno-0-1413">1413</a></span>
+<span class="normal"><a href="#__codelineno-0-1414">1414</a></span>
+<span class="normal"><a href="#__codelineno-0-1415">1415</a></span>
+<span class="normal"><a href="#__codelineno-0-1416">1416</a></span>
+<span class="normal"><a href="#__codelineno-0-1417">1417</a></span>
+<span class="normal"><a href="#__codelineno-0-1418">1418</a></span>
+<span class="normal"><a href="#__codelineno-0-1419">1419</a></span>
+<span class="normal"><a href="#__codelineno-0-1420">1420</a></span>
+<span class="normal"><a href="#__codelineno-0-1421">1421</a></span>
+<span class="normal"><a href="#__codelineno-0-1422">1422</a></span>
+<span class="normal"><a href="#__codelineno-0-1423">1423</a></span>
+<span class="normal"><a href="#__codelineno-0-1424">1424</a></span>
+<span class="normal"><a href="#__codelineno-0-1425">1425</a></span>
+<span class="normal"><a href="#__codelineno-0-1426">1426</a></span>
+<span class="normal"><a href="#__codelineno-0-1427">1427</a></span>
+<span class="normal"><a href="#__codelineno-0-1428">1428</a></span>
+<span class="normal"><a href="#__codelineno-0-1429">1429</a></span>
+<span class="normal"><a href="#__codelineno-0-1430">1430</a></span>
+<span class="normal"><a href="#__codelineno-0-1431">1431</a></span>
+<span class="normal"><a href="#__codelineno-0-1432">1432</a></span>
+<span class="normal"><a href="#__codelineno-0-1433">1433</a></span>
+<span class="normal"><a href="#__codelineno-0-1434">1434</a></span>
+<span class="normal"><a href="#__codelineno-0-1435">1435</a></span>
+<span class="normal"><a href="#__codelineno-0-1436">1436</a></span>
+<span class="normal"><a href="#__codelineno-0-1437">1437</a></span>
+<span class="normal"><a href="#__codelineno-0-1438">1438</a></span>
+<span class="normal"><a href="#__codelineno-0-1439">1439</a></span>
+<span class="normal"><a href="#__codelineno-0-1440">1440</a></span>
+<span class="normal"><a href="#__codelineno-0-1441">1441</a></span>
+<span class="normal"><a href="#__codelineno-0-1442">1442</a></span>
+<span class="normal"><a href="#__codelineno-0-1443">1443</a></span>
+<span class="normal"><a href="#__codelineno-0-1444">1444</a></span>
+<span class="normal"><a href="#__codelineno-0-1445">1445</a></span>
+<span class="normal"><a href="#__codelineno-0-1446">1446</a></span>
+<span class="normal"><a href="#__codelineno-0-1447">1447</a></span>
+<span class="normal"><a href="#__codelineno-0-1448">1448</a></span>
+<span class="normal"><a href="#__codelineno-0-1449">1449</a></span>
+<span class="normal"><a href="#__codelineno-0-1450">1450</a></span>
+<span class="normal"><a href="#__codelineno-0-1451">1451</a></span>
+<span class="normal"><a href="#__codelineno-0-1452">1452</a></span>
+<span class="normal"><a href="#__codelineno-0-1453">1453</a></span>
+<span class="normal"><a href="#__codelineno-0-1454">1454</a></span>
+<span class="normal"><a href="#__codelineno-0-1455">1455</a></span>
+<span class="normal"><a href="#__codelineno-0-1456">1456</a></span>
+<span class="normal"><a href="#__codelineno-0-1457">1457</a></span>
+<span class="normal"><a href="#__codelineno-0-1458">1458</a></span>
+<span class="normal"><a href="#__codelineno-0-1459">1459</a></span>
+<span class="normal"><a href="#__codelineno-0-1460">1460</a></span>
+<span class="normal"><a href="#__codelineno-0-1461">1461</a></span>
+<span class="normal"><a href="#__codelineno-0-1462">1462</a></span>
+<span class="normal"><a href="#__codelineno-0-1463">1463</a></span>
+<span class="normal"><a href="#__codelineno-0-1464">1464</a></span>
+<span class="normal"><a href="#__codelineno-0-1465">1465</a></span>
+<span class="normal"><a href="#__codelineno-0-1466">1466</a></span>
+<span class="normal"><a href="#__codelineno-0-1467">1467</a></span>
+<span class="normal"><a href="#__codelineno-0-1468">1468</a></span>
+<span class="normal"><a href="#__codelineno-0-1469">1469</a></span>
+<span class="normal"><a href="#__codelineno-0-1470">1470</a></span>
+<span class="normal"><a href="#__codelineno-0-1471">1471</a></span>
+<span class="normal"><a href="#__codelineno-0-1472">1472</a></span>
+<span class="normal"><a href="#__codelineno-0-1473">1473</a></span>
+<span class="normal"><a href="#__codelineno-0-1474">1474</a></span>
+<span class="normal"><a href="#__codelineno-0-1475">1475</a></span>
+<span class="normal"><a href="#__codelineno-0-1476">1476</a></span>
+<span class="normal"><a href="#__codelineno-0-1477">1477</a></span>
+<span class="normal"><a href="#__codelineno-0-1478">1478</a></span>
+<span class="normal"><a href="#__codelineno-0-1479">1479</a></span>
+<span class="normal"><a href="#__codelineno-0-1480">1480</a></span>
+<span class="normal"><a href="#__codelineno-0-1481">1481</a></span>
+<span class="normal"><a href="#__codelineno-0-1482">1482</a></span>
+<span class="normal"><a href="#__codelineno-0-1483">1483</a></span>
+<span class="normal"><a href="#__codelineno-0-1484">1484</a></span>
+<span class="normal"><a href="#__codelineno-0-1485">1485</a></span>
+<span class="normal"><a href="#__codelineno-0-1486">1486</a></span>
+<span class="normal"><a href="#__codelineno-0-1487">1487</a></span>
+<span class="normal"><a href="#__codelineno-0-1488">1488</a></span>
+<span class="normal"><a href="#__codelineno-0-1489">1489</a></span>
+<span class="normal"><a href="#__codelineno-0-1490">1490</a></span>
+<span class="normal"><a href="#__codelineno-0-1491">1491</a></span>
+<span class="normal"><a href="#__codelineno-0-1492">1492</a></span>
+<span class="normal"><a href="#__codelineno-0-1493">1493</a></span>
+<span class="normal"><a href="#__codelineno-0-1494">1494</a></span>
+<span class="normal"><a href="#__codelineno-0-1495">1495</a></span>
+<span class="normal"><a href="#__codelineno-0-1496">1496</a></span>
+<span class="normal"><a href="#__codelineno-0-1497">1497</a></span>
+<span class="normal"><a href="#__codelineno-0-1498">1498</a></span>
+<span class="normal"><a href="#__codelineno-0-1499">1499</a></span>
+<span class="normal"><a href="#__codelineno-0-1500">1500</a></span>
+<span class="normal"><a href="#__codelineno-0-1501">1501</a></span>
+<span class="normal"><a href="#__codelineno-0-1502">1502</a></span>
+<span class="normal"><a href="#__codelineno-0-1503">1503</a></span>
+<span class="normal"><a href="#__codelineno-0-1504">1504</a></span>
+<span class="normal"><a href="#__codelineno-0-1505">1505</a></span>
+<span class="normal"><a href="#__codelineno-0-1506">1506</a></span>
+<span class="normal"><a href="#__codelineno-0-1507">1507</a></span>
+<span class="normal"><a href="#__codelineno-0-1508">1508</a></span>
+<span class="normal"><a href="#__codelineno-0-1509">1509</a></span>
+<span class="normal"><a href="#__codelineno-0-1510">1510</a></span>
+<span class="normal"><a href="#__codelineno-0-1511">1511</a></span>
+<span class="normal"><a href="#__codelineno-0-1512">1512</a></span>
+<span class="normal"><a href="#__codelineno-0-1513">1513</a></span>
+<span class="normal"><a href="#__codelineno-0-1514">1514</a></span>
+<span class="normal"><a href="#__codelineno-0-1515">1515</a></span>
+<span class="normal"><a href="#__codelineno-0-1516">1516</a></span>
+<span class="normal"><a href="#__codelineno-0-1517">1517</a></span>
+<span class="normal"><a href="#__codelineno-0-1518">1518</a></span>
+<span class="normal"><a href="#__codelineno-0-1519">1519</a></span>
+<span class="normal"><a href="#__codelineno-0-1520">1520</a></span>
+<span class="normal"><a href="#__codelineno-0-1521">1521</a></span>
+<span class="normal"><a href="#__codelineno-0-1522">1522</a></span>
+<span class="normal"><a href="#__codelineno-0-1523">1523</a></span>
+<span class="normal"><a href="#__codelineno-0-1524">1524</a></span>
+<span class="normal"><a href="#__codelineno-0-1525">1525</a></span>
+<span class="normal"><a href="#__codelineno-0-1526">1526</a></span>
+<span class="normal"><a href="#__codelineno-0-1527">1527</a></span>
+<span class="normal"><a href="#__codelineno-0-1528">1528</a></span>
+<span class="normal"><a href="#__codelineno-0-1529">1529</a></span>
+<span class="normal"><a href="#__codelineno-0-1530">1530</a></span>
+<span class="normal"><a href="#__codelineno-0-1531">1531</a></span>
+<span class="normal"><a href="#__codelineno-0-1532">1532</a></span>
+<span class="normal"><a href="#__codelineno-0-1533">1533</a></span>
+<span class="normal"><a href="#__codelineno-0-1534">1534</a></span>
+<span class="normal"><a href="#__codelineno-0-1535">1535</a></span>
+<span class="normal"><a href="#__codelineno-0-1536">1536</a></span>
+<span class="normal"><a href="#__codelineno-0-1537">1537</a></span>
+<span class="normal"><a href="#__codelineno-0-1538">1538</a></span>
+<span class="normal"><a href="#__codelineno-0-1539">1539</a></span>
+<span class="normal"><a href="#__codelineno-0-1540">1540</a></span>
+<span class="normal"><a href="#__codelineno-0-1541">1541</a></span>
+<span class="normal"><a href="#__codelineno-0-1542">1542</a></span>
+<span class="normal"><a href="#__codelineno-0-1543">1543</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a><span class="k">class</span> <span class="nc">ReferenceQC</span><span class="p">:</span>
+</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a><span class="sd">    Class for performing quality control of sequencing data against a reference genome.</span>
 </span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a>
-</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="sd">    **Attributes**</span>
+</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="sd">    This class computes various metrics to assess the quality and characteristics of a sequencing sample, including coverage indices and abundance ratios, by comparing sample k-mer signatures with a reference genome and an optional amplicon signature.</span>
 </span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a>
-</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">    - `sample_sig` (`SnipeSig`): The sample signature.</span>
-</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">    - `reference_sig` (`SnipeSig`): The reference genome signature.</span>
-</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">    - `amplicon_sig` (`Optional[SnipeSig]`): The amplicon signature.</span>
-</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a><span class="sd">    - `sample_stats` (`Dict[str, Any]`): Statistics of the sample signature.</span>
-</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">    - `genome_stats` (`Dict[str, Any]`): Calculated genome-related statistics.</span>
-</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="sd">    - `amplicon_stats` (`Dict[str, Any]`): Calculated amplicon-related statistics (if `amplicon_sig` is provided).</span>
-</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a><span class="sd">    - `advanced_stats` (`Dict[str, Any]`): Calculated advanced statistics (optional).</span>
-</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a><span class="sd">    - `predicted_assay_type` (`str`): Predicted assay type based on metrics.</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">    **Parameters**</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">    - `sample_sig` (`SnipeSig`): The sample k-mer signature (must be of type `SigType.SAMPLE`).</span>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a><span class="sd">    - `reference_sig` (`SnipeSig`): The reference genome k-mer signature (must be of type `SigType.GENOME`).</span>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">    - `amplicon_sig` (`Optional[SnipeSig]`): The amplicon k-mer signature (must be of type `SigType.AMPLICON`), if applicable.</span>
+</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a><span class="sd">    - `enable_logging` (`bool`): Flag to enable detailed logging.</span>
+</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a><span class="sd">    **Attributes**</span>
 </span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a>
-</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">    **Calculated Metrics**</span>
-</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a>
-</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a><span class="sd">    The class calculates the following metrics:</span>
-</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>
-</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">    - **Total unique k-mers**</span>
-</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">        - Description: Number of unique k-mers in the sample signature.</span>
-</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a><span class="sd">          $$</span>
-</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a><span class="sd">          \text{Total unique k-mers} = \left| \text{Sample k-mer set} \right|</span>
-</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a><span class="sd">          $$</span>
+</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="sd">    - `sample_sig` (`SnipeSig`): The sample signature.</span>
+</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="sd">    - `reference_sig` (`SnipeSig`): The reference genome signature.</span>
+</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a><span class="sd">    - `amplicon_sig` (`Optional[SnipeSig]`): The amplicon signature.</span>
+</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a><span class="sd">    - `sample_stats` (`Dict[str, Any]`): Statistics of the sample signature.</span>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">    - `genome_stats` (`Dict[str, Any]`): Calculated genome-related statistics.</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">    - `amplicon_stats` (`Dict[str, Any]`): Calculated amplicon-related statistics (if `amplicon_sig` is provided).</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a><span class="sd">    - `advanced_stats` (`Dict[str, Any]`): Calculated advanced statistics (optional).</span>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a><span class="sd">    - `predicted_assay_type` (`str`): Predicted assay type based on metrics.</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>
+</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a><span class="sd">    **Calculated Metrics**</span>
 </span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>
-</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a><span class="sd">    - **k-mer total abundance**</span>
-</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a><span class="sd">        - Description: Sum of abundances of all k-mers in the sample signature.</span>
-</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a><span class="sd">          $$</span>
-</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a><span class="sd">          \text{k-mer total abundance} = \sum_{k \in \text{Sample k-mer set}} \text{abundance}(k)</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a><span class="sd">    The class calculates the following metrics:</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a><span class="sd">    - **Total unique k-mers**</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a><span class="sd">        - Description: Number of unique k-mers in the sample signature.</span>
+</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a><span class="sd">          $$</span>
-</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>
-</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a><span class="sd">    - **k-mer mean abundance**</span>
-</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a><span class="sd">        - Description: Average abundance of k-mers in the sample signature.</span>
-</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a><span class="sd">          $$</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a><span class="sd">          \text{k-mer mean abundance} = \frac{\text{k-mer total abundance}}{\text{Total unique k-mers}}</span>
+</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a><span class="sd">          \text{Total unique k-mers} = \left| \text{Sample k-mer set} \right|</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a><span class="sd">          $$</span>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a><span class="sd">    - **k-mer total abundance**</span>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a><span class="sd">        - Description: Sum of abundances of all k-mers in the sample signature.</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a><span class="sd">          $$</span>
-</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a><span class="sd">    - **k-mer median abundance**</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a><span class="sd">        - Description: Median abundance of k-mers in the sample signature.</span>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a><span class="sd">        - Calculation: Median of abundances in the sample k-mers.</span>
-</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a><span class="sd">    - **Number of singletons**</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a><span class="sd">        - Description: Number of k-mers with an abundance of 1 in the sample signature.</span>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="sd">        - Calculation:</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a><span class="sd">          \text{k-mer total abundance} = \sum_{k \in \text{Sample k-mer set}} \text{abundance}(k)</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a><span class="sd">          $$</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a><span class="sd">    - **k-mer mean abundance**</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a><span class="sd">        - Description: Average abundance of k-mers in the sample signature.</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a><span class="sd">        - Calculation:</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a><span class="sd">          $$</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="sd">          \text{k-mer mean abundance} = \frac{\text{k-mer total abundance}}{\text{Total unique k-mers}}</span>
 </span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="sd">          $$</span>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">          \text{Number of singletons} = \left| \{ k \in \text{Sample k-mer set} \mid \text{abundance}(k) = 1 \} \right|</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">          $$</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">    - **Genomic unique k-mers**</span>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">        - Description: Number of k-mers shared between the sample and the reference genome.</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">          $$</span>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">          \text{Genomic unique k-mers} = \left| \text{Sample k-mer set} \cap \text{Reference genome k-mer set} \right|</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">    - **k-mer median abundance**</span>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        - Description: Median abundance of k-mers in the sample signature.</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">        - Calculation: Median of abundances in the sample k-mers.</span>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">    - **Number of singletons**</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a><span class="sd">        - Description: Number of k-mers with an abundance of 1 in the sample signature.</span>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">          $$</span>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">    - **Genome coverage index**</span>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a><span class="sd">        - Description: Proportion of the reference genome&#39;s k-mers that are present in the sample.</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a><span class="sd">          $$</span>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a><span class="sd">          \text{Genome coverage index} = \frac{\text{Genomic unique k-mers}}{\left| \text{Reference genome k-mer set} \right|}</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">          \text{Number of singletons} = \left| \{ k \in \text{Sample k-mer set} \mid \text{abundance}(k) = 1 \} \right|</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">          $$</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">    - **Genomic unique k-mers**</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a><span class="sd">        - Description: Number of k-mers shared between the sample and the reference genome.</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a><span class="sd">          $$</span>
-</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a><span class="sd">    - **Genomic k-mers total abundance**</span>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a><span class="sd">        - Description: Sum of abundances for k-mers shared with the reference genome.</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a><span class="sd">          $$</span>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a><span class="sd">          \text{Genomic k-mers total abundance} = \sum_{k \in \text{Sample k-mer set} \cap \text{Reference genome k-mer set}} \text{abundance}(k)</span>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a><span class="sd">          \text{Genomic unique k-mers} = \left| \text{Sample k-mer set} \cap \text{Reference genome k-mer set} \right|</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a><span class="sd">          $$</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a><span class="sd">    - **Genome coverage index**</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a><span class="sd">        - Description: Proportion of the reference genome&#39;s k-mers that are present in the sample.</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a><span class="sd">          $$</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a><span class="sd">    - **Genomic k-mers mean abundance**</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a><span class="sd">        - Description: Average abundance of k-mers shared with the reference genome.</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a><span class="sd">          $$</span>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a><span class="sd">          \text{Genomic k-mers mean abundance} = \frac{\text{Genomic k-mers total abundance}}{\text{Genomic unique k-mers}}</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a><span class="sd">          \text{Genome coverage index} = \frac{\text{Genomic unique k-mers}}{\left| \text{Reference genome k-mer set} \right|}</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a><span class="sd">          $$</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a><span class="sd">    - **Genomic k-mers total abundance**</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a><span class="sd">        - Description: Sum of abundances for k-mers shared with the reference genome.</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a><span class="sd">          $$</span>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a><span class="sd">    - **Mapping index**</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a><span class="sd">        - Description: Proportion of the sample&#39;s total k-mer abundance that maps to the reference genome.</span>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a><span class="sd">          $$</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">          \text{Mapping index} = \frac{\text{Genomic k-mers total abundance}}{\text{k-mer total abundance}}</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a><span class="sd">          \text{Genomic k-mers total abundance} = \sum_{k \in \text{Sample k-mer set} \cap \text{Reference genome k-mer set}} \text{abundance}(k)</span>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a><span class="sd">          $$</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a><span class="sd">    - **Genomic k-mers mean abundance**</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a><span class="sd">        - Description: Average abundance of k-mers shared with the reference genome.</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a><span class="sd">          $$</span>
-</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>
-</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a><span class="sd">    If `amplicon_sig` is provided, additional metrics are calculated:</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a><span class="sd">          \text{Genomic k-mers mean abundance} = \frac{\text{Genomic k-mers total abundance}}{\text{Genomic unique k-mers}}</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a><span class="sd">          $$</span>
 </span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>
-</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a><span class="sd">    - **Amplicon unique k-mers**</span>
-</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a><span class="sd">        - Description: Number of k-mers shared between the sample and the amplicon.</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a><span class="sd">    - **Mapping index**</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a><span class="sd">        - Description: Proportion of the sample&#39;s total k-mer abundance that maps to the reference genome.</span>
 </span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a><span class="sd">          $$</span>
-</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a><span class="sd">          \text{Amplicon unique k-mers} = \left| \text{Sample k-mer set} \cap \text{Amplicon k-mer set} \right|</span>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a><span class="sd">          \text{Mapping index} = \frac{\text{Genomic k-mers total abundance}}{\text{k-mer total abundance}}</span>
 </span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a><span class="sd">          $$</span>
 </span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>
-</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a><span class="sd">    - **Amplicon coverage index**</span>
-</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a><span class="sd">        - Description: Proportion of the amplicon&#39;s k-mers that are present in the sample.</span>
-</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a><span class="sd">          $$</span>
-</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a><span class="sd">          \text{Amplicon coverage index} = \frac{\text{Amplicon unique k-mers}}{\left| \text{Amplicon k-mer set} \right|}</span>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a><span class="sd">    If `amplicon_sig` is provided, additional metrics are calculated:</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a><span class="sd">    - **Amplicon unique k-mers**</span>
+</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a><span class="sd">        - Description: Number of k-mers shared between the sample and the amplicon.</span>
+</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a><span class="sd">          $$</span>
-</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>
-</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a><span class="sd">    - **Amplicon k-mers total abundance**</span>
-</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a><span class="sd">        - Description: Sum of abundances for k-mers shared with the amplicon.</span>
-</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a><span class="sd">          $$</span>
-</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a><span class="sd">          \text{Amplicon k-mers total abundance} = \sum_{k \in \text{Sample k-mer set} \cap \text{Amplicon k-mer set}} \text{abundance}(k)</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a><span class="sd">          \text{Amplicon unique k-mers} = \left| \text{Sample k-mer set} \cap \text{Amplicon k-mer set} \right|</span>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a><span class="sd">          $$</span>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a><span class="sd">    - **Amplicon coverage index**</span>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a><span class="sd">        - Description: Proportion of the amplicon&#39;s k-mers that are present in the sample.</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a><span class="sd">          $$</span>
-</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>
-</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a><span class="sd">    - **Amplicon k-mers mean abundance**</span>
-</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a><span class="sd">        - Description: Average abundance of k-mers shared with the amplicon.</span>
-</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a><span class="sd">          $$</span>
-</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a><span class="sd">          \text{Amplicon k-mers mean abundance} = \frac{\text{Amplicon k-mers total abundance}}{\text{Amplicon unique k-mers}}</span>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a><span class="sd">          \text{Amplicon coverage index} = \frac{\text{Amplicon unique k-mers}}{\left| \text{Amplicon k-mer set} \right|}</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a><span class="sd">          $$</span>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a><span class="sd">    - **Amplicon k-mers total abundance**</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a><span class="sd">        - Description: Sum of abundances for k-mers shared with the amplicon.</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a><span class="sd">          $$</span>
-</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>
-</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a><span class="sd">    - **Relative total abundance**</span>
-</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a><span class="sd">        - Description: Ratio of the amplicon k-mers total abundance to the genomic k-mers total abundance.</span>
-</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a><span class="sd">          $$</span>
-</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a><span class="sd">          \text{Relative total abundance} = \frac{\text{Amplicon k-mers total abundance}}{\text{Genomic k-mers total abundance}}</span>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a><span class="sd">          \text{Amplicon k-mers total abundance} = \sum_{k \in \text{Sample k-mer set} \cap \text{Amplicon k-mer set}} \text{abundance}(k)</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a><span class="sd">          $$</span>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a><span class="sd">    - **Amplicon k-mers mean abundance**</span>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a><span class="sd">        - Description: Average abundance of k-mers shared with the amplicon.</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a><span class="sd">          $$</span>
-</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>
-</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a><span class="sd">    - **Relative coverage**</span>
-</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a><span class="sd">        - Description: Ratio of the amplicon coverage index to the genome coverage index.</span>
-</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a><span class="sd">          $$</span>
-</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a><span class="sd">          \text{Relative coverage} = \frac{\text{Amplicon coverage index}}{\text{Genome coverage index}}</span>
+</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a><span class="sd">          \text{Amplicon k-mers mean abundance} = \frac{\text{Amplicon k-mers total abundance}}{\text{Amplicon unique k-mers}}</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a><span class="sd">          $$</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a><span class="sd">    - **Relative total abundance**</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a><span class="sd">        - Description: Ratio of the amplicon k-mers total abundance to the genomic k-mers total abundance.</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a><span class="sd">          $$</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>
-</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a><span class="sd">    - **Predicted Assay Type**</span>
-</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a><span class="sd">        - Description: Predicted assay type based on the `Relative total abundance`.</span>
-</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">          - If \(\text{Relative total abundance} \leq 0.0809\), then **WGS** (Whole Genome Sequencing).</span>
-</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="sd">          - If \(\text{Relative total abundance} \geq 0.1188\), then **WXS** (Whole Exome Sequencing).</span>
-</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a><span class="sd">          - If between these values, assign based on the closest threshold.</span>
-</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>
-</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a><span class="sd">    **Advanced Metrics** (optional, calculated if `include_advanced` is `True`):</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a><span class="sd">          \text{Relative total abundance} = \frac{\text{Amplicon k-mers total abundance}}{\text{Genomic k-mers total abundance}}</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a><span class="sd">          $$</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a><span class="sd">    - **Relative coverage**</span>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a><span class="sd">        - Description: Ratio of the amplicon coverage index to the genome coverage index.</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a><span class="sd">        - Calculation:</span>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a><span class="sd">          $$</span>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a><span class="sd">          \text{Relative coverage} = \frac{\text{Amplicon coverage index}}{\text{Genome coverage index}}</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a><span class="sd">          $$</span>
 </span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>
-</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a><span class="sd">    - **Median-trimmed unique k-mers**</span>
-</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a><span class="sd">        - Description: Number of unique k-mers in the sample after removing k-mers with abundance below the median.</span>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a><span class="sd">    - **Predicted Assay Type**</span>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a><span class="sd">        - Description: Predicted assay type based on the `Relative total abundance`.</span>
 </span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a><span class="sd">          - Remove k-mers where \(\text{abundance}(k) &lt; \text{Median abundance}\).</span>
-</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a><span class="sd">          - Count the remaining k-mers.</span>
-</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>
-</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a><span class="sd">    - **Median-trimmed total abundance**</span>
-</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a><span class="sd">        - Description: Sum of abundances after median trimming.</span>
-</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a><span class="sd">          $$</span>
-</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a><span class="sd">          \text{Median-trimmed total abundance} = \sum_{k \in \text{Median-trimmed Sample k-mer set}} \text{abundance}(k)</span>
-</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a><span class="sd">          $$</span>
-</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>
-</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a><span class="sd">    - **Median-trimmed mean abundance**</span>
-</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a><span class="sd">        - Description: Average abundance after median trimming.</span>
-</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a><span class="sd">          $$</span>
-</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a><span class="sd">          \text{Median-trimmed mean abundance} = \frac{\text{Median-trimmed total abundance}}{\text{Median-trimmed unique k-mers}}</span>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a><span class="sd">          - If \(\text{Relative total abundance} \leq 0.0809\), then **WGS** (Whole Genome Sequencing).</span>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a><span class="sd">          - If \(\text{Relative total abundance} \geq 0.1188\), then **WXS** (Whole Exome Sequencing).</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a><span class="sd">          - If between these values, assign based on the closest threshold.</span>
+</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a><span class="sd">    **Advanced Metrics** (optional, calculated if `include_advanced` is `True`):</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a><span class="sd">    - **Median-trimmed unique k-mers**</span>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a><span class="sd">        - Description: Number of unique k-mers in the sample after removing k-mers with abundance below the median.</span>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a><span class="sd">        - Calculation:</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a><span class="sd">          - Remove k-mers where \(\text{abundance}(k) &lt; \text{Median abundance}\).</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a><span class="sd">          - Count the remaining k-mers.</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a><span class="sd">    - **Median-trimmed total abundance**</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a><span class="sd">        - Description: Sum of abundances after median trimming.</span>
+</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a><span class="sd">          $$</span>
-</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>
-</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a><span class="sd">    - **Median-trimmed median abundance**</span>
-</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a><span class="sd">        - Description: Median abundance after median trimming.</span>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a><span class="sd">        - Calculation: Median of abundances in the median-trimmed sample.</span>
-</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>
-</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a><span class="sd">    - **Median-trimmed Genomic unique k-mers**</span>
-</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a><span class="sd">        - Description: Number of genomic k-mers in the median-trimmed sample.</span>
-</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a><span class="sd">        - Calculation:</span>
+</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a><span class="sd">          \text{Median-trimmed total abundance} = \sum_{k \in \text{Median-trimmed Sample k-mer set}} \text{abundance}(k)</span>
+</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a><span class="sd">          $$</span>
+</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>
+</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a><span class="sd">    - **Median-trimmed mean abundance**</span>
+</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a><span class="sd">        - Description: Average abundance after median trimming.</span>
+</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a><span class="sd">        - Calculation:</span>
+</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a><span class="sd">          $$</span>
+</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a><span class="sd">          \text{Median-trimmed mean abundance} = \frac{\text{Median-trimmed total abundance}}{\text{Median-trimmed unique k-mers}}</span>
 </span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a><span class="sd">          $$</span>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a><span class="sd">          \text{Median-trimmed Genomic unique k-mers} = \left| \text{Median-trimmed Sample k-mer set} \cap \text{Reference genome k-mer set} \right|</span>
-</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a><span class="sd">          $$</span>
-</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>
-</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a><span class="sd">    - **Median-trimmed Genome coverage index**</span>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a><span class="sd">        - Description: Genome coverage index after median trimming.</span>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">          $$</span>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a><span class="sd">          \text{Median-trimmed Genome coverage index} = \frac{\text{Median-trimmed Genomic unique k-mers}}{\left| \text{Reference genome k-mer set} \right|}</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>
+</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a><span class="sd">    - **Median-trimmed median abundance**</span>
+</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a><span class="sd">        - Description: Median abundance after median trimming.</span>
+</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a><span class="sd">        - Calculation: Median of abundances in the median-trimmed sample.</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a><span class="sd">    - **Median-trimmed Genomic unique k-mers**</span>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">        - Description: Number of genomic k-mers in the median-trimmed sample.</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">          $$</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">    - **Median-trimmed Amplicon unique k-mers** (if `amplicon_sig` is provided)</span>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a><span class="sd">        - Description: Number of amplicon k-mers in the median-trimmed sample.</span>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a><span class="sd">          $$</span>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a><span class="sd">          \text{Median-trimmed Amplicon unique k-mers} = \left| \text{Median-trimmed Sample k-mer set} \cap \text{Amplicon k-mer set} \right|</span>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="sd">          \text{Median-trimmed Genomic unique k-mers} = \left| \text{Median-trimmed Sample k-mer set} \cap \text{Reference genome k-mer set} \right|</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">          $$</span>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">    - **Median-trimmed Genome coverage index**</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a><span class="sd">        - Description: Genome coverage index after median trimming.</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a><span class="sd">          $$</span>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a><span class="sd">    - **Median-trimmed Amplicon coverage index**</span>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a><span class="sd">        - Description: Amplicon coverage index after median trimming.</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a><span class="sd">          $$</span>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a><span class="sd">          \text{Median-trimmed Amplicon coverage index} = \frac{\text{Median-trimmed Amplicon unique k-mers}}{\left| \text{Amplicon k-mer set} \right|}</span>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a><span class="sd">          \text{Median-trimmed Genome coverage index} = \frac{\text{Median-trimmed Genomic unique k-mers}}{\left| \text{Reference genome k-mer set} \right|}</span>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a><span class="sd">          $$</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a><span class="sd">    - **Median-trimmed Amplicon unique k-mers** (if `amplicon_sig` is provided)</span>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a><span class="sd">        - Description: Number of amplicon k-mers in the median-trimmed sample.</span>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a><span class="sd">          $$</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">    - **Median-trimmed relative coverage**</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a><span class="sd">        - Description: Relative coverage after median trimming.</span>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a><span class="sd">          $$</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a><span class="sd">          \text{Median-trimmed relative coverage} = \frac{\text{Median-trimmed Amplicon coverage index}}{\text{Median-trimmed Genome coverage index}}</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a><span class="sd">          \text{Median-trimmed Amplicon unique k-mers} = \left| \text{Median-trimmed Sample k-mer set} \cap \text{Amplicon k-mer set} \right|</span>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="sd">          $$</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a><span class="sd">    - **Median-trimmed Amplicon coverage index**</span>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a><span class="sd">        - Description: Amplicon coverage index after median trimming.</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a><span class="sd">          $$</span>
-</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>
-</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a><span class="sd">    - **Median-trimmed relative mean abundance**</span>
-</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a><span class="sd">        - Description: Ratio of median-trimmed amplicon mean abundance to median-trimmed genomic mean abundance.</span>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a><span class="sd">        - Calculation:</span>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a><span class="sd">          $$</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a><span class="sd">          \text{Median-trimmed relative mean abundance} = \frac{\text{Median-trimmed Amplicon mean abundance}}{\text{Median-trimmed Genomic mean abundance}}</span>
+</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a><span class="sd">          \text{Median-trimmed Amplicon coverage index} = \frac{\text{Median-trimmed Amplicon unique k-mers}}{\left| \text{Amplicon k-mer set} \right|}</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a><span class="sd">          $$</span>
+</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a><span class="sd">    - **Median-trimmed relative coverage**</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a><span class="sd">        - Description: Relative coverage after median trimming.</span>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a><span class="sd">        - Calculation:</span>
 </span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a><span class="sd">          $$</span>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a><span class="sd">    **Usage Example**</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a><span class="sd">          \text{Median-trimmed relative coverage} = \frac{\text{Median-trimmed Amplicon coverage index}}{\text{Median-trimmed Genome coverage index}}</span>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a><span class="sd">          $$</span>
 </span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="sd">    ```python</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a><span class="sd">    qc = ReferenceQC(</span>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a><span class="sd">        sample_sig=sample_signature,</span>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a><span class="sd">        reference_sig=reference_signature,</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a><span class="sd">        amplicon_sig=amplicon_signature,</span>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a><span class="sd">        enable_logging=True</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a><span class="sd">    )</span>
-</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>
-</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a><span class="sd">    stats = qc.get_aggregated_stats(include_advanced=True)</span>
-</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a><span class="sd">    ```</span>
-</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>                 <span class="n">sample_sig</span><span class="p">:</span> <span class="n">SnipeSig</span><span class="p">,</span>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>                 <span class="n">reference_sig</span><span class="p">:</span> <span class="n">SnipeSig</span><span class="p">,</span>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>                 <span class="n">amplicon_sig</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>                 <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>                 <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>        <span class="c1"># Initialize logger</span>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a><span class="sd">    - **Median-trimmed relative mean abundance**</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a><span class="sd">        - Description: Ratio of median-trimmed amplicon mean abundance to median-trimmed genomic mean abundance.</span>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a><span class="sd">        - Calculation:</span>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a><span class="sd">          $$</span>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a><span class="sd">          \text{Median-trimmed relative mean abundance} = \frac{\text{Median-trimmed Amplicon mean abundance}}{\text{Median-trimmed Genomic mean abundance}}</span>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a><span class="sd">          $$</span>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a><span class="sd">    **Usage Example**</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a><span class="sd">    ```python</span>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a><span class="sd">    qc = ReferenceQC(</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a><span class="sd">        sample_sig=sample_signature,</span>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a><span class="sd">        reference_sig=reference_signature,</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a><span class="sd">        amplicon_sig=amplicon_signature,</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a><span class="sd">        enable_logging=True</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a><span class="sd">    )</span>
+</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a><span class="sd">    stats = qc.get_aggregated_stats(include_advanced=True)</span>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a><span class="sd">    ```</span>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a><span class="sd">    &quot;&quot;&quot;</span>
 </span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>        <span class="k">if</span> <span class="n">enable_logging</span><span class="p">:</span>
-</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">hasHandlers</span><span class="p">():</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>                <span class="n">ch</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">StreamHandler</span><span class="p">()</span>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>                <span class="n">ch</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>                <span class="n">formatter</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">Formatter</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">%(asctime)s</span><span class="s1"> - </span><span class="si">%(name)s</span><span class="s1"> - </span><span class="si">%(levelname)s</span><span class="s1"> - </span><span class="si">%(message)s</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>                <span class="n">ch</span><span class="o">.</span><span class="n">setFormatter</span><span class="p">(</span><span class="n">formatter</span><span class="p">)</span>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">addHandler</span><span class="p">(</span><span class="n">ch</span><span class="p">)</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Logging is enabled for ReferenceQC.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">CRITICAL</span><span class="p">)</span>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>        <span class="c1"># logging all passed parameters</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;passed parameters:</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>        <span class="k">for</span> <span class="n">key</span><span class="p">,</span> <span class="n">value</span> <span class="ow">in</span> <span class="nb">locals</span><span class="p">()</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="si">%s</span><span class="s2">: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">key</span><span class="p">,</span> <span class="n">value</span><span class="p">)</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>
-</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>        <span class="c1"># Validate that all signatures have the same ksize and scale</span>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Validating ksize and scale across signatures.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>        <span class="k">if</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">:</span>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;K-mer sizes do not match: sample_sig.ksize=</span><span class="si">%d</span><span class="s2"> vs reference_sig.ksize=</span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>                              <span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">)</span>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sample_sig kszie (</span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">) does not match reference_sig ksize (</span><span class="si">{</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">).&quot;</span><span class="p">)</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>        <span class="k">if</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Scale values do not match: sample_sig.scale=</span><span class="si">%d</span><span class="s2"> vs reference_sig.scale=</span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>                              <span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">)</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sample_sig scale (</span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">) does not match reference_sig scale (</span><span class="si">{</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">).&quot;</span><span class="p">)</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>        <span class="k">if</span> <span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>            <span class="k">if</span> <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">:</span>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;K-mer sizes do not match: amplicon_sig.ksize=</span><span class="si">%d</span><span class="s2"> vs sample_sig.ksize=</span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>                                  <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">)</span>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;amplicon_sig ksize (</span><span class="si">{</span><span class="n">amplicon_sig</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">) does not match sample_sig ksize (</span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">).&quot;</span><span class="p">)</span>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>            <span class="k">if</span> <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Scale values do not match: amplicon_sig.scale=</span><span class="si">%d</span><span class="s2"> vs sample_sig.scale=</span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>                                  <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">)</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;amplicon_sig scale (</span><span class="si">{</span><span class="n">amplicon_sig</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">) does not match sample_sig scale (</span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">).&quot;</span><span class="p">)</span>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;All signatures have matching ksize and scale.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>        <span class="c1"># Verify signature types</span>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>        <span class="k">if</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">_type</span> <span class="o">!=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">:</span>
-</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid signature type for sample_sig: </span><span class="si">%s</span><span class="s2"> | </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">,</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">_type</span><span class="p">)</span>
-</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sample_sig must be of type </span><span class="si">{</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="si">}</span><span class="s2">, got </span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>
-</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>        <span class="k">if</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">!=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">:</span>
-</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid signature type for reference_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">)</span>
-</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;reference_sig must be of type </span><span class="si">{</span><span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="si">}</span><span class="s2">, got </span><span class="si">{</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>
-</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>        <span class="k">if</span> <span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">!=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">:</span>
-</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid signature type for amplicon_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">)</span>
-</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;amplicon_sig must be of type </span><span class="si">{</span><span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="si">}</span><span class="s2">, got </span><span class="si">{</span><span class="n">amplicon_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>                 <span class="n">sample_sig</span><span class="p">:</span> <span class="n">SnipeSig</span><span class="p">,</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>                 <span class="n">reference_sig</span><span class="p">:</span> <span class="n">SnipeSig</span><span class="p">,</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>                 <span class="n">amplicon_sig</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>                 <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>                 <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>        <span class="c1"># Initialize logger</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>        <span class="c1"># Initialize split cache</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_split_cache</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="n">List</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Initialized split cache.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>        <span class="k">if</span> <span class="n">enable_logging</span><span class="p">:</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">hasHandlers</span><span class="p">():</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>                <span class="n">ch</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">StreamHandler</span><span class="p">()</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>                <span class="n">ch</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>                <span class="n">formatter</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">Formatter</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">%(asctime)s</span><span class="s1"> - </span><span class="si">%(name)s</span><span class="s1"> - </span><span class="si">%(levelname)s</span><span class="s1"> - </span><span class="si">%(message)s</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>                <span class="n">ch</span><span class="o">.</span><span class="n">setFormatter</span><span class="p">(</span><span class="n">formatter</span><span class="p">)</span>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">addHandler</span><span class="p">(</span><span class="n">ch</span><span class="p">)</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Logging is enabled for ReferenceQC.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">CRITICAL</span><span class="p">)</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>        <span class="c1"># logging all passed parameters</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;passed parameters:</span><span class="se">\n</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>        <span class="k">for</span> <span class="n">key</span><span class="p">,</span> <span class="n">value</span> <span class="ow">in</span> <span class="nb">locals</span><span class="p">()</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="si">%s</span><span class="s2">: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">key</span><span class="p">,</span> <span class="n">value</span><span class="p">)</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>        <span class="c1"># Validate that all signatures have the same ksize and scale</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Validating ksize and scale across signatures.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>        <span class="k">if</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">:</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;K-mer sizes do not match: sample_sig.ksize=</span><span class="si">%d</span><span class="s2"> vs reference_sig.ksize=</span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>                              <span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">)</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sample_sig kszie (</span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">) does not match reference_sig ksize (</span><span class="si">{</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">).&quot;</span><span class="p">)</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>        <span class="k">if</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Scale values do not match: sample_sig.scale=</span><span class="si">%d</span><span class="s2"> vs reference_sig.scale=</span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>                              <span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">)</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sample_sig scale (</span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">) does not match reference_sig scale (</span><span class="si">{</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">).&quot;</span><span class="p">)</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>        <span class="k">if</span> <span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>            <span class="k">if</span> <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">:</span>
+</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;K-mer sizes do not match: amplicon_sig.ksize=</span><span class="si">%d</span><span class="s2"> vs sample_sig.ksize=</span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>                                  <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">)</span>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;amplicon_sig ksize (</span><span class="si">{</span><span class="n">amplicon_sig</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">) does not match sample_sig ksize (</span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">).&quot;</span><span class="p">)</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>            <span class="k">if</span> <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Scale values do not match: amplicon_sig.scale=</span><span class="si">%d</span><span class="s2"> vs sample_sig.scale=</span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>                                  <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">)</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;amplicon_sig scale (</span><span class="si">{</span><span class="n">amplicon_sig</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">) does not match sample_sig scale (</span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">).&quot;</span><span class="p">)</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;All signatures have matching ksize and scale.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>
 </span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>
-</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Chromosome specific signatures provided.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">flag_activate_sex_metrics</span> <span class="o">=</span> <span class="kc">True</span>
-</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>
-</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>
-</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">=</span> <span class="n">sample_sig</span>
-</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span> <span class="o">=</span> <span class="n">reference_sig</span>
-</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="o">=</span> <span class="n">amplicon_sig</span>
-</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span> <span class="o">=</span> <span class="n">enable_logging</span>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>        <span class="c1"># Verify signature types</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>        <span class="k">if</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">_type</span> <span class="o">!=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">:</span>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid signature type for sample_sig: </span><span class="si">%s</span><span class="s2"> | </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">,</span> <span class="n">sample_sig</span><span class="o">.</span><span class="n">_type</span><span class="p">)</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sample_sig must be of type </span><span class="si">{</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="si">}</span><span class="s2">, got </span><span class="si">{</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>        <span class="k">if</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">!=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">:</span>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid signature type for reference_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">reference_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">)</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;reference_sig must be of type </span><span class="si">{</span><span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="si">}</span><span class="s2">, got </span><span class="si">{</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>
-</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>        <span class="c1"># Initialize attributes</span>
-</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>        <span class="k">if</span> <span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span> <span class="ow">and</span> <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">!=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">:</span>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid signature type for amplicon_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">amplicon_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">)</span>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;amplicon_sig must be of type </span><span class="si">{</span><span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="si">}</span><span class="s2">, got </span><span class="si">{</span><span class="n">amplicon_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Chromosome specific signatures provided.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">flag_activate_sex_metrics</span> <span class="o">=</span> <span class="kc">True</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>
 </span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>
-</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>        <span class="c1"># Set grey zone thresholds</span>
-</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span> <span class="o">=</span> <span class="p">[</span><span class="mf">0.08092723407173719</span><span class="p">,</span> <span class="mf">0.11884490500267662</span><span class="p">]</span>
-</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>
-</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>        <span class="c1"># Get sample statistics</span>
-</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Getting sample statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>
-</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>        <span class="c1"># Get reference genome statistics</span>
-</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Getting reference genome statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>
-</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>        <span class="c1"># If amplicon_sig is provided, get its stats</span>
-</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Getting amplicon statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">=</span> <span class="n">sample_sig</span>
+</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span> <span class="o">=</span> <span class="n">reference_sig</span>
+</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="o">=</span> <span class="n">amplicon_sig</span>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span> <span class="o">=</span> <span class="n">enable_logging</span>
+</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>
+</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>        <span class="c1"># Initialize attributes</span>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">predicted_error_contamination_index</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;&quot;</span>
 </span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>
-</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>        <span class="c1"># Compute metrics</span>
-</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_stats</span><span class="p">()</span>
-</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>
-</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>
-</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>    <span class="k">def</span> <span class="nf">_calculate_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a><span class="sd">        Calculate the various metrics based on the sample, reference, and optional amplicon signatures.</span>
-</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>        <span class="c1"># ============= SAMPLE STATS =============</span>
-</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Processing sample statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>            <span class="s2">&quot;Total unique k-mers&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
-</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>            <span class="s2">&quot;k-mer total abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>            <span class="s2">&quot;k-mer mean abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>            <span class="s2">&quot;k-mer median abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>            <span class="s2">&quot;num_singletons&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;num_singletons&quot;</span><span class="p">],</span>
-</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>            <span class="s2">&quot;ksize&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;ksize&quot;</span><span class="p">],</span>
-</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>            <span class="s2">&quot;scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;scale&quot;</span><span class="p">],</span>
-</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>            <span class="s2">&quot;name&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;name&quot;</span><span class="p">],</span>
-</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>            <span class="s2">&quot;filename&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;filename&quot;</span><span class="p">],</span>
-</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>        <span class="p">}</span>
-</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>
-</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>        <span class="c1"># ============= GENOME STATS =============</span>
-</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating genome statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>        <span class="c1"># Compute intersection of sample and reference genome</span>
-</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Type of sample_sig: </span><span class="si">%s</span><span class="s2"> | Type of reference_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">)</span>
-</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>        <span class="n">sample_genome</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
-</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>        <span class="c1"># Get stats (call get_sample_stats only once)</span>
-</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>
-</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>        <span class="c1"># Log hashes and abundances for both sample and reference</span>
-</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Sample hashes: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">)</span>
-</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Sample abundances: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">)</span>
-</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Reference hashes: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">)</span>
-</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Reference abundances: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">)</span>
-</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>
-</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>        <span class="n">sample_genome_stats</span> <span class="o">=</span> <span class="n">sample_genome</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>
-</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>            <span class="s2">&quot;Genomic unique k-mers&quot;</span><span class="p">:</span> <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
-</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>            <span class="s2">&quot;Genomic k-mers total abundance&quot;</span><span class="p">:</span> <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>            <span class="s2">&quot;Genomic k-mers mean abundance&quot;</span><span class="p">:</span> <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>            <span class="s2">&quot;Genomic k-mers median abundance&quot;</span><span class="p">:</span> <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>            <span class="c1"># Genome coverage index</span>
-</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>            <span class="s2">&quot;Genome coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>                <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
-</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a>            <span class="p">),</span>
-</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a>            <span class="c1"># Mapping index</span>
-</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>            <span class="s2">&quot;Mapping index&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a>                <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">[</span><span class="s2">&quot;k-mer total abundance&quot;</span><span class="p">]</span>
-</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">[</span><span class="s2">&quot;k-mer total abundance&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a>            <span class="p">),</span>
-</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a>        <span class="p">}</span>
-</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a>
-</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a>        <span class="c1"># ============= AMPLICON STATS =============</span>
-</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating amplicon statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>            <span class="c1"># Compute intersection of sample and amplicon</span>
-</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>            <span class="n">sample_amplicon</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
-</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>            <span class="c1"># Get stats (call get_sample_stats only once)</span>
-</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>            <span class="n">sample_amplicon_stats</span> <span class="o">=</span> <span class="n">sample_amplicon</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>
-</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>                <span class="s2">&quot;Amplicon unique k-mers&quot;</span><span class="p">:</span> <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
-</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>                <span class="s2">&quot;Amplicon k-mers total abundance&quot;</span><span class="p">:</span> <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>                <span class="s2">&quot;Amplicon k-mers mean abundance&quot;</span><span class="p">:</span> <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>                <span class="s2">&quot;Amplicon k-mers median abundance&quot;</span><span class="p">:</span> <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>                <span class="c1"># Amplicon coverage index</span>
-</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>                <span class="s2">&quot;Amplicon coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>                    <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
-</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a>                    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>                <span class="p">),</span>
-</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>            <span class="p">}</span>
-</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>
-</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a>            <span class="c1"># Relative metrics</span>
-</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Relative total abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Amplicon k-mers total abundance&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">[</span><span class="s2">&quot;Genomic k-mers total abundance&quot;</span><span class="p">]</span>
-</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">[</span><span class="s2">&quot;Genomic k-mers total abundance&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>            <span class="p">)</span>
-</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Relative coverage&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Amplicon coverage index&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">[</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">]</span>
-</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">[</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a>            <span class="p">)</span>
-</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>
-</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>            <span class="c1"># Predicted assay type</span>
-</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>            <span class="n">relative_total_abundance</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Relative total abundance&quot;</span><span class="p">]</span>
-</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>            <span class="k">if</span> <span class="n">relative_total_abundance</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span><span class="p">[</span><span class="mi">0</span><span class="p">]:</span>
-</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span> <span class="o">=</span> <span class="s2">&quot;WGS&quot;</span>
-</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>            <span class="k">elif</span> <span class="n">relative_total_abundance</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span><span class="p">[</span><span class="mi">1</span><span class="p">]:</span>
-</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span> <span class="o">=</span> <span class="s2">&quot;WXS&quot;</span>
-</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>                <span class="c1"># Assign based on the closest threshold</span>
-</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>                <span class="n">distance_to_wgs</span> <span class="o">=</span> <span class="nb">abs</span><span class="p">(</span><span class="n">relative_total_abundance</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
-</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>                <span class="n">distance_to_wxs</span> <span class="o">=</span> <span class="nb">abs</span><span class="p">(</span><span class="n">relative_total_abundance</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
-</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span> <span class="o">=</span> <span class="s2">&quot;WGS&quot;</span> <span class="k">if</span> <span class="n">distance_to_wgs</span> <span class="o">&lt;</span> <span class="n">distance_to_wxs</span> <span class="k">else</span> <span class="s2">&quot;WXS&quot;</span>
-</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicted assay type: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span><span class="p">)</span>
-</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>
-</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>    <span class="k">def</span> <span class="nf">get_aggregated_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">include_advanced</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
-</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a><span class="sd">        Retrieve aggregated statistics from the quality control analysis.</span>
-</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>
-</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a><span class="sd">        **Parameters**</span>
-</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>
-</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a><span class="sd">        - `include_advanced (bool)`:  </span>
-</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a><span class="sd">          If set to `True`, includes advanced metrics in the aggregated statistics.</span>
-</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>
-</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a><span class="sd">        **Returns**</span>
-</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>
-</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a><span class="sd">        - `Dict[str, Any]`:  </span>
-</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a><span class="sd">          A dictionary containing the aggregated statistics, which may include:</span>
-</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a><span class="sd">          - Sample statistics</span>
-</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a><span class="sd">          - Genome statistics</span>
-</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a><span class="sd">          - Amplicon statistics (if provided)</span>
-</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a><span class="sd">          - Predicted assay type</span>
-</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a><span class="sd">          - Advanced statistics (if `include_advanced` is `True`)</span>
-</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>        <span class="n">aggregated_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>        <span class="c1"># Include sample_stats</span>
-</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">)</span>
-</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>        <span class="c1"># Include genome_stats</span>
-</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">)</span>
-</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>        <span class="c1"># Include amplicon_stats if available</span>
-</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;While aggregating stats; amplicon signature provided.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">)</span>
-</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>            <span class="n">aggregated_stats</span><span class="p">[</span><span class="s2">&quot;Predicted Assay Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span>
-</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>
-</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">:</span>
-</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">)</span>
-</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>
-</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">:</span>
-</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">)</span>
-</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>
-</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>        <span class="c1"># Include advanced_stats if requested</span>
-</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>        <span class="k">if</span> <span class="n">include_advanced</span><span class="p">:</span>
-</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_advanced_stats</span><span class="p">()</span>
-</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">)</span>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>        <span class="c1"># Set grey zone thresholds</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span> <span class="o">=</span> <span class="p">[</span><span class="mf">0.08092723407173719</span><span class="p">,</span> <span class="mf">0.11884490500267662</span><span class="p">]</span>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>        <span class="c1"># Get sample statistics</span>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Getting sample statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>        <span class="c1"># Get reference genome statistics</span>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Getting reference genome statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>        <span class="c1"># If amplicon_sig is provided, get its stats</span>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Getting amplicon statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>        <span class="c1"># Compute metrics</span>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_stats</span><span class="p">()</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>    <span class="k">def</span> <span class="nf">_calculate_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a><span class="sd">        Calculate the various metrics based on the sample, reference, and optional amplicon signatures.</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>        <span class="c1"># ============= SAMPLE STATS =============</span>
+</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Processing sample statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>            <span class="s2">&quot;Total unique k-mers&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>            <span class="s2">&quot;k-mer total abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>            <span class="s2">&quot;k-mer mean abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>            <span class="s2">&quot;k-mer median abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>            <span class="s2">&quot;num_singletons&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;num_singletons&quot;</span><span class="p">],</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>            <span class="s2">&quot;ksize&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;ksize&quot;</span><span class="p">],</span>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>            <span class="s2">&quot;scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;scale&quot;</span><span class="p">],</span>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>            <span class="s2">&quot;name&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;name&quot;</span><span class="p">],</span>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>            <span class="s2">&quot;filename&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats_raw</span><span class="p">[</span><span class="s2">&quot;filename&quot;</span><span class="p">],</span>
+</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>        <span class="p">}</span>
+</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>
+</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>        <span class="c1"># ============= GENOME STATS =============</span>
+</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating genome statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>        <span class="c1"># Compute intersection of sample and reference genome</span>
+</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Type of sample_sig: </span><span class="si">%s</span><span class="s2"> | Type of reference_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span><span class="o">.</span><span class="n">sigtype</span><span class="p">)</span>
+</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>        <span class="n">sample_genome</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
+</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>        <span class="c1"># Get stats (call get_sample_stats only once)</span>
+</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>
+</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a>        <span class="c1"># Log hashes and abundances for both sample and reference</span>
+</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a>        <span class="c1"># self.logger.debug(&quot;Sample hashes: %s&quot;, self.sample_sig.hashes)</span>
+</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a>        <span class="c1"># self.logger.debug(&quot;Sample abundances: %s&quot;, self.sample_sig.abundances)</span>
+</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>        <span class="c1"># self.logger.debug(&quot;Reference hashes: %s&quot;, self.reference_sig.hashes)</span>
+</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a>        <span class="c1"># self.logger.debug(&quot;Reference abundances: %s&quot;, self.reference_sig.abundances)</span>
+</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a>
+</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a>        <span class="n">sample_genome_stats</span> <span class="o">=</span> <span class="n">sample_genome</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a>
+</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a>            <span class="s2">&quot;Genomic unique k-mers&quot;</span><span class="p">:</span> <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
+</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>            <span class="s2">&quot;Genomic k-mers total abundance&quot;</span><span class="p">:</span> <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>            <span class="s2">&quot;Genomic k-mers mean abundance&quot;</span><span class="p">:</span> <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>            <span class="s2">&quot;Genomic k-mers median abundance&quot;</span><span class="p">:</span> <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>            <span class="c1"># Genome coverage index</span>
+</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>            <span class="s2">&quot;Genome coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>                <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
+</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>            <span class="p">),</span>
+</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>            <span class="c1"># Mapping index</span>
+</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>            <span class="s2">&quot;Mapping index&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>                <span class="n">sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">[</span><span class="s2">&quot;k-mer total abundance&quot;</span><span class="p">]</span>
+</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">[</span><span class="s2">&quot;k-mer total abundance&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>            <span class="p">),</span>
+</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>        <span class="p">}</span>
+</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>
+</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a>        <span class="c1"># ============= AMPLICON STATS =============</span>
+</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating amplicon statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>            <span class="c1"># Compute intersection of sample and amplicon</span>
+</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a>            <span class="n">sample_amplicon</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
+</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>            <span class="c1"># Get stats (call get_sample_stats only once)</span>
+</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a>            <span class="n">sample_amplicon_stats</span> <span class="o">=</span> <span class="n">sample_amplicon</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a>
+</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>                <span class="s2">&quot;Amplicon unique k-mers&quot;</span><span class="p">:</span> <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
+</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a>                <span class="s2">&quot;Amplicon k-mers total abundance&quot;</span><span class="p">:</span> <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a>                <span class="s2">&quot;Amplicon k-mers mean abundance&quot;</span><span class="p">:</span> <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a>                <span class="s2">&quot;Amplicon k-mers median abundance&quot;</span><span class="p">:</span> <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>                <span class="c1"># Amplicon coverage index</span>
+</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>                <span class="s2">&quot;Amplicon coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>                    <span class="n">sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
+</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>                    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>                <span class="p">),</span>
+</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>            <span class="p">}</span>
+</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>
+</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>            <span class="c1"># ============= RELATIVE STATS =============</span>
+</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Relative total abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Amplicon k-mers total abundance&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">[</span><span class="s2">&quot;Genomic k-mers total abundance&quot;</span><span class="p">]</span>
+</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">[</span><span class="s2">&quot;Genomic k-mers total abundance&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>            <span class="p">)</span>
+</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Relative coverage&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Amplicon coverage index&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">[</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">]</span>
+</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">[</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>            <span class="p">)</span>
+</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>
+</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>            <span class="n">relative_total_abundance</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Relative total abundance&quot;</span><span class="p">]</span>
+</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>            <span class="k">if</span> <span class="n">relative_total_abundance</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span><span class="p">[</span><span class="mi">0</span><span class="p">]:</span>
+</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span> <span class="o">=</span> <span class="s2">&quot;WGS&quot;</span>
+</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>            <span class="k">elif</span> <span class="n">relative_total_abundance</span> <span class="o">&gt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span><span class="p">[</span><span class="mi">1</span><span class="p">]:</span>
+</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span> <span class="o">=</span> <span class="s2">&quot;WXS&quot;</span>
+</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>                <span class="c1"># Assign based on the closest threshold</span>
+</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>                <span class="n">distance_to_wgs</span> <span class="o">=</span> <span class="nb">abs</span><span class="p">(</span><span class="n">relative_total_abundance</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span><span class="p">[</span><span class="mi">0</span><span class="p">])</span>
+</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>                <span class="n">distance_to_wxs</span> <span class="o">=</span> <span class="nb">abs</span><span class="p">(</span><span class="n">relative_total_abundance</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">relative_total_abundance_grey_zone</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span> <span class="o">=</span> <span class="s2">&quot;WGS&quot;</span> <span class="k">if</span> <span class="n">distance_to_wgs</span> <span class="o">&lt;</span> <span class="n">distance_to_wxs</span> <span class="k">else</span> <span class="s2">&quot;WXS&quot;</span>
+</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>
+</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>
+</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicted assay type: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span><span class="p">)</span>
+</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>
+</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculuating error and contamination indices.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>            <span class="n">sample_nonref</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
+</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>            <span class="n">sample_nonref_singletons</span> <span class="o">=</span> <span class="n">sample_nonref</span><span class="o">.</span><span class="n">count_singletons</span><span class="p">()</span>
+</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>            <span class="n">sample_nonref_non_singletons</span> <span class="o">=</span> <span class="n">sample_nonref</span><span class="o">.</span><span class="n">total_abundance</span> <span class="o">-</span> <span class="n">sample_nonref_singletons</span>
+</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>            <span class="n">sample_total_abundance</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>
+</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>            <span class="n">predicted_error_index</span> <span class="o">=</span> <span class="n">sample_nonref_singletons</span> <span class="o">/</span> <span class="n">sample_total_abundance</span>
+</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>            <span class="n">predicted_contamination_index</span> <span class="o">=</span> <span class="n">sample_nonref_non_singletons</span> <span class="o">/</span> <span class="n">sample_total_abundance</span>
+</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>
+</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>            <span class="c1"># predict error and contamination index</span>
+</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">predicted_error_contamination_index</span><span class="p">[</span><span class="s2">&quot;Predicted contamination index&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">predicted_contamination_index</span>
+</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">predicted_error_contamination_index</span><span class="p">[</span><span class="s2">&quot;Sequencing errors index&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">predicted_error_index</span>
+</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>        <span class="c1"># except zero division error</span>
+</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>        <span class="k">except</span> <span class="ne">ZeroDivisionError</span><span class="p">:</span>
+</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Please check the sample signature, it seems to be empty.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>
+</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>
+</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>    <span class="k">def</span> <span class="nf">get_aggregated_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">include_advanced</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a><span class="sd">        Retrieve aggregated statistics from the quality control analysis.</span>
+</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>
+</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a><span class="sd">        **Parameters**</span>
 </span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>
-</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>        <span class="k">return</span> <span class="n">aggregated_stats</span>
-</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>
-</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>    <span class="k">def</span> <span class="nf">_calculate_advanced_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a><span class="sd">        Calculate advanced statistics, such as median-trimmed metrics.</span>
-</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>
-</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>        <span class="c1"># Copy sample signature to avoid modifying the original</span>
-</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>        <span class="n">median_trimmed_sample_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>        <span class="c1"># Trim below median</span>
-</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>        <span class="n">median_trimmed_sample_sig</span><span class="o">.</span><span class="n">trim_below_median</span><span class="p">()</span>
-</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>        <span class="c1"># Get stats</span>
-</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>        <span class="n">median_trimmed_sample_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>            <span class="s2">&quot;Median-trimmed unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
-</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>            <span class="s2">&quot;Median-trimmed total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>            <span class="s2">&quot;Median-trimmed mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>            <span class="s2">&quot;Median-trimmed median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>        <span class="p">})</span>
-</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>
-</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>        <span class="c1"># Genome stats for median-trimmed sample</span>
-</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>        <span class="n">median_trimmed_sample_genome</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
-</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a>        <span class="n">median_trimmed_sample_genome_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_genome</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>            <span class="s2">&quot;Median-trimmed Genomic unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
-</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>            <span class="s2">&quot;Median-trimmed Genomic total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>            <span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>            <span class="s2">&quot;Median-trimmed Genomic median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>            <span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>                <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
-</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>            <span class="p">),</span>
-</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>        <span class="p">})</span>
-</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>
-</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced amplicon statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>            <span class="c1"># Amplicon stats for median-trimmed sample</span>
-</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>            <span class="n">median_trimmed_sample_amplicon</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
-</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>            <span class="n">median_trimmed_sample_amplicon_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_amplicon</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>                <span class="s2">&quot;Median-trimmed Amplicon unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
-</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>                <span class="s2">&quot;Median-trimmed Amplicon total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>                <span class="s2">&quot;Median-trimmed Amplicon mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>                <span class="s2">&quot;Median-trimmed Amplicon median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a>                <span class="s2">&quot;Median-trimmed Amplicon coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>                    <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
-</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a>                    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a>                <span class="p">),</span>
-</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a>            <span class="p">})</span>
-</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a>            <span class="c1"># Additional advanced relative metrics</span>
-</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced relative metrics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Amplicon coverage index&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">]</span>
-</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a>            <span class="p">)</span>
-</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-535"><a id="__codelineno-0-535" name="__codelineno-0-535"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Amplicon mean abundance&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">]</span>
-</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a>            <span class="p">)</span>
-</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a>            <span class="c1"># Update amplicon_stats with advanced metrics</span>
-</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>                <span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">],</span>
-</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>                <span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>            <span class="p">})</span>
-</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>
-</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">)</span>
-</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>
-</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>    <span class="k">def</span> <span class="nf">_calculate_advanced_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a><span class="sd">        Calculate advanced statistics, such as median-trimmed metrics.</span>
-</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>
-</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>        <span class="c1"># Copy sample signature to avoid modifying the original</span>
-</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>        <span class="n">median_trimmed_sample_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>        <span class="c1"># Trim below median</span>
-</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>        <span class="n">median_trimmed_sample_sig</span><span class="o">.</span><span class="n">trim_below_median</span><span class="p">()</span>
-</span><span id="__span-0-556"><a id="__codelineno-0-556" name="__codelineno-0-556"></a>        <span class="c1"># Get stats</span>
-</span><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a>        <span class="n">median_trimmed_sample_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a>            <span class="s2">&quot;Median-trimmed unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
-</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>            <span class="s2">&quot;Median-trimmed total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a>            <span class="s2">&quot;Median-trimmed mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a>            <span class="s2">&quot;Median-trimmed median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a>        <span class="p">})</span>
-</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a>
-</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>        <span class="c1"># Genome stats for median-trimmed sample</span>
-</span><span id="__span-0-566"><a id="__codelineno-0-566" name="__codelineno-0-566"></a>        <span class="n">median_trimmed_sample_genome</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
-</span><span id="__span-0-567"><a id="__codelineno-0-567" name="__codelineno-0-567"></a>        <span class="n">median_trimmed_sample_genome_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_genome</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-568"><a id="__codelineno-0-568" name="__codelineno-0-568"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a>            <span class="s2">&quot;Median-trimmed Genomic unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
-</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a>            <span class="s2">&quot;Median-trimmed Genomic total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a>            <span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a>            <span class="s2">&quot;Median-trimmed Genomic median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a>            <span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a>                <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
-</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-576"><a id="__codelineno-0-576" name="__codelineno-0-576"></a>            <span class="p">),</span>
-</span><span id="__span-0-577"><a id="__codelineno-0-577" name="__codelineno-0-577"></a>        <span class="p">})</span>
-</span><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a>
-</span><span id="__span-0-579"><a id="__codelineno-0-579" name="__codelineno-0-579"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-580"><a id="__codelineno-0-580" name="__codelineno-0-580"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced amplicon statistics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a>            <span class="c1"># Amplicon stats for median-trimmed sample</span>
-</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a>            <span class="n">median_trimmed_sample_amplicon</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
-</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a>            <span class="n">median_trimmed_sample_amplicon_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_amplicon</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="__span-0-585"><a id="__codelineno-0-585" name="__codelineno-0-585"></a>                <span class="s2">&quot;Median-trimmed Amplicon unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
-</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a>                <span class="s2">&quot;Median-trimmed Amplicon total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-587"><a id="__codelineno-0-587" name="__codelineno-0-587"></a>                <span class="s2">&quot;Median-trimmed Amplicon mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a>                <span class="s2">&quot;Median-trimmed Amplicon median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-589"><a id="__codelineno-0-589" name="__codelineno-0-589"></a>                <span class="s2">&quot;Median-trimmed Amplicon coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
-</span><span id="__span-0-590"><a id="__codelineno-0-590" name="__codelineno-0-590"></a>                    <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
-</span><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a>                    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a>                <span class="p">),</span>
-</span><span id="__span-0-593"><a id="__codelineno-0-593" name="__codelineno-0-593"></a>            <span class="p">})</span>
-</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a>            <span class="c1"># Additional advanced relative metrics</span>
-</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced relative metrics.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Amplicon coverage index&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">]</span>
-</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a>            <span class="p">)</span>
-</span><span id="__span-0-600"><a id="__codelineno-0-600" name="__codelineno-0-600"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
-</span><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Amplicon mean abundance&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">]</span>
-</span><span id="__span-0-602"><a id="__codelineno-0-602" name="__codelineno-0-602"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
-</span><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a>            <span class="p">)</span>
-</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a>            <span class="c1"># Update amplicon_stats with advanced metrics</span>
-</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
-</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a>                <span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">],</span>
-</span><span id="__span-0-607"><a id="__codelineno-0-607" name="__codelineno-0-607"></a>                <span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">],</span>
-</span><span id="__span-0-608"><a id="__codelineno-0-608" name="__codelineno-0-608"></a>            <span class="p">})</span>
-</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a>
-</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">)</span>
-</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a>
-</span><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a>    <span class="k">def</span> <span class="nf">split_sig_randomly</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]:</span>
-</span><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a><span class="sd">        Split the sample signature into `n` random parts based on abundances.</span>
-</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a>
-</span><span id="__span-0-616"><a id="__codelineno-0-616" name="__codelineno-0-616"></a><span class="sd">        This method distributes the k-mers of the sample signature into `n` parts using a multinomial distribution</span>
-</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a><span class="sd">        based on their abundances. Each k-mer&#39;s abundance is split across the `n` parts proportionally.</span>
-</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a>
-</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a><span class="sd">        **Mathematical Explanation**:</span>
-</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a>
-</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a><span class="sd">        For each k-mer with hash \( h \) and abundance \( a_h \), its abundance is distributed into \( n \) parts</span>
-</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a><span class="sd">        according to a multinomial distribution. Specifically, the abundance in each part \( i \) is given by:</span>
-</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a>
-</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a><span class="sd">        $$</span>
-</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a><span class="sd">        a_{h,i} \sim \text{Multinomial}(a_h, \frac{1}{n}, \frac{1}{n}, \dots, \frac{1}{n})</span>
-</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a><span class="sd">        $$</span>
-</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>
-</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a><span class="sd">        Where:</span>
-</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a><span class="sd">        - \( a_{h,i} \) is the abundance of k-mer \( h \) in part \( i \).</span>
-</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a><span class="sd">        - Each \( a_{h,i} \) is a non-negative integer such that \( \sum_{i=1}^{n} a_{h,i} = a_h \).</span>
-</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a>
-</span><span id="__span-0-632"><a id="__codelineno-0-632" name="__codelineno-0-632"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a>
-</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a><span class="sd">        - `n` (`int`): Number of parts to split into.</span>
-</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a>
-</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-637"><a id="__codelineno-0-637" name="__codelineno-0-637"></a>
-</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a><span class="sd">        - `List[SnipeSig]`:  </span>
-</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a><span class="sd">          List of `SnipeSig` instances representing the split parts.</span>
-</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a>
-</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a><span class="sd">        **Usage Example**:</span>
-</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a>
-</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a><span class="sd">        ```python</span>
-</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a><span class="sd">        split_sigs = qc.split_sig_randomly(n=3)</span>
-</span><span id="__span-0-645"><a id="__codelineno-0-645" name="__codelineno-0-645"></a><span class="sd">        for idx, sig in enumerate(split_sigs, 1):</span>
-</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a><span class="sd">            print(f&quot;Signature part {idx}: {sig}&quot;)</span>
-</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a><span class="sd">        ```</span>
-</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-649"><a id="__codelineno-0-649" name="__codelineno-0-649"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Splitting sample signature into </span><span class="si">%d</span><span class="s2"> random parts.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a>        <span class="c1"># Get k-mers and abundances</span>
-</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a>        <span class="n">hash_to_abund</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
-</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a>        <span class="n">random_split_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">distribute_kmers_random</span><span class="p">(</span><span class="n">hash_to_abund</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a>        <span class="n">split_sigs</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a>            <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">kmer_dict</span><span class="o">.</span><span class="n">keys</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
-</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">kmer_dict</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
-</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a>                <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a>                <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a>                <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">name</span><span class="si">}</span><span class="s2">_part_</span><span class="si">{</span><span class="n">i</span><span class="o">+</span><span class="mi">1</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a>                <span class="n">filename</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">filename</span><span class="p">,</span>
-</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
-</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a>            <span class="p">)</span>
-</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a>            <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">kmer_dict</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">random_split_sigs</span><span class="p">)</span>
-</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a>        <span class="p">]</span>
-</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a>        <span class="k">return</span> <span class="n">split_sigs</span>
-</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a>
-</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>    <span class="k">def</span> <span class="nf">distribute_kmers_random</span><span class="p">(</span><span class="n">original_dict</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">],</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">Dict</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]:</span>
-</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a><span class="sd">        Distribute the k-mers randomly into `n` parts based on their abundances.</span>
-</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a>
-</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a><span class="sd">        This helper method performs the actual distribution of k-mers using a multinomial distribution.</span>
-</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>
-</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a><span class="sd">        **Mathematical Explanation**:</span>
-</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>
-</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a><span class="sd">        Given a k-mer with hash \( h \) and abundance \( a_h \), the distribution of its abundance across \( n \)</span>
-</span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a><span class="sd">        parts is modeled as:</span>
+</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a><span class="sd">        - `include_advanced (bool)`:  </span>
+</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a><span class="sd">          If set to `True`, includes advanced metrics in the aggregated statistics.</span>
+</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>
+</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a><span class="sd">        **Returns**</span>
+</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>
+</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a><span class="sd">        - `Dict[str, Any]`:  </span>
+</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a><span class="sd">          A dictionary containing the aggregated statistics, which may include:</span>
+</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a><span class="sd">          - Sample statistics</span>
+</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a><span class="sd">          - Genome statistics</span>
+</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a><span class="sd">          - Amplicon statistics (if provided)</span>
+</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a><span class="sd">          - Predicted assay type</span>
+</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a><span class="sd">          - Advanced statistics (if `include_advanced` is `True`)</span>
+</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>        <span class="n">aggregated_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>        <span class="c1"># Include sample_stats</span>
+</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">)</span>
+</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>        <span class="c1"># Include genome_stats</span>
+</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">)</span>
+</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>        <span class="c1"># Include amplicon_stats if available</span>
+</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;While aggregating stats; amplicon signature provided.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">)</span>
+</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>            <span class="n">aggregated_stats</span><span class="p">[</span><span class="s2">&quot;Predicted Assay Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span>
+</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">:</span>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">)</span>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">:</span>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">)</span>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>
+</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="p">:</span>
+</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="p">)</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>        <span class="c1"># Include advanced_stats if requested</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>        <span class="k">if</span> <span class="n">include_advanced</span><span class="p">:</span>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_advanced_stats</span><span class="p">()</span>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">)</span>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>
+</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">predicted_error_contamination_index</span><span class="p">:</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>            <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">predicted_error_contamination_index</span><span class="p">)</span>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>        <span class="k">return</span> <span class="n">aggregated_stats</span>
+</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>
+</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>    <span class="k">def</span> <span class="nf">_calculate_advanced_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a><span class="sd">        Calculate advanced statistics, such as median-trimmed metrics.</span>
+</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a>
+</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a>        <span class="c1"># Copy sample signature to avoid modifying the original</span>
+</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a>        <span class="n">median_trimmed_sample_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a>        <span class="c1"># Trim below median</span>
+</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a>        <span class="n">median_trimmed_sample_sig</span><span class="o">.</span><span class="n">trim_below_median</span><span class="p">()</span>
+</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a>        <span class="c1"># Get stats</span>
+</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>        <span class="n">median_trimmed_sample_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a>            <span class="s2">&quot;Median-trimmed unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
+</span><span id="__span-0-535"><a id="__codelineno-0-535" name="__codelineno-0-535"></a>            <span class="s2">&quot;Median-trimmed total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a>            <span class="s2">&quot;Median-trimmed mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a>            <span class="s2">&quot;Median-trimmed median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a>        <span class="p">})</span>
+</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>
+</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>        <span class="c1"># Genome stats for median-trimmed sample</span>
+</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>        <span class="n">median_trimmed_sample_genome</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
+</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>        <span class="n">median_trimmed_sample_genome_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_genome</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>            <span class="s2">&quot;Median-trimmed Genomic unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
+</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>            <span class="s2">&quot;Median-trimmed Genomic total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>            <span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a>            <span class="s2">&quot;Median-trimmed Genomic median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a>            <span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a>                <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
+</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>            <span class="p">),</span>
+</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>        <span class="p">})</span>
+</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>
+</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced amplicon statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-556"><a id="__codelineno-0-556" name="__codelineno-0-556"></a>            <span class="c1"># Amplicon stats for median-trimmed sample</span>
+</span><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a>            <span class="n">median_trimmed_sample_amplicon</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
+</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a>            <span class="n">median_trimmed_sample_amplicon_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_amplicon</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>                <span class="s2">&quot;Median-trimmed Amplicon unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
+</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a>                <span class="s2">&quot;Median-trimmed Amplicon total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a>                <span class="s2">&quot;Median-trimmed Amplicon mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a>                <span class="s2">&quot;Median-trimmed Amplicon median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a>                <span class="s2">&quot;Median-trimmed Amplicon coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>                    <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
+</span><span id="__span-0-566"><a id="__codelineno-0-566" name="__codelineno-0-566"></a>                    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-567"><a id="__codelineno-0-567" name="__codelineno-0-567"></a>                <span class="p">),</span>
+</span><span id="__span-0-568"><a id="__codelineno-0-568" name="__codelineno-0-568"></a>            <span class="p">})</span>
+</span><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a>            <span class="c1"># Additional advanced relative metrics</span>
+</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced relative metrics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Amplicon coverage index&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">]</span>
+</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a>            <span class="p">)</span>
+</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-576"><a id="__codelineno-0-576" name="__codelineno-0-576"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Amplicon mean abundance&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">]</span>
+</span><span id="__span-0-577"><a id="__codelineno-0-577" name="__codelineno-0-577"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a>            <span class="p">)</span>
+</span><span id="__span-0-579"><a id="__codelineno-0-579" name="__codelineno-0-579"></a>            <span class="c1"># Update amplicon_stats with advanced metrics</span>
+</span><span id="__span-0-580"><a id="__codelineno-0-580" name="__codelineno-0-580"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a>                <span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">],</span>
+</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a>                <span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a>            <span class="p">})</span>
+</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a>
+</span><span id="__span-0-585"><a id="__codelineno-0-585" name="__codelineno-0-585"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">)</span>
+</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a>
+</span><span id="__span-0-587"><a id="__codelineno-0-587" name="__codelineno-0-587"></a>    <span class="k">def</span> <span class="nf">_calculate_advanced_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-589"><a id="__codelineno-0-589" name="__codelineno-0-589"></a><span class="sd">        Calculate advanced statistics, such as median-trimmed metrics.</span>
+</span><span id="__span-0-590"><a id="__codelineno-0-590" name="__codelineno-0-590"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a>
+</span><span id="__span-0-593"><a id="__codelineno-0-593" name="__codelineno-0-593"></a>        <span class="c1"># Copy sample signature to avoid modifying the original</span>
+</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a>        <span class="n">median_trimmed_sample_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a>        <span class="c1"># Trim below median</span>
+</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a>        <span class="n">median_trimmed_sample_sig</span><span class="o">.</span><span class="n">trim_below_median</span><span class="p">()</span>
+</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a>        <span class="c1"># Get stats</span>
+</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a>        <span class="n">median_trimmed_sample_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-600"><a id="__codelineno-0-600" name="__codelineno-0-600"></a>            <span class="s2">&quot;Median-trimmed unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
+</span><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a>            <span class="s2">&quot;Median-trimmed total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-602"><a id="__codelineno-0-602" name="__codelineno-0-602"></a>            <span class="s2">&quot;Median-trimmed mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a>            <span class="s2">&quot;Median-trimmed median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a>        <span class="p">})</span>
+</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a>
+</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a>        <span class="c1"># Genome stats for median-trimmed sample</span>
+</span><span id="__span-0-607"><a id="__codelineno-0-607" name="__codelineno-0-607"></a>        <span class="n">median_trimmed_sample_genome</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
+</span><span id="__span-0-608"><a id="__codelineno-0-608" name="__codelineno-0-608"></a>        <span class="n">median_trimmed_sample_genome_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_genome</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a>            <span class="s2">&quot;Median-trimmed Genomic unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
+</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a>            <span class="s2">&quot;Median-trimmed Genomic total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a>            <span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a>            <span class="s2">&quot;Median-trimmed Genomic median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a>            <span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a>                <span class="n">median_trimmed_sample_genome_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
+</span><span id="__span-0-616"><a id="__codelineno-0-616" name="__codelineno-0-616"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">genome_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a>            <span class="p">),</span>
+</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a>        <span class="p">})</span>
+</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a>
+</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced amplicon statistics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a>            <span class="c1"># Amplicon stats for median-trimmed sample</span>
+</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a>            <span class="n">median_trimmed_sample_amplicon</span> <span class="o">=</span> <span class="n">median_trimmed_sample_sig</span> <span class="o">&amp;</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
+</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a>            <span class="n">median_trimmed_sample_amplicon_stats</span> <span class="o">=</span> <span class="n">median_trimmed_sample_amplicon</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a>                <span class="s2">&quot;Median-trimmed Amplicon unique k-mers&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">],</span>
+</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>                <span class="s2">&quot;Median-trimmed Amplicon total abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a>                <span class="s2">&quot;Median-trimmed Amplicon mean abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a>                <span class="s2">&quot;Median-trimmed Amplicon median abundance&quot;</span><span class="p">:</span> <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a>                <span class="s2">&quot;Median-trimmed Amplicon coverage index&quot;</span><span class="p">:</span> <span class="p">(</span>
+</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a>                    <span class="n">median_trimmed_sample_amplicon_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span>
+</span><span id="__span-0-632"><a id="__codelineno-0-632" name="__codelineno-0-632"></a>                    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig_stats</span><span class="p">[</span><span class="s2">&quot;num_hashes&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a>                <span class="p">),</span>
+</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a>            <span class="p">})</span>
+</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a>            <span class="c1"># Additional advanced relative metrics</span>
+</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating advanced relative metrics.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-637"><a id="__codelineno-0-637" name="__codelineno-0-637"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Amplicon coverage index&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">]</span>
+</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genome coverage index&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a>            <span class="p">)</span>
+</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Amplicon mean abundance&quot;</span><span class="p">]</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">]</span>
+</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a>                <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed Genomic mean abundance&quot;</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mi">0</span>
+</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a>            <span class="p">)</span>
+</span><span id="__span-0-645"><a id="__codelineno-0-645" name="__codelineno-0-645"></a>            <span class="c1"># Update amplicon_stats with advanced metrics</span>
+</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a>                <span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative coverage&quot;</span><span class="p">],</span>
+</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a>                <span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">[</span><span class="s2">&quot;Median-trimmed relative mean abundance&quot;</span><span class="p">],</span>
+</span><span id="__span-0-649"><a id="__codelineno-0-649" name="__codelineno-0-649"></a>            <span class="p">})</span>
+</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a>
+</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">)</span>
+</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a>
+</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a>    <span class="k">def</span> <span class="nf">split_sig_randomly</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]:</span>
+</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="sd">        Split the sample signature into `n` random parts based on abundances.</span>
+</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a>
+</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a><span class="sd">        This method distributes the k-mers of the sample signature into `n` parts using a multinomial distribution</span>
+</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a><span class="sd">        based on their abundances. Each k-mer&#39;s abundance is split across the `n` parts proportionally.</span>
+</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a>
+</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a>
+</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a><span class="sd">        For each k-mer with hash \( h \) and abundance \( a_h \), its abundance is distributed into \( n \) parts</span>
+</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a><span class="sd">        according to a multinomial distribution. Specifically, the abundance in each part \( i \) is given by:</span>
+</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a>
+</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a><span class="sd">        $$</span>
+</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a><span class="sd">        a_{h,i} \sim \text{Multinomial}(a_h, \frac{1}{n}, \frac{1}{n}, \dots, \frac{1}{n})</span>
+</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a><span class="sd">        $$</span>
+</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>
+</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a><span class="sd">        Where:</span>
+</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a><span class="sd">        - \( a_{h,i} \) is the abundance of k-mer \( h \) in part \( i \).</span>
+</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a><span class="sd">        - Each \( a_{h,i} \) is a non-negative integer such that \( \sum_{i=1}^{n} a_{h,i} = a_h \).</span>
+</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a>
+</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>
+</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a><span class="sd">        - `n` (`int`): Number of parts to split into.</span>
+</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>
+</span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a><span class="sd">        **Returns**:</span>
 </span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>
-</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a><span class="sd">        $$</span>
-</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a><span class="sd">        a_{h,1}, a_{h,2}, \dots, a_{h,n} \sim \text{Multinomial}(a_h, p_1, p_2, \dots, p_n)</span>
-</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a><span class="sd">        $$</span>
-</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>
-</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a><span class="sd">        Where \( p_i = \frac{1}{n} \) for all \( i \).</span>
-</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>
-</span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>
-</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a><span class="sd">        - `original_dict` (`Dict[int, int]`):  </span>
-</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a><span class="sd">          Dictionary mapping k-mer hashes to their abundances.</span>
-</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a><span class="sd">        - `n` (`int`): Number of parts to split into.</span>
-</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>
-</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>
-</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a><span class="sd">        - `List[Dict[int, int]]`:  </span>
-</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a><span class="sd">          List of dictionaries, each mapping k-mer hashes to their abundances in that part.</span>
-</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>
-</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a><span class="sd">        **Usage Example**:</span>
+</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a><span class="sd">        - `List[SnipeSig]`:  </span>
+</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a><span class="sd">          List of `SnipeSig` instances representing the split parts.</span>
+</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>
+</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a><span class="sd">        **Usage Example**:</span>
+</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>
+</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a><span class="sd">        ```python</span>
+</span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a><span class="sd">        split_sigs = qc.split_sig_randomly(n=3)</span>
+</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a><span class="sd">        for idx, sig in enumerate(split_sigs, 1):</span>
+</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a><span class="sd">            print(f&quot;Signature part {idx}: {sig}&quot;)</span>
+</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a><span class="sd">        ```</span>
+</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Attempting to split sample signature into </span><span class="si">%d</span><span class="s2"> random parts.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a>
+</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>        <span class="c1"># Check if the split for this n is already cached</span>
+</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>        <span class="k">if</span> <span class="n">n</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_split_cache</span><span class="p">:</span>
+</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using cached split signatures for n=</span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>            <span class="c1"># Return deep copies to prevent external modifications</span>
+</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a>            <span class="k">return</span> <span class="p">[</span><span class="n">sig</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span> <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_split_cache</span><span class="p">[</span><span class="n">n</span><span class="p">]]</span>
 </span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a>
-</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a><span class="sd">        ```python</span>
-</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a><span class="sd">        distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)</span>
-</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a><span class="sd">        ```</span>
-</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a>        <span class="c1"># Initialize the resulting dictionaries</span>
-</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>        <span class="n">distributed_dicts</span> <span class="o">=</span> <span class="p">[{}</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">)]</span>
-</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a>
-</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>        <span class="c1"># For each k-mer and its abundance</span>
-</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a>        <span class="k">for</span> <span class="n">kmer_hash</span><span class="p">,</span> <span class="n">abundance</span> <span class="ow">in</span> <span class="n">original_dict</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a>            <span class="k">if</span> <span class="n">abundance</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a>                <span class="k">continue</span>  <span class="c1"># Skip zero abundances</span>
-</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>            <span class="c1"># Generate multinomial split of abundance</span>
-</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>            <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">multinomial</span><span class="p">(</span><span class="n">abundance</span><span class="p">,</span> <span class="p">[</span><span class="mf">1.0</span> <span class="o">/</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>            <span class="c1"># Update each dictionary</span>
-</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
-</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a>                <span class="k">if</span> <span class="n">counts</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a>                    <span class="n">distributed_dicts</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="n">kmer_hash</span><span class="p">]</span> <span class="o">=</span> <span class="n">counts</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a>
-</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a>        <span class="k">return</span> <span class="n">distributed_dicts</span>
-</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a>
-</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a>    <span class="k">def</span> <span class="nf">calculate_coverage_vs_depth</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">30</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]:</span>
-</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a><span class="sd">        Calculate cumulative coverage index vs cumulative sequencing depth.</span>
-</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a>
-</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a><span class="sd">        This method simulates incremental sequencing by splitting the sample signature into `n` parts and</span>
-</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a><span class="sd">        calculating the cumulative coverage index at each step. It helps in understanding how coverage</span>
-</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a><span class="sd">        improves with increased sequencing depth.</span>
+</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No cached splits found for n=</span><span class="si">%d</span><span class="s2">. Proceeding to split.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a>        <span class="c1"># Get k-mers and abundances</span>
+</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a>        <span class="n">hash_to_abund</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
+</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a>        <span class="n">random_split_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">distribute_kmers_random</span><span class="p">(</span><span class="n">hash_to_abund</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a>        <span class="n">split_sigs</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>            <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">kmer_dict</span><span class="o">.</span><span class="n">keys</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
+</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">kmer_dict</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
+</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a>                <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a>                <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a>                <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">name</span><span class="si">}</span><span class="s2">_part_</span><span class="si">{</span><span class="n">i</span><span class="o">+</span><span class="mi">1</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>                <span class="n">filename</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
+</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>            <span class="p">)</span>
+</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a>            <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">kmer_dict</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">random_split_sigs</span><span class="p">)</span>
+</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a>        <span class="p">]</span>
+</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a>
+</span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a>        <span class="c1"># Cache the split signatures</span>
+</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_split_cache</span><span class="p">[</span><span class="n">n</span><span class="p">]</span> <span class="o">=</span> <span class="n">split_sigs</span>
+</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Cached split signatures for n=</span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a>
+</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>        <span class="k">return</span> <span class="n">split_sigs</span>
+</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a>
+</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a>    <span class="k">def</span> <span class="nf">distribute_kmers_random</span><span class="p">(</span><span class="n">original_dict</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">],</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">Dict</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]:</span>
+</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a><span class="sd">        Distribute the k-mers randomly into `n` parts based on their abundances.</span>
 </span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a>
-</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a><span class="sd">        This helper method performs the actual distribution of k-mers using a multinomial distribution.</span>
 </span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a>
-</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a><span class="sd">        For each cumulative part \( i \) (where \( 1 \leq i \leq n \)):</span>
+</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a><span class="sd">        **Mathematical Explanation**:</span>
 </span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a>
-</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a><span class="sd">        - **Cumulative Sequencing Depth** (\( D_i \)):</span>
-</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a><span class="sd">          $$</span>
-</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a><span class="sd">          D_i = \sum_{j=1}^{i} a_j</span>
-</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a><span class="sd">          $$</span>
-</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a><span class="sd">          Where \( a_j \) is the total abundance of the \( j^{th} \) part.</span>
-</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a>
-</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a><span class="sd">        - **Cumulative Coverage Index** (\( C_i \)):</span>
-</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a><span class="sd">          $$</span>
-</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a><span class="sd">          C_i = \frac{\text{Number of genomic unique k-mers in first } i \text{ parts}}{\left| \text{Reference genome k-mer set} \right|}</span>
-</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a><span class="sd">          $$</span>
+</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a><span class="sd">        Given a k-mer with hash \( h \) and abundance \( a_h \), the distribution of its abundance across \( n \)</span>
+</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a><span class="sd">        parts is modeled as:</span>
+</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a>
+</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a><span class="sd">        $$</span>
+</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a><span class="sd">        a_{h,1}, a_{h,2}, \dots, a_{h,n} \sim \text{Multinomial}(a_h, p_1, p_2, \dots, p_n)</span>
+</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a><span class="sd">        $$</span>
+</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a>
+</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a><span class="sd">        Where \( p_i = \frac{1}{n} \) for all \( i \).</span>
+</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a>
+</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a><span class="sd">        **Parameters**:</span>
 </span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a>
-</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a>
-</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a><span class="sd">        - `n` (`int`): Number of parts to split the signature into.</span>
+</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a><span class="sd">        - `original_dict` (`Dict[int, int]`):  </span>
+</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a><span class="sd">          Dictionary mapping k-mer hashes to their abundances.</span>
+</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a><span class="sd">        - `n` (`int`): Number of parts to split into.</span>
 </span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a>
 </span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a><span class="sd">        **Returns**:</span>
 </span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a>
-</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a><span class="sd">        - `List[Dict[str, Any]]`:  </span>
-</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a><span class="sd">          List of dictionaries containing:</span>
-</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a><span class="sd">            - `&quot;cumulative_parts&quot;` (`int`): Number of parts included.</span>
-</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a><span class="sd">            - `&quot;cumulative_total_abundance&quot;` (`int`): Total sequencing depth up to this part.</span>
-</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a><span class="sd">            - `&quot;cumulative_coverage_index&quot;` (`float`): Coverage index up to this part.</span>
-</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a>
-</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a><span class="sd">        **Usage Example**:</span>
-</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a>
-</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a><span class="sd">        ```python</span>
-</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a><span class="sd">        coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)</span>
-</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a><span class="sd">        for data in coverage_depth_data:</span>
-</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a><span class="sd">            print(data)</span>
-</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a><span class="sd">        ```</span>
-</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating coverage vs depth with </span><span class="si">%d</span><span class="s2"> parts.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>        <span class="c1"># Determine the ROI reference signature</span>
-</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
-</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a>            <span class="n">roi_reference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
-</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using amplicon signature as ROI reference.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>            <span class="n">roi_reference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
-</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using reference genome signature as ROI reference.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a><span class="sd">        - `List[Dict[int, int]]`:  </span>
+</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a><span class="sd">          List of dictionaries, each mapping k-mer hashes to their abundances in that part.</span>
+</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a>
+</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a><span class="sd">        **Usage Example**:</span>
+</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a>
+</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a><span class="sd">        ```python</span>
+</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a><span class="sd">        distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)</span>
+</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a><span class="sd">        ```</span>
+</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a>        <span class="c1"># Initialize the resulting dictionaries</span>
+</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a>        <span class="n">distributed_dicts</span> <span class="o">=</span> <span class="p">[{}</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">)]</span>
+</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a>
+</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a>        <span class="c1"># For each k-mer and its abundance</span>
+</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a>        <span class="k">for</span> <span class="n">kmer_hash</span><span class="p">,</span> <span class="n">abundance</span> <span class="ow">in</span> <span class="n">original_dict</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a>            <span class="k">if</span> <span class="n">abundance</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>                <span class="k">continue</span>  <span class="c1"># Skip zero abundances</span>
+</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a>            <span class="c1"># Generate multinomial split of abundance</span>
+</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a>            <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">multinomial</span><span class="p">(</span><span class="n">abundance</span><span class="p">,</span> <span class="p">[</span><span class="mf">1.0</span> <span class="o">/</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a>            <span class="c1"># Update each dictionary</span>
+</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a>            <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
+</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>                <span class="k">if</span> <span class="n">counts</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a>                    <span class="n">distributed_dicts</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="n">kmer_hash</span><span class="p">]</span> <span class="o">=</span> <span class="n">counts</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
 </span><span id="__span-0-769"><a id="__codelineno-0-769" name="__codelineno-0-769"></a>
-</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a>        <span class="c1"># Split the sample signature into n random parts</span>
-</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a>        <span class="n">split_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">split_sig_randomly</span><span class="p">(</span><span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a>
-</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a>        <span class="n">coverage_depth_data</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a>
-</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a>        <span class="n">cumulative_snipe_sig</span> <span class="o">=</span> <span class="n">split_sigs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a>        <span class="n">cumulative_total_abundance</span> <span class="o">=</span> <span class="n">cumulative_snipe_sig</span><span class="o">.</span><span class="n">total_abundance</span>
-</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a>
-</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a>        <span class="c1">#! force conversion to GENOME</span>
-</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a>        <span class="n">roi_reference_sig</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span>
-</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a>
-</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a>        <span class="c1"># Compute initial coverage index</span>
-</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a>        <span class="n">cumulative_qc</span> <span class="o">=</span> <span class="n">ReferenceQC</span><span class="p">(</span>
-</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a>            <span class="n">sample_sig</span><span class="o">=</span><span class="n">cumulative_snipe_sig</span><span class="p">,</span>
-</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a>            <span class="n">reference_sig</span><span class="o">=</span><span class="n">roi_reference_sig</span><span class="p">,</span>
-</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
-</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a>        <span class="p">)</span>
-</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a>        <span class="n">cumulative_stats</span> <span class="o">=</span> <span class="n">cumulative_qc</span><span class="o">.</span><span class="n">get_aggregated_stats</span><span class="p">()</span>
-</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a>        <span class="n">cumulative_coverage_index</span> <span class="o">=</span> <span class="n">cumulative_stats</span><span class="p">[</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">]</span>
+</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a>        <span class="k">return</span> <span class="n">distributed_dicts</span>
+</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a>
+</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a>    <span class="k">def</span> <span class="nf">calculate_coverage_vs_depth</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">30</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]:</span>
+</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a><span class="sd">        Calculate cumulative coverage index vs cumulative sequencing depth.</span>
+</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a>
+</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a><span class="sd">        This method simulates incremental sequencing by splitting the sample signature into `n` parts and</span>
+</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a><span class="sd">        calculating the cumulative coverage index at each step. It helps in understanding how coverage</span>
+</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a><span class="sd">        improves with increased sequencing depth.</span>
+</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a>
+</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a>
+</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a><span class="sd">        For each cumulative part \( i \) (where \( 1 \leq i \leq n \)):</span>
+</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a>
+</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a><span class="sd">        - **Cumulative Sequencing Depth** (\( D_i \)):</span>
+</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a><span class="sd">          $$</span>
+</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a><span class="sd">          D_i = \sum_{j=1}^{i} a_j</span>
+</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a><span class="sd">          $$</span>
+</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a><span class="sd">          Where \( a_j \) is the total abundance of the \( j^{th} \) part.</span>
 </span><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a>
-</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a>        <span class="n">coverage_depth_data</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a>            <span class="s2">&quot;cumulative_parts&quot;</span><span class="p">:</span> <span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a>            <span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">:</span> <span class="n">cumulative_total_abundance</span><span class="p">,</span>
-</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>            <span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">:</span> <span class="n">cumulative_coverage_index</span><span class="p">,</span>
-</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>        <span class="p">})</span>
-</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a>
-</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a>        <span class="c1"># Iterate over the rest of the parts</span>
-</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a>        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
-</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a>            <span class="n">current_part</span> <span class="o">=</span> <span class="n">split_sigs</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a>
-</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a>            <span class="c1"># Add current part to cumulative signature</span>
-</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a>            <span class="n">cumulative_snipe_sig</span> <span class="o">+=</span> <span class="n">current_part</span>
-</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a>            <span class="n">cumulative_total_abundance</span> <span class="o">+=</span> <span class="n">current_part</span><span class="o">.</span><span class="n">total_abundance</span>
-</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a>
-</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a>            <span class="c1"># Compute new coverage index</span>
-</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a>            <span class="n">cumulative_qc</span> <span class="o">=</span> <span class="n">ReferenceQC</span><span class="p">(</span>
-</span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>                <span class="n">sample_sig</span><span class="o">=</span><span class="n">cumulative_snipe_sig</span><span class="p">,</span>
-</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a>                <span class="n">reference_sig</span><span class="o">=</span><span class="n">roi_reference_sig</span><span class="p">,</span>
-</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
-</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a>            <span class="p">)</span>
-</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a>            <span class="n">cumulative_stats</span> <span class="o">=</span> <span class="n">cumulative_qc</span><span class="o">.</span><span class="n">get_aggregated_stats</span><span class="p">()</span>
-</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>            <span class="n">cumulative_coverage_index</span> <span class="o">=</span> <span class="n">cumulative_stats</span><span class="p">[</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">]</span>
-</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a>
-</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a>            <span class="n">coverage_depth_data</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a>                <span class="s2">&quot;cumulative_parts&quot;</span><span class="p">:</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a>                <span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">:</span> <span class="n">cumulative_total_abundance</span><span class="p">,</span>
-</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a>                <span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">:</span> <span class="n">cumulative_coverage_index</span><span class="p">,</span>
-</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a>            <span class="p">})</span>
-</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>
-</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Coverage vs depth calculation completed.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>        <span class="k">return</span> <span class="n">coverage_depth_data</span>
-</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a>
-</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>    <span class="k">def</span> <span class="nf">predict_coverage</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">30</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a><span class="sd">        Predict the coverage index if additional sequencing is performed.</span>
-</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a>
-</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a><span class="sd">        This method estimates the potential increase in the genome coverage index when the sequencing depth</span>
-</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a><span class="sd">        is increased by a specified fold (extra sequencing). It does so by:</span>
+</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a><span class="sd">        - **Cumulative Coverage Index** (\( C_i \)):</span>
+</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a><span class="sd">          $$</span>
+</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a><span class="sd">          C_i = \frac{\text{Number of genomic unique k-mers in first } i \text{ parts}}{\left| \text{Reference genome k-mer set} \right|}</span>
+</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a><span class="sd">          $$</span>
+</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>
+</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a>
+</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a><span class="sd">        - `n` (`int`): Number of parts to split the signature into.</span>
+</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a>
+</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a>
+</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a><span class="sd">        - `List[Dict[str, Any]]`:  </span>
+</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a><span class="sd">          List of dictionaries containing:</span>
+</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a><span class="sd">            - `&quot;cumulative_parts&quot;` (`int`): Number of parts included.</span>
+</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a><span class="sd">            - `&quot;cumulative_total_abundance&quot;` (`int`): Total sequencing depth up to this part.</span>
+</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a><span class="sd">            - `&quot;cumulative_coverage_index&quot;` (`float`): Coverage index up to this part.</span>
+</span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>
+</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a><span class="sd">        **Usage Example**:</span>
+</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a>
+</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a><span class="sd">        ```python</span>
+</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a><span class="sd">        coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)</span>
+</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a><span class="sd">        for data in coverage_depth_data:</span>
+</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a><span class="sd">            print(data)</span>
+</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a><span class="sd">        ```</span>
+</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating coverage vs depth with </span><span class="si">%d</span><span class="s2"> parts.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a>        <span class="c1"># Determine the ROI reference signature</span>
+</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
+</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>            <span class="n">roi_reference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
+</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using amplicon signature as ROI reference.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a>            <span class="n">roi_reference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
+</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using reference genome signature as ROI reference.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a>
+</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a>        <span class="c1"># Split the sample signature into n random parts (cached if available)</span>
+</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a>        <span class="n">split_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">split_sig_randomly</span><span class="p">(</span><span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a>
+</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a>        <span class="n">coverage_depth_data</span> <span class="o">=</span> <span class="p">[]</span>
 </span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a>
-</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a><span class="sd">        1. **Cumulative Coverage Calculation**:</span>
-</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a><span class="sd">        - Splitting the sample signature into `n` random parts to simulate incremental sequencing data.</span>
-</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a><span class="sd">        - Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.</span>
+</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">split_sigs</span><span class="p">:</span>
+</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;No split signatures available. Cannot calculate coverage vs depth.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a>            <span class="k">return</span> <span class="n">coverage_depth_data</span>
 </span><span id="__span-0-832"><a id="__codelineno-0-832" name="__codelineno-0-832"></a>
-</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a><span class="sd">        2. **Saturation Curve Fitting**:</span>
-</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a><span class="sd">        - Modeling the relationship between cumulative coverage and cumulative sequencing depth using</span>
-</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a><span class="sd">            a hyperbolic saturation function.</span>
-</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a><span class="sd">        - The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.</span>
-</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a>
-</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a><span class="sd">        3. **Coverage Prediction**:</span>
-</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a><span class="sd">        - Using the fitted model to predict the coverage index at an increased sequencing depth (current depth</span>
-</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a><span class="sd">            multiplied by `1 + extra_fold`).</span>
-</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>
-</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a><span class="sd">        **Mathematical Explanation**:</span>
-</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a>
-</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a><span class="sd">        - **Saturation Model**:</span>
-</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a><span class="sd">        The coverage index \( C \) as a function of sequencing depth \( D \) is modeled using the function:</span>
-</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a>
-</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a><span class="sd">        $$</span>
-</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a><span class="sd">        C(D) = \frac{a \cdot D}{b + D}</span>
-</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a><span class="sd">        $$</span>
-</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>
-</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a><span class="sd">        Where:</span>
-</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a><span class="sd">        - \( a \) and \( b \) are parameters estimated from the data.</span>
-</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a><span class="sd">        - \( D \) is the cumulative sequencing depth (total abundance).</span>
-</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a><span class="sd">        - \( C(D) \) is the cumulative coverage index at depth \( D \).</span>
+</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a>        <span class="n">cumulative_snipe_sig</span> <span class="o">=</span> <span class="n">split_sigs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a>        <span class="n">cumulative_total_abundance</span> <span class="o">=</span> <span class="n">cumulative_snipe_sig</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a>
+</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a>        <span class="c1"># Force conversion to GENOME</span>
+</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a>        <span class="n">roi_reference_sig</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span>
+</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a>
+</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a>        <span class="c1"># Compute initial coverage index</span>
+</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a>        <span class="n">cumulative_qc</span> <span class="o">=</span> <span class="n">ReferenceQC</span><span class="p">(</span>
+</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>            <span class="n">sample_sig</span><span class="o">=</span><span class="n">cumulative_snipe_sig</span><span class="p">,</span>
+</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a>            <span class="n">reference_sig</span><span class="o">=</span><span class="n">roi_reference_sig</span><span class="p">,</span>
+</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
+</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a>        <span class="p">)</span>
+</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a>        <span class="n">cumulative_stats</span> <span class="o">=</span> <span class="n">cumulative_qc</span><span class="o">.</span><span class="n">get_aggregated_stats</span><span class="p">()</span>
+</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a>        <span class="n">cumulative_coverage_index</span> <span class="o">=</span> <span class="n">cumulative_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a>
+</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a>        <span class="n">coverage_depth_data</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a>            <span class="s2">&quot;cumulative_parts&quot;</span><span class="p">:</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>            <span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">:</span> <span class="n">cumulative_total_abundance</span><span class="p">,</span>
+</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a>            <span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">:</span> <span class="n">cumulative_coverage_index</span><span class="p">,</span>
+</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a>        <span class="p">})</span>
+</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a>
+</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Added initial coverage depth data for part 1.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a>
-</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a><span class="sd">        - **Parameter Estimation**:</span>
-</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a><span class="sd">        The parameters \( a \) and \( b \) are determined by fitting the model to the observed cumulative</span>
-</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a><span class="sd">        coverage and depth data using non-linear least squares optimization.</span>
+</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a>        <span class="c1"># Iterate over the rest of the parts</span>
+</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a>        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
+</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a>            <span class="n">current_part</span> <span class="o">=</span> <span class="n">split_sigs</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
 </span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a>
-</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a><span class="sd">        - **Coverage Prediction**:</span>
-</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a><span class="sd">        The predicted coverage index \( C_{\text{pred}} \) at an increased sequencing depth \( D_{\text{pred}} \)</span>
-</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a><span class="sd">        is calculated as:</span>
+</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a>            <span class="c1"># Add current part to cumulative signature</span>
+</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a>            <span class="n">cumulative_snipe_sig</span> <span class="o">+=</span> <span class="n">current_part</span>
+</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a>            <span class="n">cumulative_total_abundance</span> <span class="o">+=</span> <span class="n">current_part</span><span class="o">.</span><span class="n">total_abundance</span>
 </span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>
-</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a><span class="sd">        $$</span>
-</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a><span class="sd">        D_{\text{pred}} = D_{\text{current}} \times (1 + \text{extra\_fold})</span>
-</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a><span class="sd">        $$</span>
-</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>
-</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a><span class="sd">        $$</span>
-</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a><span class="sd">        C_{\text{pred}} = \frac{a \cdot D_{\text{pred}}}{b + D_{\text{pred}}}</span>
-</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a><span class="sd">        $$</span>
-</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>
-</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>
-</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a><span class="sd">        - `extra_fold` (*float*):  </span>
-</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a><span class="sd">          The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling</span>
-</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a><span class="sd">          the current sequencing depth.</span>
-</span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>
-</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a><span class="sd">        - `n` (*int, optional*):  </span>
-</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a><span class="sd">          The number of parts to split the sample signature into for modeling the saturation curve.</span>
-</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a><span class="sd">          Default is 30.</span>
-</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>
-</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a><span class="sd">            - `float`:  </span>
-</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a><span class="sd">              The predicted genome coverage index at the increased sequencing depth.</span>
-</span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a>
-</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a><span class="sd">            - `RuntimeError`:  </span>
-</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a><span class="sd">              If the saturation model fails to converge during curve fitting.</span>
-</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a>
-</span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a><span class="sd">        **Usage Example**:</span>
-</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a>
-</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a><span class="sd">        ```python</span>
-</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a><span class="sd">        # Create a ReferenceQC instance with sample and reference signatures</span>
-</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a><span class="sd">        qc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)</span>
-</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a>
-</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a><span class="sd">        # Predict coverage index after increasing sequencing depth by 50%</span>
-</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a><span class="sd">        predicted_coverage = qc.predict_coverage(extra_fold=0.5)</span>
-</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a>
-</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a><span class="sd">        print(f&quot;Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}&quot;)</span>
-</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a><span class="sd">        ```</span>
-</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a>
-</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a><span class="sd">        **Implementation Details**:</span>
+</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a>            <span class="c1"># Compute new coverage index</span>
+</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a>            <span class="n">cumulative_qc</span> <span class="o">=</span> <span class="n">ReferenceQC</span><span class="p">(</span>
+</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a>                <span class="n">sample_sig</span><span class="o">=</span><span class="n">cumulative_snipe_sig</span><span class="p">,</span>
+</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>                <span class="n">reference_sig</span><span class="o">=</span><span class="n">roi_reference_sig</span><span class="p">,</span>
+</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
+</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>            <span class="p">)</span>
+</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a>            <span class="n">cumulative_stats</span> <span class="o">=</span> <span class="n">cumulative_qc</span><span class="o">.</span><span class="n">get_aggregated_stats</span><span class="p">()</span>
+</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>            <span class="n">cumulative_coverage_index</span> <span class="o">=</span> <span class="n">cumulative_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a>
+</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>            <span class="n">coverage_depth_data</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a>                <span class="s2">&quot;cumulative_parts&quot;</span><span class="p">:</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a>                <span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">:</span> <span class="n">cumulative_total_abundance</span><span class="p">,</span>
+</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a>                <span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">:</span> <span class="n">cumulative_coverage_index</span><span class="p">,</span>
+</span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>            <span class="p">})</span>
+</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a>
+</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Added coverage depth data for part </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a>
+</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Coverage vs depth calculation completed.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a>        <span class="k">return</span> <span class="n">coverage_depth_data</span>
+</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a>
+</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a>    <span class="k">def</span> <span class="nf">predict_coverage</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">30</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a><span class="sd">        Predict the coverage index if additional sequencing is performed.</span>
+</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a>
+</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a><span class="sd">        This method estimates the potential increase in the genome coverage index when the sequencing depth</span>
+</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a><span class="sd">        is increased by a specified fold (extra sequencing). It does so by:</span>
+</span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a>
+</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a><span class="sd">        1. **Cumulative Coverage Calculation**:</span>
+</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a><span class="sd">        - Splitting the sample signature into `n` random parts to simulate incremental sequencing data.</span>
+</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a><span class="sd">        - Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.</span>
+</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a>
+</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a><span class="sd">        2. **Saturation Curve Fitting**:</span>
+</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a><span class="sd">        - Modeling the relationship between cumulative coverage and cumulative sequencing depth using</span>
+</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a><span class="sd">            a hyperbolic saturation function.</span>
+</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a><span class="sd">        - The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.</span>
+</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a>
+</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a><span class="sd">        3. **Coverage Prediction**:</span>
+</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a><span class="sd">        - Using the fitted model to predict the coverage index at an increased sequencing depth (current depth</span>
+</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a><span class="sd">            multiplied by `1 + extra_fold`).</span>
 </span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a>
-</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a><span class="sd">        - **Splitting the Sample Signature**:</span>
-</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a><span class="sd">            - The sample signature is split into `n` random parts using a multinomial distribution based on k-mer abundances.</span>
-</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a><span class="sd">            - Each part represents an incremental addition of sequencing data.</span>
-</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>
-</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a><span class="sd">        - **Cumulative Calculations**:</span>
-</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a><span class="sd">            - At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.</span>
-</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>
-</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a><span class="sd">        - **Curve Fitting**:</span>
-</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a><span class="sd">            - The `scipy.optimize.curve_fit` function is used to fit the saturation model to the cumulative data.</span>
-</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a><span class="sd">            - Initial parameter guesses are based on the observed data to aid convergence.</span>
-</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>        <span class="k">if</span> <span class="n">extra_fold</span> <span class="o">&lt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;extra_fold must be &gt;= 1.0.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a>
+</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a><span class="sd">        - **Saturation Model**:</span>
+</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a><span class="sd">        The coverage index \( C \) as a function of sequencing depth \( D \) is modeled using the function:</span>
+</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a>
+</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a><span class="sd">        $$</span>
+</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a><span class="sd">        C(D) = \frac{a \cdot D}{b + D}</span>
+</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a><span class="sd">        $$</span>
+</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a>
+</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a><span class="sd">        Where:</span>
+</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a><span class="sd">        - \( a \) and \( b \) are parameters estimated from the data.</span>
+</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a><span class="sd">        - \( D \) is the cumulative sequencing depth (total abundance).</span>
+</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a><span class="sd">        - \( C(D) \) is the cumulative coverage index at depth \( D \).</span>
 </span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>
-</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>        <span class="k">if</span> <span class="n">n</span> <span class="o">&lt;</span> <span class="mi">1</span> <span class="ow">or</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="nb">int</span><span class="p">):</span>
-</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;n must be a positive integer.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>
-</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicting coverage with extra fold: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">)</span>
-</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>        <span class="n">coverage_depth_data</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">calculate_coverage_vs_depth</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>
-</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>        <span class="c1"># Extract cumulative total abundance and coverage index</span>
-</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>        <span class="n">x_data</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">coverage_depth_data</span><span class="p">])</span>
-</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>        <span class="n">y_data</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">coverage_depth_data</span><span class="p">])</span>
-</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>
-</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>        <span class="c1"># Saturation model function</span>
-</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>        <span class="k">def</span> <span class="nf">saturation_model</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">):</span>
-</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>            <span class="k">return</span> <span class="n">a</span> <span class="o">*</span> <span class="n">x</span> <span class="o">/</span> <span class="p">(</span><span class="n">b</span> <span class="o">+</span> <span class="n">x</span><span class="p">)</span>
-</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>
-</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>        <span class="c1"># Initial parameter guesses</span>
-</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>        <span class="n">initial_guess</span> <span class="o">=</span> <span class="p">[</span><span class="n">y_data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span> <span class="n">x_data</span><span class="p">[</span><span class="nb">int</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">x_data</span><span class="p">)</span> <span class="o">/</span> <span class="mi">2</span><span class="p">)]]</span>
-</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>
-</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>        <span class="c1"># Fit the model to the data</span>
-</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>            <span class="k">with</span> <span class="n">warnings</span><span class="o">.</span><span class="n">catch_warnings</span><span class="p">():</span>
-</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>                <span class="n">warnings</span><span class="o">.</span><span class="n">simplefilter</span><span class="p">(</span><span class="s2">&quot;error&quot;</span><span class="p">,</span> <span class="n">OptimizeWarning</span><span class="p">)</span>
-</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>                <span class="n">params</span><span class="p">,</span> <span class="n">covariance</span> <span class="o">=</span> <span class="n">curve_fit</span><span class="p">(</span>
-</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>                    <span class="n">saturation_model</span><span class="p">,</span>
-</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>                    <span class="n">x_data</span><span class="p">,</span>
-</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>                    <span class="n">y_data</span><span class="p">,</span>
-</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>                    <span class="n">p0</span><span class="o">=</span><span class="n">initial_guess</span><span class="p">,</span>
-</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>                    <span class="n">bounds</span><span class="o">=</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">inf</span><span class="p">),</span>
-</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>                    <span class="n">maxfev</span><span class="o">=</span><span class="mi">10000</span>
-</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>                <span class="p">)</span>
-</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>        <span class="k">except</span> <span class="p">(</span><span class="ne">RuntimeError</span><span class="p">,</span> <span class="n">OptimizeWarning</span><span class="p">)</span> <span class="k">as</span> <span class="n">exc</span><span class="p">:</span>
-</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Curve fitting failed.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>            <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Saturation model fitting failed. Cannot predict coverage.&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">exc</span>
-</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>
-</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>        <span class="c1"># Check if covariance contains inf or nan</span>
-</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>        <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">isinf</span><span class="p">(</span><span class="n">covariance</span><span class="p">)</span><span class="o">.</span><span class="n">any</span><span class="p">()</span> <span class="ow">or</span> <span class="n">np</span><span class="o">.</span><span class="n">isnan</span><span class="p">(</span><span class="n">covariance</span><span class="p">)</span><span class="o">.</span><span class="n">any</span><span class="p">():</span>
-</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Covariance of parameters could not be estimated.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>            <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Saturation model fitting failed. Cannot predict coverage.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>
-</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>        <span class="n">a</span><span class="p">,</span> <span class="n">b</span> <span class="o">=</span> <span class="n">params</span>
+</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a><span class="sd">        - **Parameter Estimation**:</span>
+</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a><span class="sd">        The parameters \( a \) and \( b \) are determined by fitting the model to the observed cumulative</span>
+</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a><span class="sd">        coverage and depth data using non-linear least squares optimization.</span>
+</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>
+</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a><span class="sd">        - **Coverage Prediction**:</span>
+</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a><span class="sd">        The predicted coverage index \( C_{\text{pred}} \) at an increased sequencing depth \( D_{\text{pred}} \)</span>
+</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a><span class="sd">        is calculated as:</span>
+</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>
+</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a><span class="sd">        $$</span>
+</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a><span class="sd">        D_{\text{pred}} = D_{\text{current}} \times (1 + \text{extra\_fold})</span>
+</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a><span class="sd">        $$</span>
+</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>
+</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a><span class="sd">        $$</span>
+</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a><span class="sd">        C_{\text{pred}} = \frac{a \cdot D_{\text{pred}}}{b + D_{\text{pred}}}</span>
+</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a><span class="sd">        $$</span>
+</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>
+</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>
+</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a><span class="sd">        - `extra_fold` (*float*):  </span>
+</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a><span class="sd">          The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling</span>
+</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a><span class="sd">          the current sequencing depth.</span>
+</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>
+</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a><span class="sd">        - `n` (*int, optional*):  </span>
+</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a><span class="sd">          The number of parts to split the sample signature into for modeling the saturation curve.</span>
+</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a><span class="sd">          Default is 30.</span>
+</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>
+</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a><span class="sd">            - `float`:  </span>
+</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a><span class="sd">              The predicted genome coverage index at the increased sequencing depth.</span>
+</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>
+</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a><span class="sd">            - `RuntimeError`:  </span>
+</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a><span class="sd">              If the saturation model fails to converge during curve fitting.</span>
+</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>
+</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a><span class="sd">        **Usage Example**:</span>
+</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>
+</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a><span class="sd">        ```python</span>
+</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a><span class="sd">        # Create a ReferenceQC instance with sample and reference signatures</span>
+</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a><span class="sd">        qc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)</span>
 </span><span id="__span-0-957"><a id="__codelineno-0-957" name="__codelineno-0-957"></a>
-</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a>        <span class="c1"># Predict coverage at increased sequencing depth</span>
-</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a>        <span class="n">total_abundance</span> <span class="o">=</span> <span class="n">x_data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>        <span class="n">predicted_total_abundance</span> <span class="o">=</span> <span class="n">total_abundance</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">+</span> <span class="n">extra_fold</span><span class="p">)</span>
-</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a>        <span class="n">predicted_coverage</span> <span class="o">=</span> <span class="n">saturation_model</span><span class="p">(</span><span class="n">predicted_total_abundance</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">)</span>
-</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>
-</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>        <span class="c1"># Ensure the predicted coverage does not exceed maximum possible coverage</span>
-</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>        <span class="n">max_coverage</span> <span class="o">=</span> <span class="mf">1.0</span>  <span class="c1"># Coverage index cannot exceed 1</span>
-</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>        <span class="n">predicted_coverage</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">predicted_coverage</span><span class="p">,</span> <span class="n">max_coverage</span><span class="p">)</span>
-</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>
-</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicted coverage at </span><span class="si">%.2f</span><span class="s2">-fold increase: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">,</span> <span class="n">predicted_coverage</span><span class="p">)</span>
-</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>        <span class="k">return</span> <span class="n">predicted_coverage</span>
+</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a><span class="sd">        # Predict coverage index after increasing sequencing depth by 50%</span>
+</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a><span class="sd">        predicted_coverage = qc.predict_coverage(extra_fold=0.5)</span>
+</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>
+</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a><span class="sd">        print(f&quot;Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}&quot;)</span>
+</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a><span class="sd">        ```</span>
+</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>
+</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a><span class="sd">        **Implementation Details**:</span>
+</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>
+</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a><span class="sd">        - **Splitting the Sample Signature**:</span>
+</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a><span class="sd">            - The sample signature is split into `n` random parts using a multinomial distribution based on k-mer abundances.</span>
+</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a><span class="sd">            - Each part represents an incremental addition of sequencing data.</span>
 </span><span id="__span-0-969"><a id="__codelineno-0-969" name="__codelineno-0-969"></a>
-</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a>    <span class="k">def</span> <span class="nf">calculate_chromosome_metrics</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
-</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a><span class="sd">        Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.</span>
-</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a>
-</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a><span class="sd">        This method computes the CV to assess the variability of mean abundances among autosomal chromosomes,</span>
-</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a><span class="sd">        excluding any sex chromosomes.</span>
-</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>
-</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a><span class="sd">        **Mathematical Explanation**:</span>
-</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>
-</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a><span class="sd">        The Coefficient of Variation (CV) is defined as:</span>
-</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>
-</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a><span class="sd">        $$</span>
-</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a><span class="sd">        \text{CV} = \frac{\sigma}{\mu}</span>
-</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a><span class="sd">        $$</span>
-</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>
-</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a><span class="sd">        Where:</span>
-</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a><span class="sd">        - \( \sigma \) is the standard deviation of the mean abundances across autosomal chromosomes.</span>
-</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a><span class="sd">        - \( \mu \) is the mean of the mean abundances across autosomal chromosomes.</span>
-</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>
-</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>
-</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a><span class="sd">        - `chr_to_sig` (`Dict[str, SnipeSig]`):  </span>
-</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a><span class="sd">          A dictionary mapping chromosome names (e.g., `&#39;autosomal-1&#39;`, `&#39;autosomal-2&#39;`, `&#39;sex-x&#39;`, `&#39;sex-y&#39;`) to their corresponding</span>
-</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a><span class="sd">          `SnipeSig` instances. Each `SnipeSig` should represent the k-mer signature of a specific chromosome.</span>
-</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>
-</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a><span class="sd">        - **Cumulative Calculations**:</span>
+</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a><span class="sd">            - At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.</span>
+</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a>
+</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a><span class="sd">        - **Curve Fitting**:</span>
+</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a><span class="sd">            - The `scipy.optimize.curve_fit` function is used to fit the saturation model to the cumulative data.</span>
+</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a><span class="sd">            - Initial parameter guesses are based on the observed data to aid convergence.</span>
+</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>        <span class="k">if</span> <span class="n">extra_fold</span> <span class="o">&lt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;extra_fold must be &gt;= 1.0.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>
+</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>        <span class="k">if</span> <span class="n">n</span> <span class="o">&lt;</span> <span class="mi">1</span> <span class="ow">or</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="nb">int</span><span class="p">):</span>
+</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;n must be a positive integer.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>
+</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicting coverage with extra fold: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">)</span>
+</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>        <span class="n">coverage_depth_data</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">calculate_coverage_vs_depth</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>
+</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>        <span class="c1"># Extract cumulative total abundance and coverage index</span>
+</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>        <span class="n">x_data</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">coverage_depth_data</span><span class="p">])</span>
+</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>        <span class="n">y_data</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">coverage_depth_data</span><span class="p">])</span>
+</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>
+</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>        <span class="c1"># Saturation model function</span>
+</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a>        <span class="k">def</span> <span class="nf">saturation_model</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">):</span>
+</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a>            <span class="k">return</span> <span class="n">a</span> <span class="o">*</span> <span class="n">x</span> <span class="o">/</span> <span class="p">(</span><span class="n">b</span> <span class="o">+</span> <span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a>
+</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>        <span class="c1"># Initial parameter guesses</span>
+</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a>        <span class="n">initial_guess</span> <span class="o">=</span> <span class="p">[</span><span class="n">y_data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span> <span class="n">x_data</span><span class="p">[</span><span class="nb">int</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">x_data</span><span class="p">)</span> <span class="o">/</span> <span class="mi">2</span><span class="p">)]]</span>
 </span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>
-</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a><span class="sd">        - `Dict[str, Any]`:  </span>
-</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a><span class="sd">          A dictionary containing the computed metrics:</span>
-</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a><span class="sd">              - `&quot;Autosomal_CV&quot;` (`float`):  </span>
-</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a><span class="sd">                The coefficient of variation of mean abundances across autosomal chromosomes.</span>
-</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>
-</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a>
-</span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a><span class="sd">        - `ValueError`:  </span>
-</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a><span class="sd">          If `chr_to_sig` is empty or if there is an inconsistency in the signatures&#39; parameters.</span>
-</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>
-</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a><span class="sd">        **Usage Example**:</span>
-</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>
-</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a><span class="sd">        ```python</span>
-</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a><span class="sd">        # Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances</span>
-</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a><span class="sd">        chr_signatures = {</span>
-</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a><span class="sd">            &quot;1&quot;: sig_chr1,</span>
-</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a><span class="sd">            &quot;2&quot;: sig_chr2,</span>
-</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a><span class="sd">            &quot;X&quot;: sig_chrX,</span>
-</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a><span class="sd">            &quot;Y&quot;: sig_chrY</span>
-</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a><span class="sd">        }</span>
+</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a>        <span class="c1"># Fit the model to the data</span>
+</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a>            <span class="k">with</span> <span class="n">warnings</span><span class="o">.</span><span class="n">catch_warnings</span><span class="p">():</span>
+</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a>                <span class="n">warnings</span><span class="o">.</span><span class="n">simplefilter</span><span class="p">(</span><span class="s2">&quot;error&quot;</span><span class="p">,</span> <span class="n">OptimizeWarning</span><span class="p">)</span>
+</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>                <span class="n">params</span><span class="p">,</span> <span class="n">covariance</span> <span class="o">=</span> <span class="n">curve_fit</span><span class="p">(</span>
+</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a>                    <span class="n">saturation_model</span><span class="p">,</span>
+</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a>                    <span class="n">x_data</span><span class="p">,</span>
+</span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a>                    <span class="n">y_data</span><span class="p">,</span>
+</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a>                    <span class="n">p0</span><span class="o">=</span><span class="n">initial_guess</span><span class="p">,</span>
+</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>                    <span class="n">bounds</span><span class="o">=</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">inf</span><span class="p">),</span>
+</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a>                    <span class="n">maxfev</span><span class="o">=</span><span class="mi">10000</span>
+</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>                <span class="p">)</span>
+</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>        <span class="k">except</span> <span class="p">(</span><span class="ne">RuntimeError</span><span class="p">,</span> <span class="n">OptimizeWarning</span><span class="p">)</span> <span class="k">as</span> <span class="n">exc</span><span class="p">:</span>
+</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Curve fitting failed.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a>            <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Saturation model fitting failed. Cannot predict coverage.&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">exc</span>
+</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>
+</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a>        <span class="c1"># Check if covariance contains inf or nan</span>
+</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a>        <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">isinf</span><span class="p">(</span><span class="n">covariance</span><span class="p">)</span><span class="o">.</span><span class="n">any</span><span class="p">()</span> <span class="ow">or</span> <span class="n">np</span><span class="o">.</span><span class="n">isnan</span><span class="p">(</span><span class="n">covariance</span><span class="p">)</span><span class="o">.</span><span class="n">any</span><span class="p">():</span>
+</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Covariance of parameters could not be estimated.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>            <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Saturation model fitting failed. Cannot predict coverage.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>
-</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a><span class="sd">        # Calculate chromosome metrics</span>
-</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a><span class="sd">        metrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)</span>
-</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>
-</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a><span class="sd">        print(metrics)</span>
-</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a><span class="sd">        # Output:</span>
-</span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a><span class="sd">        # {&#39;Autosomal_CV&#39;: 0.15}</span>
-</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a><span class="sd">        ```</span>
-</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>
-</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a><span class="sd">        **Notes**:</span>
-</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>
-</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a><span class="sd">        - **Exclusion of Sex Chromosomes**:  </span>
-</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a><span class="sd">          Chromosomes with names containing the substring `&quot;sex&quot;` (e.g., `&#39;sex-y&#39;`, `&#39;sex-x&#39;`) are excluded from the CV calculation to focus solely on autosomal chromosomes.</span>
-</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>
-</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a><span class="sd">        - **Mean Abundance Calculation**:  </span>
-</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a><span class="sd">          The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.</span>
-</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a>
-</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>        <span class="c1"># Implementation of the method</span>
-</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>        <span class="c1"># let&#39;s make sure all chromosome sigs are unique</span>
-</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>        <span class="n">specific_chr_to_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">get_unique_signatures</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="p">)</span>
+</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>        <span class="n">a</span><span class="p">,</span> <span class="n">b</span> <span class="o">=</span> <span class="n">params</span>
+</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>
+</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>        <span class="c1"># Predict coverage at increased sequencing depth</span>
+</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>        <span class="n">total_abundance</span> <span class="o">=</span> <span class="n">x_data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>        <span class="n">predicted_total_abundance</span> <span class="o">=</span> <span class="n">total_abundance</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">+</span> <span class="n">extra_fold</span><span class="p">)</span>
+</span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a>        <span class="n">predicted_coverage</span> <span class="o">=</span> <span class="n">saturation_model</span><span class="p">(</span><span class="n">predicted_total_abundance</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">)</span>
+</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>
+</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>        <span class="c1"># Ensure the predicted coverage does not exceed maximum possible coverage</span>
+</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>        <span class="n">max_coverage</span> <span class="o">=</span> <span class="mf">1.0</span>  <span class="c1"># Coverage index cannot exceed 1</span>
+</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>        <span class="n">predicted_coverage</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">predicted_coverage</span><span class="p">,</span> <span class="n">max_coverage</span><span class="p">)</span>
+</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>
+</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicted coverage at </span><span class="si">%.2f</span><span class="s2">-fold increase: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">,</span> <span class="n">predicted_coverage</span><span class="p">)</span>
+</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>        <span class="k">return</span> <span class="n">predicted_coverage</span>
+</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a>
+</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a>    <span class="k">def</span> <span class="nf">calculate_chromosome_metrics</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a><span class="sd">        Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.</span>
+</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>
+</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a><span class="sd">        This method computes the CV to assess the variability of mean abundances among autosomal chromosomes,</span>
+</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a><span class="sd">        excluding any sex chromosomes.</span>
 </span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>
-</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>        <span class="c1"># calculate mean abundance for each chromosome and loaded sample sig</span>
-</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>        <span class="n">chr_to_mean_abundance</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating mean abundance for each chromosome.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>        <span class="k">for</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">chr_sig</span> <span class="ow">in</span> <span class="n">specific_chr_to_sig</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>            <span class="n">chr_sample_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">chr_sig</span>
-</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>            <span class="n">chr_stats</span> <span class="o">=</span> <span class="n">chr_sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>            <span class="n">chr_to_mean_abundance</span><span class="p">[</span><span class="n">chr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">chr_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">]</span>
-</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Mean abundance for </span><span class="si">%s</span><span class="s2">: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">chr_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">])</span>
-</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a>
-</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a>
-</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>        <span class="c1"># chr_to_mean_abundance but without any chr with partial name sex</span>
-</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>        <span class="n">autosomal_chr_to_mean_abundance</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>        <span class="k">for</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">mean_abundance</span> <span class="ow">in</span> <span class="n">chr_to_mean_abundance</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>            <span class="k">if</span> <span class="s2">&quot;sex&quot;</span> <span class="ow">in</span> <span class="n">chr_name</span><span class="o">.</span><span class="n">lower</span><span class="p">():</span>
-</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a>                <span class="k">continue</span>
-</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a>            <span class="n">autosomal_chr_to_mean_abundance</span><span class="p">[</span><span class="n">chr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">mean_abundance</span>
-</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a>
+</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>
+</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a><span class="sd">        The Coefficient of Variation (CV) is defined as:</span>
+</span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>
+</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a><span class="sd">        \text{CV} = \frac{\sigma}{\mu}</span>
+</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>
+</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a><span class="sd">        Where:</span>
+</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a><span class="sd">        - \( \sigma \) is the standard deviation of the mean abundances across autosomal chromosomes.</span>
+</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a><span class="sd">        - \( \mu \) is the mean of the mean abundances across autosomal chromosomes.</span>
+</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>
+</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>
+</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a><span class="sd">        - `chr_to_sig` (`Dict[str, SnipeSig]`):  </span>
+</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a><span class="sd">          A dictionary mapping chromosome names (e.g., `&#39;autosomal-1&#39;`, `&#39;autosomal-2&#39;`, `&#39;sex-x&#39;`, `&#39;sex-y&#39;`) to their corresponding</span>
+</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a><span class="sd">          `SnipeSig` instances. Each `SnipeSig` should represent the k-mer signature of a specific chromosome.</span>
 </span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>
-</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a>        <span class="c1"># calculate the CV for the whole sample</span>
-</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a>        <span class="k">if</span> <span class="n">autosomal_chr_to_mean_abundance</span><span class="p">:</span>
-</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a>            <span class="n">mean_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">autosomal_chr_to_mean_abundance</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">float</span><span class="p">)</span>
-</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a>            <span class="n">cv</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span>
-</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Autosomal_CV&quot;</span><span class="p">:</span> <span class="n">cv</span><span class="p">})</span>
-</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated Autosomal CV: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">cv</span><span class="p">)</span>
-</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No autosomal chromosomes were processed. &#39;Autosomal_CV&#39; set to None.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Autosomal_CV&quot;</span><span class="p">:</span> <span class="kc">None</span><span class="p">})</span>
-</span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a>
-</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a>        <span class="c1"># optional return, not required</span>
-</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span>
-</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a>
+</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a>
+</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a><span class="sd">        - `Dict[str, Any]`:  </span>
+</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a><span class="sd">          A dictionary containing the computed metrics:</span>
+</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a><span class="sd">              - `&quot;Autosomal_CV&quot;` (`float`):  </span>
+</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a><span class="sd">                The coefficient of variation of mean abundances across autosomal chromosomes.</span>
+</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a>
+</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a>
+</span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a><span class="sd">        - `ValueError`:  </span>
+</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a><span class="sd">          If `chr_to_sig` is empty or if there is an inconsistency in the signatures&#39; parameters.</span>
+</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a>
+</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a><span class="sd">        **Usage Example**:</span>
 </span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a>
-</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a>    <span class="k">def</span> <span class="nf">calculate_sex_chrs_metrics</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">genome_and_chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
-</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">        Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.</span>
-</span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a>
-</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">        This method processes a collection of genome and chromosome-specific `SnipeSig` instances to compute</span>
-</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">        metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains</span>
-</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a><span class="sd">        only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome.</span>
-</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">        The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to</span>
-</span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a><span class="sd">        accurately assess sex chromosome metrics.</span>
-</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a>
-</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a><span class="sd">        ```python</span>
+</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="sd">        # Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances</span>
+</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">        chr_signatures = {</span>
+</span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a><span class="sd">            &quot;1&quot;: sig_chr1,</span>
+</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">            &quot;2&quot;: sig_chr2,</span>
+</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">            &quot;X&quot;: sig_chrX,</span>
+</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a><span class="sd">            &quot;Y&quot;: sig_chrY</span>
+</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">        }</span>
+</span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a>
+</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a><span class="sd">        # Calculate chromosome metrics</span>
+</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">        metrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)</span>
 </span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a>
-</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a><span class="sd">        - **X-Ploidy Score**:</span>
-</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a>
-</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a><span class="sd">          The X-Ploidy score is calculated using the formula:</span>
-</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a>
-</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a><span class="sd">          $$</span>
-</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a><span class="sd">          \text{X-Ploidy} = \left(\frac{\mu_X}{\mu_{\text{autosomal}}}\right) \times \left(\frac{N_{\text{autosomal}}}{N_X}\right)</span>
-</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a><span class="sd">          $$</span>
-</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a>
-</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a><span class="sd">          Where:</span>
-</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a><span class="sd">          - \( \mu_X \) is the mean abundance of X chromosome-specific k-mers in the sample.</span>
-</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a><span class="sd">          - \( \mu_{\text{autosomal}} \) is the mean abundance of autosomal k-mers in the sample.</span>
-</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a><span class="sd">          - \( N_{\text{autosomal}} \) is the number of autosomal k-mers in the reference genome.</span>
-</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a><span class="sd">          - \( N_X \) is the number of X chromosome-specific k-mers in the reference genome.</span>
+</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a><span class="sd">        print(metrics)</span>
+</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a><span class="sd">        # Output:</span>
+</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a><span class="sd">        # {&#39;Autosomal_CV&#39;: 0.15}</span>
+</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a><span class="sd">        ```</span>
+</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a>
+</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a><span class="sd">        **Notes**:</span>
+</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a>
+</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a><span class="sd">        - **Exclusion of Sex Chromosomes**:  </span>
+</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a><span class="sd">          Chromosomes with names containing the substring `&quot;sex&quot;` (e.g., `&#39;sex-y&#39;`, `&#39;sex-x&#39;`) are excluded from the CV calculation to focus solely on autosomal chromosomes.</span>
+</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a>
+</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a><span class="sd">        - **Mean Abundance Calculation**:  </span>
+</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a><span class="sd">          The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.</span>
+</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a><span class="sd">        &quot;&quot;&quot;</span>
 </span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a>
-</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a><span class="sd">        - **Y-Coverage**:</span>
-</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>
-</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a><span class="sd">          The Y-Coverage is calculated using the formula:</span>
-</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>
-</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a><span class="sd">          $$</span>
-</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a><span class="sd">          \text{Y-Coverage} = \frac{\left(\frac{N_Y^{\text{sample}}}{N_Y}\right)}{\left(\frac{N_{\text{autosomal}}^{\text{sample}}}{N_{\text{autosomal}}}\right)}</span>
-</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a><span class="sd">          $$</span>
-</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>
-</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a><span class="sd">          Where:</span>
-</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a><span class="sd">          - \( N_Y^{\text{sample}} \) is the number of Y chromosome-specific k-mers in the sample.</span>
-</span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a><span class="sd">          - \( N_Y \) is the number of Y chromosome-specific k-mers in the reference genome.</span>
-</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a><span class="sd">          - \( N_{\text{autosomal}}^{\text{sample}} \) is the number of autosomal k-mers in the sample.</span>
-</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a><span class="sd">          - \( N_{\text{autosomal}} \) is the number of autosomal k-mers in the reference genome.</span>
-</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>
-</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>
-</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a><span class="sd">            - `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  </span>
-</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a><span class="sd">              A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include</span>
-</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a><span class="sd">              the autosomal genome signature (with a name ending in `&#39;-snipegenome&#39;`) and chromosome-specific</span>
-</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a><span class="sd">              signatures (e.g., `&#39;sex-x&#39;`, `&#39;sex-y&#39;`, `&#39;autosome-1&#39;`, `&#39;autosome-2&#39;`, etc.).</span>
-</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>
-</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>
-</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a><span class="sd">            - `Dict[str, Any]`:  </span>
-</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a><span class="sd">              A dictionary containing the calculated sex-related metrics:</span>
-</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a><span class="sd">                  - `&quot;X-Ploidy score&quot;` (`float`):  </span>
-</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a><span class="sd">                    The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance</span>
-</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a><span class="sd">                    to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.</span>
-</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a><span class="sd">                  - `&quot;Y-Coverage&quot;` (`float`, optional):  </span>
-</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a><span class="sd">                    The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.</span>
-</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a><span class="sd">                    This key is present only if a Y chromosome signature is provided.</span>
-</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>
-</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>
-</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a><span class="sd">            - `ValueError`:  </span>
-</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a><span class="sd">              - If the `&#39;sex-x&#39;` chromosome signature is not found in `genome_and_chr_to_sig`.</span>
-</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a><span class="sd">              - If the autosomal genome signature is not found or improperly labeled.</span>
-</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a>
-</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a><span class="sd">        **Usage Example**:</span>
+</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a>        <span class="c1"># Implementation of the method</span>
+</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>        <span class="c1"># let&#39;s make sure all chromosome sigs are unique</span>
+</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Computing specific chromosome hashes for </span><span class="si">%s</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="s1">&#39;,&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">()))</span>
+</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-All hashes for chromosomes before getting unique sigs </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">SnipeSig</span><span class="o">.</span><span class="n">sum_signatures</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="o">.</span><span class="n">values</span><span class="p">())))</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>        <span class="n">specific_chr_to_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">get_unique_signatures</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="p">)</span>
+</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-All hashes for chromosomes after getting unique sigs </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">SnipeSig</span><span class="o">.</span><span class="n">sum_signatures</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">specific_chr_to_sig</span><span class="o">.</span><span class="n">values</span><span class="p">())))</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a>
+</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>        <span class="c1"># calculate mean abundance for each chromosome and loaded sample sig</span>
+</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>        <span class="n">chr_to_mean_abundance</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating mean abundance for each chromosome.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a>        <span class="k">for</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">chr_sig</span> <span class="ow">in</span> <span class="n">specific_chr_to_sig</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersecting </span><span class="si">%s</span><span class="s2"> (</span><span class="si">%d</span><span class="s2">) with </span><span class="si">%s</span><span class="s2"> (</span><span class="si">%d</span><span class="s2">)&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">name</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="p">),</span> <span class="n">chr_name</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">chr_sig</span><span class="p">))</span>
+</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a>            <span class="n">chr_sample_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">chr_sig</span>
+</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>            <span class="n">chr_stats</span> <span class="o">=</span> <span class="n">chr_sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a>            <span class="n">chr_to_mean_abundance</span><span class="p">[</span><span class="n">chr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">chr_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">]</span>
+</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Mean abundance for </span><span class="si">%s</span><span class="s2">: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">chr_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">])</span>
+</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a>
+</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">chr_to_mean_abundance</span><span class="p">)</span>
+</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a>
+</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>        <span class="c1"># chr_to_mean_abundance but without any chr with partial name sex</span>
+</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>        <span class="n">autosomal_chr_to_mean_abundance</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>        <span class="k">for</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">mean_abundance</span> <span class="ow">in</span> <span class="n">chr_to_mean_abundance</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>            <span class="k">if</span> <span class="s2">&quot;sex&quot;</span> <span class="ow">in</span> <span class="n">chr_name</span><span class="o">.</span><span class="n">lower</span><span class="p">():</span>
+</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a>                <span class="k">continue</span>
+</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a>            <span class="n">autosomal_chr_to_mean_abundance</span><span class="p">[</span><span class="n">chr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">mean_abundance</span>
+</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a>
+</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a>
+</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a>        <span class="c1"># calculate the CV for the whole sample</span>
+</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a>        <span class="k">if</span> <span class="n">autosomal_chr_to_mean_abundance</span><span class="p">:</span>
+</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a>            <span class="n">mean_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">autosomal_chr_to_mean_abundance</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">float</span><span class="p">)</span>
+</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a>            <span class="n">cv</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Autosomal_CV&quot;</span><span class="p">:</span> <span class="n">cv</span><span class="p">})</span>
+</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated Autosomal CV: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">cv</span><span class="p">)</span>
+</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No autosomal chromosomes were processed. &#39;Autosomal_CV&#39; set to None.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Autosomal_CV&quot;</span><span class="p">:</span> <span class="kc">None</span><span class="p">})</span>
+</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a>
+</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a>        <span class="c1"># optional return, not required</span>
+</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span>
 </span><span id="__span-0-1136"><a id="__codelineno-0-1136" name="__codelineno-0-1136"></a>
-</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a><span class="sd">        ```python</span>
-</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a><span class="sd">        # Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances</span>
-</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a><span class="sd">        genome_and_chr_signatures = {</span>
-</span><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a><span class="sd">            &quot;autosomal-snipegenome&quot;: sig_autosomal_genome,</span>
-</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a><span class="sd">            &quot;1&quot;: sig_chr1,</span>
-</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a><span class="sd">            &quot;2&quot;: sig_chr2,</span>
-</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a><span class="sd">            &quot;sex-x&quot;: sig_sex_x,</span>
-</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a><span class="sd">            &quot;sex-y&quot;: sig_sex_y</span>
-</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a><span class="sd">        }</span>
-</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a>
-</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a><span class="sd">        # Calculate sex chromosome metrics</span>
-</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a><span class="sd">        metrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)</span>
+</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a>
+</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a>    <span class="k">def</span> <span class="nf">calculate_sex_chrs_metrics</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">genome_and_chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a><span class="sd">        Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.</span>
+</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a>
+</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a><span class="sd">        This method processes a collection of genome and chromosome-specific `SnipeSig` instances to compute</span>
+</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a><span class="sd">        metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains</span>
+</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a><span class="sd">        only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome.</span>
+</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a><span class="sd">        The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to</span>
+</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a><span class="sd">        accurately assess sex chromosome metrics.</span>
+</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a>
+</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a><span class="sd">        **Mathematical Explanation**:</span>
 </span><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a>
-</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a><span class="sd">        print(metrics)</span>
-</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a><span class="sd">        # Output Example:</span>
-</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a><span class="sd">        # {</span>
-</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a><span class="sd">        #     &quot;X-Ploidy score&quot;: 2.6667,</span>
-</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a><span class="sd">        #     &quot;Y-Coverage&quot;: 0.0</span>
-</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a><span class="sd">        # }</span>
-</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a><span class="sd">        ```</span>
+</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a><span class="sd">        - **X-Ploidy Score**:</span>
+</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a>
+</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a><span class="sd">          The X-Ploidy score is calculated using the formula:</span>
+</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a>
+</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a><span class="sd">          $$</span>
+</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a><span class="sd">          \text{X-Ploidy} = \left(\frac{\mu_X}{\mu_{\text{autosomal}}}\right) \times \left(\frac{N_{\text{autosomal}}}{N_X}\right)</span>
+</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a><span class="sd">          $$</span>
 </span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a>
-</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a><span class="sd">        **Notes**:</span>
-</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a>
-</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a><span class="sd">            - **Signature Naming Convention**:  </span>
-</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a><span class="sd">              The autosomal genome signature must have a name ending with `&#39;-snipegenome&#39;`. Chromosome-specific</span>
-</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a><span class="sd">              signatures should be named accordingly (e.g., `&#39;sex-x&#39;`, `&#39;sex-y&#39;`, `&#39;autosomal-1&#39;`, `&#39;autosomal-2&#39;`, etc.).</span>
+</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a><span class="sd">          Where:</span>
+</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a><span class="sd">          - \( \mu_X \) is the mean abundance of X chromosome-specific k-mers in the sample.</span>
+</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a><span class="sd">          - \( \mu_{\text{autosomal}} \) is the mean abundance of autosomal k-mers in the sample.</span>
+</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a><span class="sd">          - \( N_{\text{autosomal}} \) is the number of autosomal k-mers in the reference genome.</span>
+</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a><span class="sd">          - \( N_X \) is the number of X chromosome-specific k-mers in the reference genome.</span>
 </span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a>
-</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a><span class="sd">            - **Exclusion of Sex Chromosomes from Autosomal Genome**:  </span>
-</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a><span class="sd">              The Y chromosome signature (`&#39;sex-y&#39;`) is subtracted from the autosomal genome signature to ensure</span>
-</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a><span class="sd">              that Y chromosome k-mers are not counted towards autosomal metrics.</span>
+</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a><span class="sd">        - **Y-Coverage**:</span>
+</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a>
+</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a><span class="sd">          The Y-Coverage is calculated using the formula:</span>
 </span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>
-</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a><span class="sd">            - **Robustness**:  </span>
-</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a><span class="sd">              The method includes comprehensive logging for debugging purposes, tracking each major step and</span>
-</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a><span class="sd">              any exclusions made during processing.</span>
-</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a>
-</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a>        <span class="c1"># Ensure that the chromosome X signature exists</span>
-</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>        <span class="k">if</span> <span class="s1">&#39;sex-x&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">genome_and_chr_to_sig</span><span class="p">:</span>
-</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Chromosome X (&#39;sex-x&#39;) not found in the provided signatures. X-Ploidy score will be set to zero.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>            <span class="c1"># set sex-x to an empty signature</span>
-</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>            <span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-x&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
-</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
-</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>                <span class="n">ksize</span><span class="o">=</span><span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>                <span class="n">scale</span><span class="o">=</span><span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>            <span class="p">)</span>
-</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a>
-</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>        <span class="c1"># Separate the autosomal genome signature from chromosome-specific signatures</span>
-</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a>        <span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>        <span class="n">autosomals_genome_sig</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Separating autosomal genome signature from chromosome-specific signatures.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a>
-</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a>            <span class="k">if</span> <span class="n">name</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s1">&#39;-snipegenome&#39;</span><span class="p">):</span>
-</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Identified autosomal genome signature: &#39;</span><span class="si">%s</span><span class="s2">&#39;.&quot;</span><span class="p">,</span> <span class="n">name</span><span class="p">)</span>
-</span><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a>                <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">sig</span>
-</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a>                <span class="n">chr_to_sig</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">sig</span>
+</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a><span class="sd">          $$</span>
+</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a><span class="sd">          \text{Y-Coverage} = \frac{\left(\frac{N_Y^{\text{sample}}}{N_Y}\right)}{\left(\frac{N_{\text{autosomal}}^{\text{sample}}}{N_{\text{autosomal}}}\right)}</span>
+</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a><span class="sd">          $$</span>
+</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a>
+</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a><span class="sd">          Where:</span>
+</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a><span class="sd">          - \( N_Y^{\text{sample}} \) is the number of Y chromosome-specific k-mers in the sample.</span>
+</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a><span class="sd">          - \( N_Y \) is the number of Y chromosome-specific k-mers in the reference genome.</span>
+</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a><span class="sd">          - \( N_{\text{autosomal}}^{\text{sample}} \) is the number of autosomal k-mers in the sample.</span>
+</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a><span class="sd">          - \( N_{\text{autosomal}} \) is the number of autosomal k-mers in the reference genome.</span>
+</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>
+</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>
+</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a><span class="sd">            - `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  </span>
+</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a><span class="sd">              A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include</span>
+</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a><span class="sd">              the autosomal genome signature (with a name ending in `&#39;-snipegenome&#39;`) and chromosome-specific</span>
+</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a><span class="sd">              signatures (e.g., `&#39;sex-x&#39;`, `&#39;sex-y&#39;`, `&#39;autosome-1&#39;`, `&#39;autosome-2&#39;`, etc.).</span>
+</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>
+</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>
+</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a><span class="sd">            - `Dict[str, Any]`:  </span>
+</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a><span class="sd">              A dictionary containing the calculated sex-related metrics:</span>
+</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a><span class="sd">                  - `&quot;X-Ploidy score&quot;` (`float`):  </span>
+</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a><span class="sd">                    The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance</span>
+</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a><span class="sd">                    to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.</span>
+</span><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a><span class="sd">                  - `&quot;Y-Coverage&quot;` (`float`, optional):  </span>
+</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a><span class="sd">                    The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.</span>
+</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a><span class="sd">                    This key is present only if a Y chromosome signature is provided.</span>
 </span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a>
-</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a>        <span class="k">if</span> <span class="n">autosomals_genome_sig</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Autosomal genome signature (ending with &#39;-snipegenome&#39;) not found.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Autosomal genome signature (ending with &#39;-snipegenome&#39;) not found.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a>
-</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a>        <span class="c1"># Ensure all chromosome signatures have unique hashes</span>
-</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a>        <span class="n">specific_chr_to_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">get_unique_signatures</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="p">)</span>
-</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a>
-</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a>        <span class="c1"># Exclude Y chromosome from the autosomal genome signature if present</span>
-</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a>        <span class="k">if</span> <span class="s1">&#39;sex-y&#39;</span> <span class="ow">in</span> <span class="n">chr_to_sig</span><span class="p">:</span>
-</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Y chromosome (&#39;sex-y&#39;) detected. Removing its hashes from the autosomal genome signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Original autosomal genome size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
-</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a>            <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-y&#39;</span><span class="p">]</span>
-</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Updated autosomal genome size after removing Y chromosome: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
-</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a>
-</span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a>        <span class="c1"># Remove X chromosome hashes from the autosomal genome signature</span>
-</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Removing X chromosome (&#39;sex-x&#39;) hashes from the autosomal genome signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a>        <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-x&#39;</span><span class="p">]</span>
-</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Updated autosomal genome size after removing X chromosome: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
-</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a>
-</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a>        <span class="c1"># Derive the X chromosome-specific signature by subtracting autosomal genome hashes</span>
-</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a>        <span class="n">specific_xchr_sig</span> <span class="o">=</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-x&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">autosomals_genome_sig</span>
-</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Derived X chromosome-specific signature size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">))</span>
-</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a>
-</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a>        <span class="c1"># Intersect the sample signature with chromosome-specific signatures</span>
-</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a>        <span class="n">sample_specific_xchr_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">specific_xchr_sig</span>
-</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_specific_xchr_sig</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No X chromosome-specific k-mers found in the sample signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with X chromosome-specific k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_specific_xchr_sig</span><span class="p">))</span>
-</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a>        <span class="n">sample_autosomal_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">autosomals_genome_sig</span>
-</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with autosomal genome k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_autosomal_sig</span><span class="p">))</span>
+</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>
+</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a><span class="sd">            - `ValueError`:  </span>
+</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a><span class="sd">              - If the `&#39;sex-x&#39;` chromosome signature is not found in `genome_and_chr_to_sig`.</span>
+</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a><span class="sd">              - If the autosomal genome signature is not found or improperly labeled.</span>
+</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a>
+</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a><span class="sd">        **Usage Example**:</span>
+</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a>
+</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a><span class="sd">        ```python</span>
+</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a><span class="sd">        # Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances</span>
+</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a><span class="sd">        genome_and_chr_signatures = {</span>
+</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a><span class="sd">            &quot;autosomal-snipegenome&quot;: sig_autosomal_genome,</span>
+</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a><span class="sd">            &quot;1&quot;: sig_chr1,</span>
+</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a><span class="sd">            &quot;2&quot;: sig_chr2,</span>
+</span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a><span class="sd">            &quot;sex-x&quot;: sig_sex_x,</span>
+</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a><span class="sd">            &quot;sex-y&quot;: sig_sex_y</span>
+</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a><span class="sd">        }</span>
+</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a>
+</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a><span class="sd">        # Calculate sex chromosome metrics</span>
+</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a><span class="sd">        metrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)</span>
+</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a>
+</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a><span class="sd">        print(metrics)</span>
+</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a><span class="sd">        # Output Example:</span>
+</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a><span class="sd">        # {</span>
+</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a><span class="sd">        #     &quot;X-Ploidy score&quot;: 2.6667,</span>
+</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a><span class="sd">        #     &quot;Y-Coverage&quot;: 0.0</span>
+</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a><span class="sd">        # }</span>
+</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a><span class="sd">        ```</span>
+</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a>
+</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a><span class="sd">        **Notes**:</span>
 </span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a>
-</span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a>        <span class="c1"># Retrieve mean abundances</span>
-</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a>        <span class="n">xchr_mean_abundance</span> <span class="o">=</span> <span class="n">sample_specific_xchr_sig</span><span class="o">.</span><span class="n">get_sample_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
-</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a>        <span class="n">autosomal_mean_abundance</span> <span class="o">=</span> <span class="n">sample_autosomal_sig</span><span class="o">.</span><span class="n">get_sample_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a><span class="sd">            - **Signature Naming Convention**:  </span>
+</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a><span class="sd">              The autosomal genome signature must have a name ending with `&#39;-snipegenome&#39;`. Chromosome-specific</span>
+</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a><span class="sd">              signatures should be named accordingly (e.g., `&#39;sex-x&#39;`, `&#39;sex-y&#39;`, `&#39;autosomal-1&#39;`, `&#39;autosomal-2&#39;`, etc.).</span>
 </span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a>
-</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a>        <span class="c1"># Calculate X-Ploidy score</span>
-</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a>        <span class="k">if</span> <span class="n">autosomal_mean_abundance</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Autosomal mean abundance is zero. Setting X-Ploidy score to zero to avoid division by zero.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a>            <span class="n">xploidy_score</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a>            <span class="n">xploidy_score</span> <span class="o">=</span> <span class="p">(</span><span class="n">xchr_mean_abundance</span> <span class="o">/</span> <span class="n">autosomal_mean_abundance</span><span class="p">)</span> <span class="o">*</span> \
-</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a>                            <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">)</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span><span class="p">)</span>
-</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a>
-</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated X-Ploidy score: </span><span class="si">%.4f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">xploidy_score</span><span class="p">)</span>
-</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;X-Ploidy score&quot;</span><span class="p">:</span> <span class="n">xploidy_score</span><span class="p">})</span>
-</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a>
-</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a>        <span class="c1"># Calculate Y-Coverage if Y chromosome is present</span>
-</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>        <span class="k">if</span> <span class="s1">&#39;sex-y&#39;</span> <span class="ow">in</span> <span class="n">specific_chr_to_sig</span><span class="p">:</span>
-</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating Y-Coverage based on Y chromosome-specific k-mers.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a>
-</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a>            <span class="c1"># Derive Y chromosome-specific k-mers by excluding autosomal and X chromosome k-mers</span>
-</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a>            <span class="n">ychr_specific_kmers</span> <span class="o">=</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-y&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">specific_xchr_sig</span>
-</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Derived Y chromosome-specific signature size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">))</span>
-</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a>
-</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a>            <span class="c1"># Intersect Y chromosome-specific k-mers with the sample signature</span>
-</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a>            <span class="n">ychr_in_sample</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">ychr_specific_kmers</span>
-</span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with Y chromosome-specific k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">))</span>
-</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No Y chromosome-specific k-mers found in the sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a><span class="sd">            - **Exclusion of Sex Chromosomes from Autosomal Genome**:  </span>
+</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a><span class="sd">              The Y chromosome signature (`&#39;sex-y&#39;`) is subtracted from the autosomal genome signature to ensure</span>
+</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a><span class="sd">              that Y chromosome k-mers are not counted towards autosomal metrics.</span>
+</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a>
+</span><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a><span class="sd">            - **Robustness**:  </span>
+</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a><span class="sd">              The method includes comprehensive logging for debugging purposes, tracking each major step and</span>
+</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a><span class="sd">              any exclusions made during processing.</span>
+</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a>
+</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>        <span class="c1"># Ensure that the chromosome X signature exists</span>
+</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a>        <span class="k">if</span> <span class="s1">&#39;sex-x&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">genome_and_chr_to_sig</span><span class="p">:</span>
+</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Chromosome X (&#39;sex-x&#39;) not found in the provided signatures. X-Ploidy score will be set to zero.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>            <span class="c1"># set sex-x to an empty signature</span>
+</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a>            <span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-x&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
+</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
+</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a>                <span class="n">ksize</span><span class="o">=</span><span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>                <span class="n">scale</span><span class="o">=</span><span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a>            <span class="p">)</span>
+</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a>
+</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a>        <span class="c1"># Separate the autosomal genome signature from chromosome-specific signatures</span>
+</span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>        <span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a>        <span class="n">autosomals_genome_sig</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Separating autosomal genome signature from chromosome-specific signatures.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a>
-</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a>            <span class="c1"># Derive autosomal-specific k-mers by excluding X and Y chromosome k-mers from the reference signature</span>
-</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>            <span class="n">autosomals_specific_kmers</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span> <span class="o">-</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-x&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-y&#39;</span><span class="p">]</span>
-</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a>
-</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a>            <span class="c1"># Calculate Y-Coverage metric</span>
-</span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_specific_kmers</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Insufficient k-mers for Y-Coverage calculation. Setting Y-Coverage to zero.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a>                <span class="n">ycoverage</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>                <span class="n">ycoverage</span> <span class="o">=</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">))</span> <span class="o">/</span> \
-</span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>                        <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">sample_autosomal_sig</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_specific_kmers</span><span class="p">))</span>
+</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>            <span class="k">if</span> <span class="n">name</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s1">&#39;-snipegenome&#39;</span><span class="p">):</span>
+</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Identified autosomal genome signature: &#39;</span><span class="si">%s</span><span class="s2">&#39;.&quot;</span><span class="p">,</span> <span class="n">name</span><span class="p">)</span>
+</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a>                <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">sig</span>
+</span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a>                <span class="n">chr_to_sig</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">sig</span>
+</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a>
+</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a>        <span class="k">if</span> <span class="n">autosomals_genome_sig</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Autosomal genome signature (ending with &#39;-snipegenome&#39;) not found.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Autosomal genome signature (ending with &#39;-snipegenome&#39;) not found.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a>
-</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated Y-Coverage: </span><span class="si">%.4f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">ycoverage</span><span class="p">)</span>
-</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Y-Coverage&quot;</span><span class="p">:</span> <span class="n">ycoverage</span><span class="p">})</span>
+</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>        <span class="c1"># Ensure all chromosome signatures have unique hashes</span>
+</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>        <span class="n">specific_chr_to_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">get_unique_signatures</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="p">)</span>
 </span><span id="__span-0-1269"><a id="__codelineno-0-1269" name="__codelineno-0-1269"></a>
-</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span>
+</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a>        <span class="c1"># Exclude Y chromosome from the autosomal genome signature if present</span>
+</span><span id="__span-0-1271"><a id="__codelineno-0-1271" name="__codelineno-0-1271"></a>        <span class="k">if</span> <span class="s1">&#39;sex-y&#39;</span> <span class="ow">in</span> <span class="n">chr_to_sig</span><span class="p">:</span>
+</span><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Y chromosome (&#39;sex-y&#39;) detected. Removing its hashes from the autosomal genome signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1273"><a id="__codelineno-0-1273" name="__codelineno-0-1273"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Original autosomal genome size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
+</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a>            <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-y&#39;</span><span class="p">]</span>
+</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Updated autosomal genome size after removing Y chromosome: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
+</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a>
+</span><span id="__span-0-1277"><a id="__codelineno-0-1277" name="__codelineno-0-1277"></a>        <span class="c1"># Remove X chromosome hashes from the autosomal genome signature</span>
+</span><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Removing X chromosome (&#39;sex-x&#39;) hashes from the autosomal genome signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a>        <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-x&#39;</span><span class="p">]</span>
+</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Updated autosomal genome size after removing X chromosome: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
+</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a>
+</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a>        <span class="c1"># Derive the X chromosome-specific signature by subtracting autosomal genome hashes</span>
+</span><span id="__span-0-1283"><a id="__codelineno-0-1283" name="__codelineno-0-1283"></a>        <span class="n">specific_xchr_sig</span> <span class="o">=</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-x&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">autosomals_genome_sig</span>
+</span><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Derived X chromosome-specific signature size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">))</span>
+</span><span id="__span-0-1285"><a id="__codelineno-0-1285" name="__codelineno-0-1285"></a>
+</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a>        <span class="c1"># Intersect the sample signature with chromosome-specific signatures</span>
+</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a>        <span class="n">sample_specific_xchr_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">specific_xchr_sig</span>
+</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_specific_xchr_sig</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No X chromosome-specific k-mers found in the sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1290"><a id="__codelineno-0-1290" name="__codelineno-0-1290"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with X chromosome-specific k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_specific_xchr_sig</span><span class="p">))</span>
+</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a>        <span class="n">sample_autosomal_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">autosomals_genome_sig</span>
+</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with autosomal genome k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_autosomal_sig</span><span class="p">))</span>
+</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a>
+</span><span id="__span-0-1294"><a id="__codelineno-0-1294" name="__codelineno-0-1294"></a>        <span class="c1"># Retrieve mean abundances</span>
+</span><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a>        <span class="n">xchr_mean_abundance</span> <span class="o">=</span> <span class="n">sample_specific_xchr_sig</span><span class="o">.</span><span class="n">get_sample_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a>        <span class="n">autosomal_mean_abundance</span> <span class="o">=</span> <span class="n">sample_autosomal_sig</span><span class="o">.</span><span class="n">get_sample_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a>
+</span><span id="__span-0-1298"><a id="__codelineno-0-1298" name="__codelineno-0-1298"></a>        <span class="c1"># Calculate X-Ploidy score</span>
+</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a>        <span class="k">if</span> <span class="n">autosomal_mean_abundance</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Autosomal mean abundance is zero. Setting X-Ploidy score to zero to avoid division by zero.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a>            <span class="n">xploidy_score</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1302"><a id="__codelineno-0-1302" name="__codelineno-0-1302"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a>            <span class="n">xploidy_score</span> <span class="o">=</span> <span class="p">(</span><span class="n">xchr_mean_abundance</span> <span class="o">/</span> <span class="n">autosomal_mean_abundance</span><span class="p">)</span> <span class="o">*</span> \
+</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a>                            <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">)</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a>
+</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated X-Ploidy score: </span><span class="si">%.4f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">xploidy_score</span><span class="p">)</span>
+</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;X-Ploidy score&quot;</span><span class="p">:</span> <span class="n">xploidy_score</span><span class="p">})</span>
+</span><span id="__span-0-1308"><a id="__codelineno-0-1308" name="__codelineno-0-1308"></a>
+</span><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a>        <span class="c1"># Calculate Y-Coverage if Y chromosome is present</span>
+</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a>        <span class="k">if</span> <span class="s1">&#39;sex-y&#39;</span> <span class="ow">in</span> <span class="n">specific_chr_to_sig</span><span class="p">:</span>
+</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating Y-Coverage based on Y chromosome-specific k-mers.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a>
+</span><span id="__span-0-1313"><a id="__codelineno-0-1313" name="__codelineno-0-1313"></a>            <span class="c1"># Derive Y chromosome-specific k-mers by excluding autosomal and X chromosome k-mers</span>
+</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a>            <span class="n">ychr_specific_kmers</span> <span class="o">=</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-y&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">specific_xchr_sig</span>
+</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Derived Y chromosome-specific signature size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">))</span>
+</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a>
+</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a>            <span class="c1"># Intersect Y chromosome-specific k-mers with the sample signature</span>
+</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a>            <span class="n">ychr_in_sample</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">ychr_specific_kmers</span>
+</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with Y chromosome-specific k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">))</span>
+</span><span id="__span-0-1320"><a id="__codelineno-0-1320" name="__codelineno-0-1320"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No Y chromosome-specific k-mers found in the sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a>
+</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>            <span class="c1"># Derive autosomal-specific k-mers by excluding X and Y chromosome k-mers from the reference signature</span>
+</span><span id="__span-0-1324"><a id="__codelineno-0-1324" name="__codelineno-0-1324"></a>            <span class="n">autosomals_specific_kmers</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span> <span class="o">-</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-x&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-y&#39;</span><span class="p">]</span>
+</span><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a>
+</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a>            <span class="c1"># Calculate Y-Coverage metric</span>
+</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_specific_kmers</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Insufficient k-mers for Y-Coverage calculation. Setting Y-Coverage to zero.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a>                <span class="n">ycoverage</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a>                <span class="n">ycoverage</span> <span class="o">=</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">))</span> <span class="o">/</span> \
+</span><span id="__span-0-1332"><a id="__codelineno-0-1332" name="__codelineno-0-1332"></a>                        <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">sample_autosomal_sig</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_specific_kmers</span><span class="p">))</span>
+</span><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a>
+</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated Y-Coverage: </span><span class="si">%.4f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">ycoverage</span><span class="p">)</span>
+</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Y-Coverage&quot;</span><span class="p">:</span> <span class="n">ycoverage</span><span class="p">})</span>
+</span><span id="__span-0-1336"><a id="__codelineno-0-1336" name="__codelineno-0-1336"></a>
+</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span>
+</span><span id="__span-0-1338"><a id="__codelineno-0-1338" name="__codelineno-0-1338"></a>
+</span><span id="__span-0-1339"><a id="__codelineno-0-1339" name="__codelineno-0-1339"></a>
+</span><span id="__span-0-1340"><a id="__codelineno-0-1340" name="__codelineno-0-1340"></a>
+</span><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a>    <span class="k">def</span> <span class="nf">nonref_consume_from_vars</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="nb">vars</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">],</span> <span class="n">vars_order</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]:</span>
+</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a><span class="sd">        Consume and analyze non-reference k-mers from provided variable signatures.</span>
+</span><span id="__span-0-1344"><a id="__codelineno-0-1344" name="__codelineno-0-1344"></a>
+</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a><span class="sd">        This method processes non-reference k-mers in the sample signature by intersecting them with a set of</span>
+</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a><span class="sd">        variable-specific `SnipeSig` instances. It calculates coverage and total abundance metrics for each</span>
+</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a><span class="sd">        variable in a specified order, ensuring that each non-reference k-mer is accounted for without overlap</span>
+</span><span id="__span-0-1348"><a id="__codelineno-0-1348" name="__codelineno-0-1348"></a><span class="sd">        between variables. The method updates internal statistics that reflect the distribution of non-reference</span>
+</span><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a><span class="sd">        k-mers across the provided variables.</span>
+</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a>
+</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a><span class="sd">        **Process Overview**:</span>
+</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a>
+</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a><span class="sd">        1. **Validation**:</span>
+</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a><span class="sd">        - Verifies that all variable names specified in `vars_order` are present in the `vars` dictionary.</span>
+</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a><span class="sd">        - Raises a `ValueError` if any variable in `vars_order` is missing from `vars`.</span>
+</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a>
+</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a><span class="sd">        2. **Non-Reference K-mer Extraction**:</span>
+</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a><span class="sd">        - Computes the set of non-reference non-singleton k-mers by subtracting the reference signature from the sample signature.</span>
+</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a><span class="sd">        - If no non-reference k-mers are found, the method logs a warning and returns an empty dictionary.</span>
+</span><span id="__span-0-1360"><a id="__codelineno-0-1360" name="__codelineno-0-1360"></a>
+</span><span id="__span-0-1361"><a id="__codelineno-0-1361" name="__codelineno-0-1361"></a><span class="sd">        3. **Variable-wise Consumption**:</span>
+</span><span id="__span-0-1362"><a id="__codelineno-0-1362" name="__codelineno-0-1362"></a><span class="sd">        - Iterates over each variable name in `vars_order`.</span>
+</span><span id="__span-0-1363"><a id="__codelineno-0-1363" name="__codelineno-0-1363"></a><span class="sd">        - For each variable:</span>
+</span><span id="__span-0-1364"><a id="__codelineno-0-1364" name="__codelineno-0-1364"></a><span class="sd">            - Intersects the remaining non-reference k-mers with the variable-specific signature.</span>
+</span><span id="__span-0-1365"><a id="__codelineno-0-1365" name="__codelineno-0-1365"></a><span class="sd">            - Calculates the total abundance and coverage index for the intersected k-mers.</span>
+</span><span id="__span-0-1366"><a id="__codelineno-0-1366" name="__codelineno-0-1366"></a><span class="sd">            - Updates the `vars_nonref_stats` dictionary with the computed metrics.</span>
+</span><span id="__span-0-1367"><a id="__codelineno-0-1367" name="__codelineno-0-1367"></a><span class="sd">            - Removes the consumed k-mers from the remaining non-reference set to prevent overlap.</span>
+</span><span id="__span-0-1368"><a id="__codelineno-0-1368" name="__codelineno-0-1368"></a>
+</span><span id="__span-0-1369"><a id="__codelineno-0-1369" name="__codelineno-0-1369"></a><span class="sd">        4. **Final State Logging**:</span>
+</span><span id="__span-0-1370"><a id="__codelineno-0-1370" name="__codelineno-0-1370"></a><span class="sd">        - Logs the final size and total abundance of the remaining non-reference k-mers after consumption.</span>
+</span><span id="__span-0-1371"><a id="__codelineno-0-1371" name="__codelineno-0-1371"></a>
+</span><span id="__span-0-1372"><a id="__codelineno-0-1372" name="__codelineno-0-1372"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-1373"><a id="__codelineno-0-1373" name="__codelineno-0-1373"></a>
+</span><span id="__span-0-1374"><a id="__codelineno-0-1374" name="__codelineno-0-1374"></a><span class="sd">            - `vars` (`Dict[str, SnipeSig]`):  </span>
+</span><span id="__span-0-1375"><a id="__codelineno-0-1375" name="__codelineno-0-1375"></a><span class="sd">            A dictionary mapping variable names to their corresponding `SnipeSig` instances. Each `SnipeSig` </span>
+</span><span id="__span-0-1376"><a id="__codelineno-0-1376" name="__codelineno-0-1376"></a><span class="sd">            represents a set of k-mers associated with a specific non-reference category or variable.</span>
+</span><span id="__span-0-1377"><a id="__codelineno-0-1377" name="__codelineno-0-1377"></a>
+</span><span id="__span-0-1378"><a id="__codelineno-0-1378" name="__codelineno-0-1378"></a><span class="sd">            - `vars_order` (`List[str]`):  </span>
+</span><span id="__span-0-1379"><a id="__codelineno-0-1379" name="__codelineno-0-1379"></a><span class="sd">            A list specifying the order in which variables should be processed. The order determines the priority </span>
+</span><span id="__span-0-1380"><a id="__codelineno-0-1380" name="__codelineno-0-1380"></a><span class="sd">            of consumption, ensuring that earlier variables in the list have their k-mers accounted for before </span>
+</span><span id="__span-0-1381"><a id="__codelineno-0-1381" name="__codelineno-0-1381"></a><span class="sd">            later ones.</span>
+</span><span id="__span-0-1382"><a id="__codelineno-0-1382" name="__codelineno-0-1382"></a>
+</span><span id="__span-0-1383"><a id="__codelineno-0-1383" name="__codelineno-0-1383"></a><span class="sd">            - `**kwargs`:  </span>
+</span><span id="__span-0-1384"><a id="__codelineno-0-1384" name="__codelineno-0-1384"></a><span class="sd">            Additional keyword arguments. Reserved for future extensions and should not be used in the current context.</span>
+</span><span id="__span-0-1385"><a id="__codelineno-0-1385" name="__codelineno-0-1385"></a>
+</span><span id="__span-0-1386"><a id="__codelineno-0-1386" name="__codelineno-0-1386"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-1387"><a id="__codelineno-0-1387" name="__codelineno-0-1387"></a>
+</span><span id="__span-0-1388"><a id="__codelineno-0-1388" name="__codelineno-0-1388"></a><span class="sd">            - `Dict[str, float]`:  </span>
+</span><span id="__span-0-1389"><a id="__codelineno-0-1389" name="__codelineno-0-1389"></a><span class="sd">            A dictionary containing statistics for each variable name in `vars_order`, </span>
+</span><span id="__span-0-1390"><a id="__codelineno-0-1390" name="__codelineno-0-1390"></a><span class="sd">                - `&quot;non-genomic total k-mer abundance&quot;` (`float`):  </span>
+</span><span id="__span-0-1391"><a id="__codelineno-0-1391" name="__codelineno-0-1391"></a><span class="sd">                    The sum of abundances of non-reference k-mers associated with the variable.</span>
+</span><span id="__span-0-1392"><a id="__codelineno-0-1392" name="__codelineno-0-1392"></a><span class="sd">                - `&quot;non-genomic coverage index&quot;` (`float`):  </span>
+</span><span id="__span-0-1393"><a id="__codelineno-0-1393" name="__codelineno-0-1393"></a><span class="sd">                    The ratio of unique non-reference k-mers associated with the variable to the total number </span>
+</span><span id="__span-0-1394"><a id="__codelineno-0-1394" name="__codelineno-0-1394"></a><span class="sd">                    of non-reference k-mers in the sample before consumption.</span>
+</span><span id="__span-0-1395"><a id="__codelineno-0-1395" name="__codelineno-0-1395"></a>
+</span><span id="__span-0-1396"><a id="__codelineno-0-1396" name="__codelineno-0-1396"></a><span class="sd">            Example Output:</span>
+</span><span id="__span-0-1397"><a id="__codelineno-0-1397" name="__codelineno-0-1397"></a><span class="sd">            ```python</span>
+</span><span id="__span-0-1398"><a id="__codelineno-0-1398" name="__codelineno-0-1398"></a><span class="sd">            {</span>
+</span><span id="__span-0-1399"><a id="__codelineno-0-1399" name="__codelineno-0-1399"></a><span class="sd">                &quot;variable_A non-genomic total k-mer abundance&quot;: 1500.0,</span>
+</span><span id="__span-0-1400"><a id="__codelineno-0-1400" name="__codelineno-0-1400"></a><span class="sd">                &quot;variable_A non-genomic coverage index&quot;: 0.20</span>
+</span><span id="__span-0-1401"><a id="__codelineno-0-1401" name="__codelineno-0-1401"></a><span class="sd">                &quot;variable_B non-genomic total k-mer abundance&quot;: 3500.0,</span>
+</span><span id="__span-0-1402"><a id="__codelineno-0-1402" name="__codelineno-0-1402"></a><span class="sd">                &quot;variable_B non-genomic coverage index&quot;: 0.70</span>
+</span><span id="__span-0-1403"><a id="__codelineno-0-1403" name="__codelineno-0-1403"></a><span class="sd">                &quot;non-var non-genomic total k-mer abundance&quot;: 0.10,</span>
+</span><span id="__span-0-1404"><a id="__codelineno-0-1404" name="__codelineno-0-1404"></a><span class="sd">                &quot;non-var non-genomic coverage index&quot;: 218</span>
+</span><span id="__span-0-1405"><a id="__codelineno-0-1405" name="__codelineno-0-1405"></a><span class="sd">            }</span>
+</span><span id="__span-0-1406"><a id="__codelineno-0-1406" name="__codelineno-0-1406"></a><span class="sd">            ```</span>
+</span><span id="__span-0-1407"><a id="__codelineno-0-1407" name="__codelineno-0-1407"></a>
+</span><span id="__span-0-1408"><a id="__codelineno-0-1408" name="__codelineno-0-1408"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-1409"><a id="__codelineno-0-1409" name="__codelineno-0-1409"></a>
+</span><span id="__span-0-1410"><a id="__codelineno-0-1410" name="__codelineno-0-1410"></a><span class="sd">            - `ValueError`:  </span>
+</span><span id="__span-0-1411"><a id="__codelineno-0-1411" name="__codelineno-0-1411"></a><span class="sd">            - If any variable specified in `vars_order` is not present in the `vars` dictionary.</span>
+</span><span id="__span-0-1412"><a id="__codelineno-0-1412" name="__codelineno-0-1412"></a><span class="sd">            - This ensures that all variables intended for consumption are available for processing.</span>
+</span><span id="__span-0-1413"><a id="__codelineno-0-1413" name="__codelineno-0-1413"></a>
+</span><span id="__span-0-1414"><a id="__codelineno-0-1414" name="__codelineno-0-1414"></a><span class="sd">        **Usage Example**:</span>
+</span><span id="__span-0-1415"><a id="__codelineno-0-1415" name="__codelineno-0-1415"></a>
+</span><span id="__span-0-1416"><a id="__codelineno-0-1416" name="__codelineno-0-1416"></a><span class="sd">        ```python</span>
+</span><span id="__span-0-1417"><a id="__codelineno-0-1417" name="__codelineno-0-1417"></a><span class="sd">        # Assume `variables_signatures` is a dictionary of variable-specific SnipeSig instances</span>
+</span><span id="__span-0-1418"><a id="__codelineno-0-1418" name="__codelineno-0-1418"></a><span class="sd">        variables_signatures = {</span>
+</span><span id="__span-0-1419"><a id="__codelineno-0-1419" name="__codelineno-0-1419"></a><span class="sd">            &quot;GTDB&quot;: sig_GTDB,</span>
+</span><span id="__span-0-1420"><a id="__codelineno-0-1420" name="__codelineno-0-1420"></a><span class="sd">            &quot;VIRALDB&quot;: sig_VIRALDB,</span>
+</span><span id="__span-0-1421"><a id="__codelineno-0-1421" name="__codelineno-0-1421"></a><span class="sd">            &quot;contaminant_X&quot;: sig_contaminant_x</span>
+</span><span id="__span-0-1422"><a id="__codelineno-0-1422" name="__codelineno-0-1422"></a><span class="sd">        }</span>
+</span><span id="__span-0-1423"><a id="__codelineno-0-1423" name="__codelineno-0-1423"></a>
+</span><span id="__span-0-1424"><a id="__codelineno-0-1424" name="__codelineno-0-1424"></a><span class="sd">        # Define the order in which variables should be processed</span>
+</span><span id="__span-0-1425"><a id="__codelineno-0-1425" name="__codelineno-0-1425"></a><span class="sd">        processing_order = [&quot;GTDB&quot;, &quot;VIRALDB&quot;, &quot;contaminant_X&quot;]</span>
+</span><span id="__span-0-1426"><a id="__codelineno-0-1426" name="__codelineno-0-1426"></a>
+</span><span id="__span-0-1427"><a id="__codelineno-0-1427" name="__codelineno-0-1427"></a><span class="sd">        # Consume non-reference k-mers and retrieve statistics</span>
+</span><span id="__span-0-1428"><a id="__codelineno-0-1428" name="__codelineno-0-1428"></a><span class="sd">        nonref_stats = qc.nonref_consume_from_vars(vars=variables_signatures, vars_order=processing_order)</span>
+</span><span id="__span-0-1429"><a id="__codelineno-0-1429" name="__codelineno-0-1429"></a>
+</span><span id="__span-0-1430"><a id="__codelineno-0-1430" name="__codelineno-0-1430"></a><span class="sd">        print(nonref_stats)</span>
+</span><span id="__span-0-1431"><a id="__codelineno-0-1431" name="__codelineno-0-1431"></a><span class="sd">        # Output Example:</span>
+</span><span id="__span-0-1432"><a id="__codelineno-0-1432" name="__codelineno-0-1432"></a><span class="sd">        # {</span>
+</span><span id="__span-0-1433"><a id="__codelineno-0-1433" name="__codelineno-0-1433"></a><span class="sd">        #     &quot;GTDB non-genomic total k-mer abundance&quot;: 1500.0,</span>
+</span><span id="__span-0-1434"><a id="__codelineno-0-1434" name="__codelineno-0-1434"></a><span class="sd">        #     &quot;GTDB non-genomic coverage index&quot;: 0.2,</span>
+</span><span id="__span-0-1435"><a id="__codelineno-0-1435" name="__codelineno-0-1435"></a><span class="sd">        #     &quot;VIRALDB non-genomic total k-mer abundance&quot;: 3500.0,</span>
+</span><span id="__span-0-1436"><a id="__codelineno-0-1436" name="__codelineno-0-1436"></a><span class="sd">        #     &quot;VIRALDB non-genomic coverage index&quot;: 0.70,</span>
+</span><span id="__span-0-1437"><a id="__codelineno-0-1437" name="__codelineno-0-1437"></a><span class="sd">        #     &quot;contaminant_X non-genomic total k-mer abundance&quot;: 0.0,</span>
+</span><span id="__span-0-1438"><a id="__codelineno-0-1438" name="__codelineno-0-1438"></a><span class="sd">        #     &quot;contaminant_X non-genomic coverage index&quot;: 0.0,</span>
+</span><span id="__span-0-1439"><a id="__codelineno-0-1439" name="__codelineno-0-1439"></a><span class="sd">        #     &quot;non-var non-genomic total k-mer abundance&quot;: 100.0,</span>
+</span><span id="__span-0-1440"><a id="__codelineno-0-1440" name="__codelineno-0-1440"></a><span class="sd">        #     &quot;non-var non-genomic coverage index&quot;: 0.1</span>
+</span><span id="__span-0-1441"><a id="__codelineno-0-1441" name="__codelineno-0-1441"></a><span class="sd">        # }</span>
+</span><span id="__span-0-1442"><a id="__codelineno-0-1442" name="__codelineno-0-1442"></a><span class="sd">        ```</span>
+</span><span id="__span-0-1443"><a id="__codelineno-0-1443" name="__codelineno-0-1443"></a>
+</span><span id="__span-0-1444"><a id="__codelineno-0-1444" name="__codelineno-0-1444"></a><span class="sd">        **Notes**:</span>
+</span><span id="__span-0-1445"><a id="__codelineno-0-1445" name="__codelineno-0-1445"></a>
+</span><span id="__span-0-1446"><a id="__codelineno-0-1446" name="__codelineno-0-1446"></a><span class="sd">            - **Variable Processing Order**:  </span>
+</span><span id="__span-0-1447"><a id="__codelineno-0-1447" name="__codelineno-0-1447"></a><span class="sd">            The `vars_order` list determines the sequence in which variables are processed. This order is crucial</span>
+</span><span id="__span-0-1448"><a id="__codelineno-0-1448" name="__codelineno-0-1448"></a><span class="sd">            when there is potential overlap in k-mers between variables, as earlier variables in the list have </span>
+</span><span id="__span-0-1449"><a id="__codelineno-0-1449" name="__codelineno-0-1449"></a><span class="sd">            higher priority in consuming shared k-mers.</span>
+</span><span id="__span-0-1450"><a id="__codelineno-0-1450" name="__codelineno-0-1450"></a>
+</span><span id="__span-0-1451"><a id="__codelineno-0-1451" name="__codelineno-0-1451"></a><span class="sd">            - **Non-Reference K-mers Definition**:  </span>
+</span><span id="__span-0-1452"><a id="__codelineno-0-1452" name="__codelineno-0-1452"></a><span class="sd">            Non-reference k-mers are defined as those present in the sample signature but absent in the reference </span>
+</span><span id="__span-0-1453"><a id="__codelineno-0-1453" name="__codelineno-0-1453"></a><span class="sd">            signature. This method focuses on characterizing these unique k-mers relative to provided variables.</span>
+</span><span id="__span-0-1454"><a id="__codelineno-0-1454" name="__codelineno-0-1454"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1455"><a id="__codelineno-0-1455" name="__codelineno-0-1455"></a>
+</span><span id="__span-0-1456"><a id="__codelineno-0-1456" name="__codelineno-0-1456"></a>        <span class="c1"># check the all vars in vars_order are in vars</span>
+</span><span id="__span-0-1457"><a id="__codelineno-0-1457" name="__codelineno-0-1457"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">all</span><span class="p">([</span><span class="n">var</span> <span class="ow">in</span> <span class="nb">vars</span> <span class="k">for</span> <span class="n">var</span> <span class="ow">in</span> <span class="n">vars_order</span><span class="p">]):</span>
+</span><span id="__span-0-1458"><a id="__codelineno-0-1458" name="__codelineno-0-1458"></a>            <span class="c1"># report dict keys, and the vars order</span>
+</span><span id="__span-0-1459"><a id="__codelineno-0-1459" name="__codelineno-0-1459"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Provided vars_order: </span><span class="si">%s</span><span class="s2">, and vars keys: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">vars_order</span><span class="p">,</span> <span class="nb">list</span><span class="p">(</span><span class="nb">vars</span><span class="o">.</span><span class="n">keys</span><span class="p">()))</span>
+</span><span id="__span-0-1460"><a id="__codelineno-0-1460" name="__codelineno-0-1460"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;All variables in vars_order must be present in vars.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1461"><a id="__codelineno-0-1461" name="__codelineno-0-1461"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All variables in vars_order must be present in vars.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1462"><a id="__codelineno-0-1462" name="__codelineno-0-1462"></a>
+</span><span id="__span-0-1463"><a id="__codelineno-0-1463" name="__codelineno-0-1463"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Consuming non-reference k-mers from provided variables.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1464"><a id="__codelineno-0-1464" name="__codelineno-0-1464"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Current size of the sample signature: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="p">))</span>
+</span><span id="__span-0-1465"><a id="__codelineno-0-1465" name="__codelineno-0-1465"></a>
+</span><span id="__span-0-1466"><a id="__codelineno-0-1466" name="__codelineno-0-1466"></a>        <span class="n">sample_nonref</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
+</span><span id="__span-0-1467"><a id="__codelineno-0-1467" name="__codelineno-0-1467"></a>
+</span><span id="__span-0-1468"><a id="__codelineno-0-1468" name="__codelineno-0-1468"></a>        <span class="n">sample_nonref</span><span class="o">.</span><span class="n">trim_singletons</span><span class="p">()</span>
+</span><span id="__span-0-1469"><a id="__codelineno-0-1469" name="__codelineno-0-1469"></a>
+</span><span id="__span-0-1470"><a id="__codelineno-0-1470" name="__codelineno-0-1470"></a>        <span class="n">sample_nonref_unique_hashes</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">)</span>
+</span><span id="__span-0-1471"><a id="__codelineno-0-1471" name="__codelineno-0-1471"></a>
+</span><span id="__span-0-1472"><a id="__codelineno-0-1472" name="__codelineno-0-1472"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Size of non-reference k-mers in the sample signature: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">))</span>
+</span><span id="__span-0-1473"><a id="__codelineno-0-1473" name="__codelineno-0-1473"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1474"><a id="__codelineno-0-1474" name="__codelineno-0-1474"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No non-reference k-mers found in the sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1475"><a id="__codelineno-0-1475" name="__codelineno-0-1475"></a>            <span class="k">return</span> <span class="p">{}</span>
+</span><span id="__span-0-1476"><a id="__codelineno-0-1476" name="__codelineno-0-1476"></a>
+</span><span id="__span-0-1477"><a id="__codelineno-0-1477" name="__codelineno-0-1477"></a>        <span class="c1"># intersect and report coverage and depth, then subtract from sample_nonref so sum will be 100%</span>
+</span><span id="__span-0-1478"><a id="__codelineno-0-1478" name="__codelineno-0-1478"></a>        <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">vars_order</span><span class="p">:</span>
+</span><span id="__span-0-1479"><a id="__codelineno-0-1479" name="__codelineno-0-1479"></a>            <span class="n">sample_nonref_var</span><span class="p">:</span> <span class="n">SnipeSig</span> <span class="o">=</span> <span class="n">sample_nonref</span> <span class="o">&amp;</span> <span class="nb">vars</span><span class="p">[</span><span class="n">var_name</span><span class="p">]</span>
+</span><span id="__span-0-1480"><a id="__codelineno-0-1480" name="__codelineno-0-1480"></a>            <span class="n">sample_nonref_var_total_abundance</span> <span class="o">=</span> <span class="n">sample_nonref_var</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-1481"><a id="__codelineno-0-1481" name="__codelineno-0-1481"></a>            <span class="n">sample_nonref_var_unique_hashes</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref_var</span><span class="p">)</span>
+</span><span id="__span-0-1482"><a id="__codelineno-0-1482" name="__codelineno-0-1482"></a>            <span class="n">sample_nonref_var_coverage_index</span> <span class="o">=</span> <span class="n">sample_nonref_var_unique_hashes</span> <span class="o">/</span> <span class="n">sample_nonref_unique_hashes</span>
+</span><span id="__span-0-1483"><a id="__codelineno-0-1483" name="__codelineno-0-1483"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-1484"><a id="__codelineno-0-1484" name="__codelineno-0-1484"></a>                <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2"> non-genomic total k-mer abundance&quot;</span><span class="p">:</span> <span class="n">sample_nonref_var_total_abundance</span><span class="p">,</span>
+</span><span id="__span-0-1485"><a id="__codelineno-0-1485" name="__codelineno-0-1485"></a>                <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2"> non-genomic coverage index&quot;</span><span class="p">:</span> <span class="n">sample_nonref_var_coverage_index</span>
+</span><span id="__span-0-1486"><a id="__codelineno-0-1486" name="__codelineno-0-1486"></a>            <span class="p">})</span>
+</span><span id="__span-0-1487"><a id="__codelineno-0-1487" name="__codelineno-0-1487"></a>
+</span><span id="__span-0-1488"><a id="__codelineno-0-1488" name="__codelineno-0-1488"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Consuming non-reference k-mers from variable &#39;</span><span class="si">%s</span><span class="s2">&#39;.&quot;</span><span class="p">,</span> <span class="n">var_name</span><span class="p">)</span>
+</span><span id="__span-0-1489"><a id="__codelineno-0-1489" name="__codelineno-0-1489"></a>            <span class="n">sample_nonref</span> <span class="o">-=</span> <span class="n">sample_nonref_var</span>
+</span><span id="__span-0-1490"><a id="__codelineno-0-1490" name="__codelineno-0-1490"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Size of remaining non-reference k-mers in the sample signature: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">))</span>
+</span><span id="__span-0-1491"><a id="__codelineno-0-1491" name="__codelineno-0-1491"></a>
+</span><span id="__span-0-1492"><a id="__codelineno-0-1492" name="__codelineno-0-1492"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="p">[</span><span class="s2">&quot;non-var non-genomic total k-mer abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">sample_nonref</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-1493"><a id="__codelineno-0-1493" name="__codelineno-0-1493"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="p">[</span><span class="s2">&quot;non-var non-genomic coverage index&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">)</span> <span class="o">/</span> <span class="n">sample_nonref_unique_hashes</span> <span class="k">if</span> <span class="n">sample_nonref_unique_hashes</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1494"><a id="__codelineno-0-1494" name="__codelineno-0-1494"></a>
+</span><span id="__span-0-1495"><a id="__codelineno-0-1495" name="__codelineno-0-1495"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span>
+</span><span id="__span-0-1496"><a id="__codelineno-0-1496" name="__codelineno-0-1496"></a>            <span class="s2">&quot;After consuming all vars from the non reference k-mers, the size of the sample signature is: </span><span class="si">%d</span><span class="s2"> hashes, &quot;</span>
+</span><span id="__span-0-1497"><a id="__codelineno-0-1497" name="__codelineno-0-1497"></a>            <span class="s2">&quot;with total abundance of </span><span class="si">%s</span><span class="s2">.&quot;</span><span class="p">,</span> 
+</span><span id="__span-0-1498"><a id="__codelineno-0-1498" name="__codelineno-0-1498"></a>            <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">),</span> <span class="n">sample_nonref</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-1499"><a id="__codelineno-0-1499" name="__codelineno-0-1499"></a>        <span class="p">)</span>
+</span><span id="__span-0-1500"><a id="__codelineno-0-1500" name="__codelineno-0-1500"></a>
+</span><span id="__span-0-1501"><a id="__codelineno-0-1501" name="__codelineno-0-1501"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span>
+</span><span id="__span-0-1502"><a id="__codelineno-0-1502" name="__codelineno-0-1502"></a>
+</span><span id="__span-0-1503"><a id="__codelineno-0-1503" name="__codelineno-0-1503"></a>    <span class="k">def</span> <span class="nf">load_genome_sig_to_dict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="n">zip_file_path</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">]:</span>
+</span><span id="__span-0-1504"><a id="__codelineno-0-1504" name="__codelineno-0-1504"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1505"><a id="__codelineno-0-1505" name="__codelineno-0-1505"></a><span class="sd">        Load a genome signature into a dictionary of SnipeSig instances.</span>
+</span><span id="__span-0-1506"><a id="__codelineno-0-1506" name="__codelineno-0-1506"></a>
+</span><span id="__span-0-1507"><a id="__codelineno-0-1507" name="__codelineno-0-1507"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1508"><a id="__codelineno-0-1508" name="__codelineno-0-1508"></a><span class="sd">            zip_file_path (str): Path to the zip file containing the genome signatures.</span>
+</span><span id="__span-0-1509"><a id="__codelineno-0-1509" name="__codelineno-0-1509"></a><span class="sd">            **kwargs: Additional keyword arguments to pass to the SnipeSig constructor.</span>
+</span><span id="__span-0-1510"><a id="__codelineno-0-1510" name="__codelineno-0-1510"></a>
+</span><span id="__span-0-1511"><a id="__codelineno-0-1511" name="__codelineno-0-1511"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1512"><a id="__codelineno-0-1512" name="__codelineno-0-1512"></a><span class="sd">            Dict[str, SnipeSig]: A dictionary mapping genome names to SnipeSig instances.</span>
+</span><span id="__span-0-1513"><a id="__codelineno-0-1513" name="__codelineno-0-1513"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1514"><a id="__codelineno-0-1514" name="__codelineno-0-1514"></a>
+</span><span id="__span-0-1515"><a id="__codelineno-0-1515" name="__codelineno-0-1515"></a>        <span class="n">genome_chr_name_to_sig</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1516"><a id="__codelineno-0-1516" name="__codelineno-0-1516"></a>
+</span><span id="__span-0-1517"><a id="__codelineno-0-1517" name="__codelineno-0-1517"></a>        <span class="n">sourmash_sigs</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">load_file_as_signatures</span><span class="p">(</span><span class="n">zip_file_path</span><span class="p">)</span>
+</span><span id="__span-0-1518"><a id="__codelineno-0-1518" name="__codelineno-0-1518"></a>        <span class="n">sex_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-1519"><a id="__codelineno-0-1519" name="__codelineno-0-1519"></a>        <span class="n">autosome_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-1520"><a id="__codelineno-0-1520" name="__codelineno-0-1520"></a>        <span class="n">genome_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-1521"><a id="__codelineno-0-1521" name="__codelineno-0-1521"></a>        <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
+</span><span id="__span-0-1522"><a id="__codelineno-0-1522" name="__codelineno-0-1522"></a>            <span class="n">name</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span>
+</span><span id="__span-0-1523"><a id="__codelineno-0-1523" name="__codelineno-0-1523"></a>            <span class="k">if</span> <span class="n">name</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">):</span>
+</span><span id="__span-0-1524"><a id="__codelineno-0-1524" name="__codelineno-0-1524"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Loading genome signature: </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1525"><a id="__codelineno-0-1525" name="__codelineno-0-1525"></a>                <span class="n">restored_name</span> <span class="o">=</span> <span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1526"><a id="__codelineno-0-1526" name="__codelineno-0-1526"></a>                <span class="n">genome_chr_name_to_sig</span><span class="p">[</span><span class="n">restored_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">)</span>
+</span><span id="__span-0-1527"><a id="__codelineno-0-1527" name="__codelineno-0-1527"></a>                <span class="n">genome_count</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-1528"><a id="__codelineno-0-1528" name="__codelineno-0-1528"></a>            <span class="k">elif</span> <span class="s2">&quot;sex&quot;</span> <span class="ow">in</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-1529"><a id="__codelineno-0-1529" name="__codelineno-0-1529"></a>                <span class="n">sex_count</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-1530"><a id="__codelineno-0-1530" name="__codelineno-0-1530"></a>                <span class="n">genome_chr_name_to_sig</span><span class="p">[</span><span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;sex-&#39;</span><span class="p">,</span><span class="s1">&#39;&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">)</span>
+</span><span id="__span-0-1531"><a id="__codelineno-0-1531" name="__codelineno-0-1531"></a>            <span class="k">elif</span> <span class="s2">&quot;autosome&quot;</span> <span class="ow">in</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-1532"><a id="__codelineno-0-1532" name="__codelineno-0-1532"></a>                <span class="n">autosome_count</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-1533"><a id="__codelineno-0-1533" name="__codelineno-0-1533"></a>                <span class="n">genome_chr_name_to_sig</span><span class="p">[</span><span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;autosome-&#39;</span><span class="p">,</span><span class="s1">&#39;&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">)</span>
+</span><span id="__span-0-1534"><a id="__codelineno-0-1534" name="__codelineno-0-1534"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1535"><a id="__codelineno-0-1535" name="__codelineno-0-1535"></a>                <span class="n">logging</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unknown genome signature name: </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">, are you sure you generated this with `snipe sketch --ref`?&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1536"><a id="__codelineno-0-1536" name="__codelineno-0-1536"></a>
+</span><span id="__span-0-1537"><a id="__codelineno-0-1537" name="__codelineno-0-1537"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded </span><span class="si">%d</span><span class="s2"> genome signatures and </span><span class="si">%d</span><span class="s2"> sex chrs and </span><span class="si">%d</span><span class="s2"> autosome chrs&quot;</span><span class="p">,</span> <span class="n">genome_count</span><span class="p">,</span> <span class="n">sex_count</span><span class="p">,</span> <span class="n">autosome_count</span><span class="p">)</span>
+</span><span id="__span-0-1538"><a id="__codelineno-0-1538" name="__codelineno-0-1538"></a>
+</span><span id="__span-0-1539"><a id="__codelineno-0-1539" name="__codelineno-0-1539"></a>        <span class="k">if</span> <span class="n">genome_count</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-1540"><a id="__codelineno-0-1540" name="__codelineno-0-1540"></a>            <span class="n">logging</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Expected 1 genome signature, found </span><span class="si">{</span><span class="n">genome_count</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1541"><a id="__codelineno-0-1541" name="__codelineno-0-1541"></a>
+</span><span id="__span-0-1542"><a id="__codelineno-0-1542" name="__codelineno-0-1542"></a>
+</span><span id="__span-0-1543"><a id="__codelineno-0-1543" name="__codelineno-0-1543"></a>        <span class="k">return</span> <span class="n">genome_chr_name_to_sig</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -3647,69 +4968,7 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.calculate_chromosome_metrics" class="
 
             <details class="quote">
               <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-970"> 970</a></span>
-<span class="normal"><a href="#__codelineno-0-971"> 971</a></span>
-<span class="normal"><a href="#__codelineno-0-972"> 972</a></span>
-<span class="normal"><a href="#__codelineno-0-973"> 973</a></span>
-<span class="normal"><a href="#__codelineno-0-974"> 974</a></span>
-<span class="normal"><a href="#__codelineno-0-975"> 975</a></span>
-<span class="normal"><a href="#__codelineno-0-976"> 976</a></span>
-<span class="normal"><a href="#__codelineno-0-977"> 977</a></span>
-<span class="normal"><a href="#__codelineno-0-978"> 978</a></span>
-<span class="normal"><a href="#__codelineno-0-979"> 979</a></span>
-<span class="normal"><a href="#__codelineno-0-980"> 980</a></span>
-<span class="normal"><a href="#__codelineno-0-981"> 981</a></span>
-<span class="normal"><a href="#__codelineno-0-982"> 982</a></span>
-<span class="normal"><a href="#__codelineno-0-983"> 983</a></span>
-<span class="normal"><a href="#__codelineno-0-984"> 984</a></span>
-<span class="normal"><a href="#__codelineno-0-985"> 985</a></span>
-<span class="normal"><a href="#__codelineno-0-986"> 986</a></span>
-<span class="normal"><a href="#__codelineno-0-987"> 987</a></span>
-<span class="normal"><a href="#__codelineno-0-988"> 988</a></span>
-<span class="normal"><a href="#__codelineno-0-989"> 989</a></span>
-<span class="normal"><a href="#__codelineno-0-990"> 990</a></span>
-<span class="normal"><a href="#__codelineno-0-991"> 991</a></span>
-<span class="normal"><a href="#__codelineno-0-992"> 992</a></span>
-<span class="normal"><a href="#__codelineno-0-993"> 993</a></span>
-<span class="normal"><a href="#__codelineno-0-994"> 994</a></span>
-<span class="normal"><a href="#__codelineno-0-995"> 995</a></span>
-<span class="normal"><a href="#__codelineno-0-996"> 996</a></span>
-<span class="normal"><a href="#__codelineno-0-997"> 997</a></span>
-<span class="normal"><a href="#__codelineno-0-998"> 998</a></span>
-<span class="normal"><a href="#__codelineno-0-999"> 999</a></span>
-<span class="normal"><a href="#__codelineno-0-1000">1000</a></span>
-<span class="normal"><a href="#__codelineno-0-1001">1001</a></span>
-<span class="normal"><a href="#__codelineno-0-1002">1002</a></span>
-<span class="normal"><a href="#__codelineno-0-1003">1003</a></span>
-<span class="normal"><a href="#__codelineno-0-1004">1004</a></span>
-<span class="normal"><a href="#__codelineno-0-1005">1005</a></span>
-<span class="normal"><a href="#__codelineno-0-1006">1006</a></span>
-<span class="normal"><a href="#__codelineno-0-1007">1007</a></span>
-<span class="normal"><a href="#__codelineno-0-1008">1008</a></span>
-<span class="normal"><a href="#__codelineno-0-1009">1009</a></span>
-<span class="normal"><a href="#__codelineno-0-1010">1010</a></span>
-<span class="normal"><a href="#__codelineno-0-1011">1011</a></span>
-<span class="normal"><a href="#__codelineno-0-1012">1012</a></span>
-<span class="normal"><a href="#__codelineno-0-1013">1013</a></span>
-<span class="normal"><a href="#__codelineno-0-1014">1014</a></span>
-<span class="normal"><a href="#__codelineno-0-1015">1015</a></span>
-<span class="normal"><a href="#__codelineno-0-1016">1016</a></span>
-<span class="normal"><a href="#__codelineno-0-1017">1017</a></span>
-<span class="normal"><a href="#__codelineno-0-1018">1018</a></span>
-<span class="normal"><a href="#__codelineno-0-1019">1019</a></span>
-<span class="normal"><a href="#__codelineno-0-1020">1020</a></span>
-<span class="normal"><a href="#__codelineno-0-1021">1021</a></span>
-<span class="normal"><a href="#__codelineno-0-1022">1022</a></span>
-<span class="normal"><a href="#__codelineno-0-1023">1023</a></span>
-<span class="normal"><a href="#__codelineno-0-1024">1024</a></span>
-<span class="normal"><a href="#__codelineno-0-1025">1025</a></span>
-<span class="normal"><a href="#__codelineno-0-1026">1026</a></span>
-<span class="normal"><a href="#__codelineno-0-1027">1027</a></span>
-<span class="normal"><a href="#__codelineno-0-1028">1028</a></span>
-<span class="normal"><a href="#__codelineno-0-1029">1029</a></span>
-<span class="normal"><a href="#__codelineno-0-1030">1030</a></span>
-<span class="normal"><a href="#__codelineno-0-1031">1031</a></span>
-<span class="normal"><a href="#__codelineno-0-1032">1032</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1032">1032</a></span>
 <span class="normal"><a href="#__codelineno-0-1033">1033</a></span>
 <span class="normal"><a href="#__codelineno-0-1034">1034</a></span>
 <span class="normal"><a href="#__codelineno-0-1035">1035</a></span>
@@ -3745,108 +5004,180 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.calculate_chromosome_metrics" class="
 <span class="normal"><a href="#__codelineno-0-1065">1065</a></span>
 <span class="normal"><a href="#__codelineno-0-1066">1066</a></span>
 <span class="normal"><a href="#__codelineno-0-1067">1067</a></span>
-<span class="normal"><a href="#__codelineno-0-1068">1068</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a><span class="k">def</span> <span class="nf">calculate_chromosome_metrics</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
-</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a><span class="sd">    Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.</span>
-</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a>
-</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a><span class="sd">    This method computes the CV to assess the variability of mean abundances among autosomal chromosomes,</span>
-</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a><span class="sd">    excluding any sex chromosomes.</span>
-</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>
-</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>
-</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a><span class="sd">    The Coefficient of Variation (CV) is defined as:</span>
-</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>
-</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a><span class="sd">    $$</span>
-</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a><span class="sd">    \text{CV} = \frac{\sigma}{\mu}</span>
-</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a><span class="sd">    $$</span>
-</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>
-</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a><span class="sd">    Where:</span>
-</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a><span class="sd">    - \( \sigma \) is the standard deviation of the mean abundances across autosomal chromosomes.</span>
-</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a><span class="sd">    - \( \mu \) is the mean of the mean abundances across autosomal chromosomes.</span>
-</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>
-</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>
-</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a><span class="sd">    - `chr_to_sig` (`Dict[str, SnipeSig]`):  </span>
-</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a><span class="sd">      A dictionary mapping chromosome names (e.g., `&#39;autosomal-1&#39;`, `&#39;autosomal-2&#39;`, `&#39;sex-x&#39;`, `&#39;sex-y&#39;`) to their corresponding</span>
-</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a><span class="sd">      `SnipeSig` instances. Each `SnipeSig` should represent the k-mer signature of a specific chromosome.</span>
-</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>
-</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>
-</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a><span class="sd">    - `Dict[str, Any]`:  </span>
-</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a><span class="sd">      A dictionary containing the computed metrics:</span>
-</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a><span class="sd">          - `&quot;Autosomal_CV&quot;` (`float`):  </span>
-</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a><span class="sd">            The coefficient of variation of mean abundances across autosomal chromosomes.</span>
-</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>
-</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a>
-</span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a><span class="sd">    - `ValueError`:  </span>
-</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a><span class="sd">      If `chr_to_sig` is empty or if there is an inconsistency in the signatures&#39; parameters.</span>
-</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>
-</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a><span class="sd">    **Usage Example**:</span>
-</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>
-</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a><span class="sd">    ```python</span>
-</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a><span class="sd">    # Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances</span>
-</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a><span class="sd">    chr_signatures = {</span>
-</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a><span class="sd">        &quot;1&quot;: sig_chr1,</span>
-</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a><span class="sd">        &quot;2&quot;: sig_chr2,</span>
-</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a><span class="sd">        &quot;X&quot;: sig_chrX,</span>
-</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a><span class="sd">        &quot;Y&quot;: sig_chrY</span>
-</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a><span class="sd">    }</span>
-</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>
-</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a><span class="sd">    # Calculate chromosome metrics</span>
-</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a><span class="sd">    metrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)</span>
-</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>
-</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a><span class="sd">    print(metrics)</span>
-</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a><span class="sd">    # Output:</span>
-</span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a><span class="sd">    # {&#39;Autosomal_CV&#39;: 0.15}</span>
-</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a><span class="sd">    ```</span>
-</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>
-</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a><span class="sd">    **Notes**:</span>
-</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>
-</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a><span class="sd">    - **Exclusion of Sex Chromosomes**:  </span>
-</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a><span class="sd">      Chromosomes with names containing the substring `&quot;sex&quot;` (e.g., `&#39;sex-y&#39;`, `&#39;sex-x&#39;`) are excluded from the CV calculation to focus solely on autosomal chromosomes.</span>
-</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>
-</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a><span class="sd">    - **Mean Abundance Calculation**:  </span>
-</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a><span class="sd">      The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.</span>
-</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a>
-</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>    <span class="c1"># Implementation of the method</span>
-</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>    <span class="c1"># let&#39;s make sure all chromosome sigs are unique</span>
-</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>    <span class="n">specific_chr_to_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">get_unique_signatures</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="p">)</span>
-</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>
-</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>    <span class="c1"># calculate mean abundance for each chromosome and loaded sample sig</span>
-</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>    <span class="n">chr_to_mean_abundance</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating mean abundance for each chromosome.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>    <span class="k">for</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">chr_sig</span> <span class="ow">in</span> <span class="n">specific_chr_to_sig</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>        <span class="n">chr_sample_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">chr_sig</span>
-</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>        <span class="n">chr_stats</span> <span class="o">=</span> <span class="n">chr_sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
-</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>        <span class="n">chr_to_mean_abundance</span><span class="p">[</span><span class="n">chr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">chr_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">]</span>
-</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Mean abundance for </span><span class="si">%s</span><span class="s2">: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">chr_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">])</span>
-</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a>
-</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a>
-</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>    <span class="c1"># chr_to_mean_abundance but without any chr with partial name sex</span>
-</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>    <span class="n">autosomal_chr_to_mean_abundance</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>    <span class="k">for</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">mean_abundance</span> <span class="ow">in</span> <span class="n">chr_to_mean_abundance</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>        <span class="k">if</span> <span class="s2">&quot;sex&quot;</span> <span class="ow">in</span> <span class="n">chr_name</span><span class="o">.</span><span class="n">lower</span><span class="p">():</span>
-</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a>            <span class="k">continue</span>
-</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a>        <span class="n">autosomal_chr_to_mean_abundance</span><span class="p">[</span><span class="n">chr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">mean_abundance</span>
-</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a>
-</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>
-</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a>    <span class="c1"># calculate the CV for the whole sample</span>
-</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a>    <span class="k">if</span> <span class="n">autosomal_chr_to_mean_abundance</span><span class="p">:</span>
-</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a>        <span class="n">mean_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">autosomal_chr_to_mean_abundance</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">float</span><span class="p">)</span>
-</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a>        <span class="n">cv</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span>
-</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Autosomal_CV&quot;</span><span class="p">:</span> <span class="n">cv</span><span class="p">})</span>
-</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated Autosomal CV: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">cv</span><span class="p">)</span>
-</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No autosomal chromosomes were processed. &#39;Autosomal_CV&#39; set to None.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Autosomal_CV&quot;</span><span class="p">:</span> <span class="kc">None</span><span class="p">})</span>
-</span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a>
-</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a>    <span class="c1"># optional return, not required</span>
-</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span>
-</span></code></pre></div></td></tr></table></div>
-            </details>
-    </div>
+<span class="normal"><a href="#__codelineno-0-1068">1068</a></span>
+<span class="normal"><a href="#__codelineno-0-1069">1069</a></span>
+<span class="normal"><a href="#__codelineno-0-1070">1070</a></span>
+<span class="normal"><a href="#__codelineno-0-1071">1071</a></span>
+<span class="normal"><a href="#__codelineno-0-1072">1072</a></span>
+<span class="normal"><a href="#__codelineno-0-1073">1073</a></span>
+<span class="normal"><a href="#__codelineno-0-1074">1074</a></span>
+<span class="normal"><a href="#__codelineno-0-1075">1075</a></span>
+<span class="normal"><a href="#__codelineno-0-1076">1076</a></span>
+<span class="normal"><a href="#__codelineno-0-1077">1077</a></span>
+<span class="normal"><a href="#__codelineno-0-1078">1078</a></span>
+<span class="normal"><a href="#__codelineno-0-1079">1079</a></span>
+<span class="normal"><a href="#__codelineno-0-1080">1080</a></span>
+<span class="normal"><a href="#__codelineno-0-1081">1081</a></span>
+<span class="normal"><a href="#__codelineno-0-1082">1082</a></span>
+<span class="normal"><a href="#__codelineno-0-1083">1083</a></span>
+<span class="normal"><a href="#__codelineno-0-1084">1084</a></span>
+<span class="normal"><a href="#__codelineno-0-1085">1085</a></span>
+<span class="normal"><a href="#__codelineno-0-1086">1086</a></span>
+<span class="normal"><a href="#__codelineno-0-1087">1087</a></span>
+<span class="normal"><a href="#__codelineno-0-1088">1088</a></span>
+<span class="normal"><a href="#__codelineno-0-1089">1089</a></span>
+<span class="normal"><a href="#__codelineno-0-1090">1090</a></span>
+<span class="normal"><a href="#__codelineno-0-1091">1091</a></span>
+<span class="normal"><a href="#__codelineno-0-1092">1092</a></span>
+<span class="normal"><a href="#__codelineno-0-1093">1093</a></span>
+<span class="normal"><a href="#__codelineno-0-1094">1094</a></span>
+<span class="normal"><a href="#__codelineno-0-1095">1095</a></span>
+<span class="normal"><a href="#__codelineno-0-1096">1096</a></span>
+<span class="normal"><a href="#__codelineno-0-1097">1097</a></span>
+<span class="normal"><a href="#__codelineno-0-1098">1098</a></span>
+<span class="normal"><a href="#__codelineno-0-1099">1099</a></span>
+<span class="normal"><a href="#__codelineno-0-1100">1100</a></span>
+<span class="normal"><a href="#__codelineno-0-1101">1101</a></span>
+<span class="normal"><a href="#__codelineno-0-1102">1102</a></span>
+<span class="normal"><a href="#__codelineno-0-1103">1103</a></span>
+<span class="normal"><a href="#__codelineno-0-1104">1104</a></span>
+<span class="normal"><a href="#__codelineno-0-1105">1105</a></span>
+<span class="normal"><a href="#__codelineno-0-1106">1106</a></span>
+<span class="normal"><a href="#__codelineno-0-1107">1107</a></span>
+<span class="normal"><a href="#__codelineno-0-1108">1108</a></span>
+<span class="normal"><a href="#__codelineno-0-1109">1109</a></span>
+<span class="normal"><a href="#__codelineno-0-1110">1110</a></span>
+<span class="normal"><a href="#__codelineno-0-1111">1111</a></span>
+<span class="normal"><a href="#__codelineno-0-1112">1112</a></span>
+<span class="normal"><a href="#__codelineno-0-1113">1113</a></span>
+<span class="normal"><a href="#__codelineno-0-1114">1114</a></span>
+<span class="normal"><a href="#__codelineno-0-1115">1115</a></span>
+<span class="normal"><a href="#__codelineno-0-1116">1116</a></span>
+<span class="normal"><a href="#__codelineno-0-1117">1117</a></span>
+<span class="normal"><a href="#__codelineno-0-1118">1118</a></span>
+<span class="normal"><a href="#__codelineno-0-1119">1119</a></span>
+<span class="normal"><a href="#__codelineno-0-1120">1120</a></span>
+<span class="normal"><a href="#__codelineno-0-1121">1121</a></span>
+<span class="normal"><a href="#__codelineno-0-1122">1122</a></span>
+<span class="normal"><a href="#__codelineno-0-1123">1123</a></span>
+<span class="normal"><a href="#__codelineno-0-1124">1124</a></span>
+<span class="normal"><a href="#__codelineno-0-1125">1125</a></span>
+<span class="normal"><a href="#__codelineno-0-1126">1126</a></span>
+<span class="normal"><a href="#__codelineno-0-1127">1127</a></span>
+<span class="normal"><a href="#__codelineno-0-1128">1128</a></span>
+<span class="normal"><a href="#__codelineno-0-1129">1129</a></span>
+<span class="normal"><a href="#__codelineno-0-1130">1130</a></span>
+<span class="normal"><a href="#__codelineno-0-1131">1131</a></span>
+<span class="normal"><a href="#__codelineno-0-1132">1132</a></span>
+<span class="normal"><a href="#__codelineno-0-1133">1133</a></span>
+<span class="normal"><a href="#__codelineno-0-1134">1134</a></span>
+<span class="normal"><a href="#__codelineno-0-1135">1135</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a><span class="k">def</span> <span class="nf">calculate_chromosome_metrics</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a><span class="sd">    Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.</span>
+</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>
+</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a><span class="sd">    This method computes the CV to assess the variability of mean abundances among autosomal chromosomes,</span>
+</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a><span class="sd">    excluding any sex chromosomes.</span>
+</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>
+</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a><span class="sd">    **Mathematical Explanation**:</span>
+</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>
+</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a><span class="sd">    The Coefficient of Variation (CV) is defined as:</span>
+</span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>
+</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a><span class="sd">    \text{CV} = \frac{\sigma}{\mu}</span>
+</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>
+</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a><span class="sd">    Where:</span>
+</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a><span class="sd">    - \( \sigma \) is the standard deviation of the mean abundances across autosomal chromosomes.</span>
+</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a><span class="sd">    - \( \mu \) is the mean of the mean abundances across autosomal chromosomes.</span>
+</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>
+</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>
+</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a><span class="sd">    - `chr_to_sig` (`Dict[str, SnipeSig]`):  </span>
+</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a><span class="sd">      A dictionary mapping chromosome names (e.g., `&#39;autosomal-1&#39;`, `&#39;autosomal-2&#39;`, `&#39;sex-x&#39;`, `&#39;sex-y&#39;`) to their corresponding</span>
+</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a><span class="sd">      `SnipeSig` instances. Each `SnipeSig` should represent the k-mer signature of a specific chromosome.</span>
+</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>
+</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a>
+</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a><span class="sd">    - `Dict[str, Any]`:  </span>
+</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a><span class="sd">      A dictionary containing the computed metrics:</span>
+</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a><span class="sd">          - `&quot;Autosomal_CV&quot;` (`float`):  </span>
+</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a><span class="sd">            The coefficient of variation of mean abundances across autosomal chromosomes.</span>
+</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a>
+</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a>
+</span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a><span class="sd">    - `ValueError`:  </span>
+</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a><span class="sd">      If `chr_to_sig` is empty or if there is an inconsistency in the signatures&#39; parameters.</span>
+</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a>
+</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a><span class="sd">    **Usage Example**:</span>
+</span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a>
+</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a><span class="sd">    ```python</span>
+</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="sd">    # Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances</span>
+</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">    chr_signatures = {</span>
+</span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a><span class="sd">        &quot;1&quot;: sig_chr1,</span>
+</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">        &quot;2&quot;: sig_chr2,</span>
+</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">        &quot;X&quot;: sig_chrX,</span>
+</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a><span class="sd">        &quot;Y&quot;: sig_chrY</span>
+</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">    }</span>
+</span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a>
+</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a><span class="sd">    # Calculate chromosome metrics</span>
+</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">    metrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)</span>
+</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a>
+</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a><span class="sd">    print(metrics)</span>
+</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a><span class="sd">    # Output:</span>
+</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a><span class="sd">    # {&#39;Autosomal_CV&#39;: 0.15}</span>
+</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a><span class="sd">    ```</span>
+</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a>
+</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a><span class="sd">    **Notes**:</span>
+</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a>
+</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a><span class="sd">    - **Exclusion of Sex Chromosomes**:  </span>
+</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a><span class="sd">      Chromosomes with names containing the substring `&quot;sex&quot;` (e.g., `&#39;sex-y&#39;`, `&#39;sex-x&#39;`) are excluded from the CV calculation to focus solely on autosomal chromosomes.</span>
+</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a>
+</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a><span class="sd">    - **Mean Abundance Calculation**:  </span>
+</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a><span class="sd">      The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.</span>
+</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a>
+</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a>    <span class="c1"># Implementation of the method</span>
+</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>    <span class="c1"># let&#39;s make sure all chromosome sigs are unique</span>
+</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Computing specific chromosome hashes for </span><span class="si">%s</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="s1">&#39;,&#39;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">()))</span>
+</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-All hashes for chromosomes before getting unique sigs </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">SnipeSig</span><span class="o">.</span><span class="n">sum_signatures</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="o">.</span><span class="n">values</span><span class="p">())))</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>    <span class="n">specific_chr_to_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">get_unique_signatures</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="p">)</span>
+</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-All hashes for chromosomes after getting unique sigs </span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="n">SnipeSig</span><span class="o">.</span><span class="n">sum_signatures</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">specific_chr_to_sig</span><span class="o">.</span><span class="n">values</span><span class="p">())))</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a>
+</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>    <span class="c1"># calculate mean abundance for each chromosome and loaded sample sig</span>
+</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>    <span class="n">chr_to_mean_abundance</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating mean abundance for each chromosome.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a>    <span class="k">for</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">chr_sig</span> <span class="ow">in</span> <span class="n">specific_chr_to_sig</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersecting </span><span class="si">%s</span><span class="s2"> (</span><span class="si">%d</span><span class="s2">) with </span><span class="si">%s</span><span class="s2"> (</span><span class="si">%d</span><span class="s2">)&quot;</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">name</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="p">),</span> <span class="n">chr_name</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">chr_sig</span><span class="p">))</span>
+</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a>        <span class="n">chr_sample_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">chr_sig</span>
+</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>        <span class="n">chr_stats</span> <span class="o">=</span> <span class="n">chr_sample_sig</span><span class="o">.</span><span class="n">get_sample_stats</span>
+</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a>        <span class="n">chr_to_mean_abundance</span><span class="p">[</span><span class="n">chr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">chr_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">]</span>
+</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Mean abundance for </span><span class="si">%s</span><span class="s2">: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">chr_stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">])</span>
+</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a>
+</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">chr_to_mean_abundance</span><span class="p">)</span>
+</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a>
+</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>    <span class="c1"># chr_to_mean_abundance but without any chr with partial name sex</span>
+</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>    <span class="n">autosomal_chr_to_mean_abundance</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>    <span class="k">for</span> <span class="n">chr_name</span><span class="p">,</span> <span class="n">mean_abundance</span> <span class="ow">in</span> <span class="n">chr_to_mean_abundance</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>        <span class="k">if</span> <span class="s2">&quot;sex&quot;</span> <span class="ow">in</span> <span class="n">chr_name</span><span class="o">.</span><span class="n">lower</span><span class="p">():</span>
+</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a>            <span class="k">continue</span>
+</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a>        <span class="n">autosomal_chr_to_mean_abundance</span><span class="p">[</span><span class="n">chr_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">mean_abundance</span>
+</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a>
+</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a>
+</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a>    <span class="c1"># calculate the CV for the whole sample</span>
+</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a>    <span class="k">if</span> <span class="n">autosomal_chr_to_mean_abundance</span><span class="p">:</span>
+</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a>        <span class="n">mean_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">autosomal_chr_to_mean_abundance</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="nb">float</span><span class="p">)</span>
+</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a>        <span class="n">cv</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">std</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="o">/</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">mean_abundances</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Autosomal_CV&quot;</span><span class="p">:</span> <span class="n">cv</span><span class="p">})</span>
+</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated Autosomal CV: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">cv</span><span class="p">)</span>
+</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No autosomal chromosomes were processed. &#39;Autosomal_CV&#39; set to None.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Autosomal_CV&quot;</span><span class="p">:</span> <span class="kc">None</span><span class="p">})</span>
+</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a>
+</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a>    <span class="c1"># optional return, not required</span>
+</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
 
 </div>
 
@@ -3904,61 +5235,7 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.calculate_coverage_vs_depth" class="d
 
             <details class="quote">
               <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-718">718</a></span>
-<span class="normal"><a href="#__codelineno-0-719">719</a></span>
-<span class="normal"><a href="#__codelineno-0-720">720</a></span>
-<span class="normal"><a href="#__codelineno-0-721">721</a></span>
-<span class="normal"><a href="#__codelineno-0-722">722</a></span>
-<span class="normal"><a href="#__codelineno-0-723">723</a></span>
-<span class="normal"><a href="#__codelineno-0-724">724</a></span>
-<span class="normal"><a href="#__codelineno-0-725">725</a></span>
-<span class="normal"><a href="#__codelineno-0-726">726</a></span>
-<span class="normal"><a href="#__codelineno-0-727">727</a></span>
-<span class="normal"><a href="#__codelineno-0-728">728</a></span>
-<span class="normal"><a href="#__codelineno-0-729">729</a></span>
-<span class="normal"><a href="#__codelineno-0-730">730</a></span>
-<span class="normal"><a href="#__codelineno-0-731">731</a></span>
-<span class="normal"><a href="#__codelineno-0-732">732</a></span>
-<span class="normal"><a href="#__codelineno-0-733">733</a></span>
-<span class="normal"><a href="#__codelineno-0-734">734</a></span>
-<span class="normal"><a href="#__codelineno-0-735">735</a></span>
-<span class="normal"><a href="#__codelineno-0-736">736</a></span>
-<span class="normal"><a href="#__codelineno-0-737">737</a></span>
-<span class="normal"><a href="#__codelineno-0-738">738</a></span>
-<span class="normal"><a href="#__codelineno-0-739">739</a></span>
-<span class="normal"><a href="#__codelineno-0-740">740</a></span>
-<span class="normal"><a href="#__codelineno-0-741">741</a></span>
-<span class="normal"><a href="#__codelineno-0-742">742</a></span>
-<span class="normal"><a href="#__codelineno-0-743">743</a></span>
-<span class="normal"><a href="#__codelineno-0-744">744</a></span>
-<span class="normal"><a href="#__codelineno-0-745">745</a></span>
-<span class="normal"><a href="#__codelineno-0-746">746</a></span>
-<span class="normal"><a href="#__codelineno-0-747">747</a></span>
-<span class="normal"><a href="#__codelineno-0-748">748</a></span>
-<span class="normal"><a href="#__codelineno-0-749">749</a></span>
-<span class="normal"><a href="#__codelineno-0-750">750</a></span>
-<span class="normal"><a href="#__codelineno-0-751">751</a></span>
-<span class="normal"><a href="#__codelineno-0-752">752</a></span>
-<span class="normal"><a href="#__codelineno-0-753">753</a></span>
-<span class="normal"><a href="#__codelineno-0-754">754</a></span>
-<span class="normal"><a href="#__codelineno-0-755">755</a></span>
-<span class="normal"><a href="#__codelineno-0-756">756</a></span>
-<span class="normal"><a href="#__codelineno-0-757">757</a></span>
-<span class="normal"><a href="#__codelineno-0-758">758</a></span>
-<span class="normal"><a href="#__codelineno-0-759">759</a></span>
-<span class="normal"><a href="#__codelineno-0-760">760</a></span>
-<span class="normal"><a href="#__codelineno-0-761">761</a></span>
-<span class="normal"><a href="#__codelineno-0-762">762</a></span>
-<span class="normal"><a href="#__codelineno-0-763">763</a></span>
-<span class="normal"><a href="#__codelineno-0-764">764</a></span>
-<span class="normal"><a href="#__codelineno-0-765">765</a></span>
-<span class="normal"><a href="#__codelineno-0-766">766</a></span>
-<span class="normal"><a href="#__codelineno-0-767">767</a></span>
-<span class="normal"><a href="#__codelineno-0-768">768</a></span>
-<span class="normal"><a href="#__codelineno-0-769">769</a></span>
-<span class="normal"><a href="#__codelineno-0-770">770</a></span>
-<span class="normal"><a href="#__codelineno-0-771">771</a></span>
-<span class="normal"><a href="#__codelineno-0-772">772</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-772">772</a></span>
 <span class="normal"><a href="#__codelineno-0-773">773</a></span>
 <span class="normal"><a href="#__codelineno-0-774">774</a></span>
 <span class="normal"><a href="#__codelineno-0-775">775</a></span>
@@ -4006,109 +5283,179 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.calculate_coverage_vs_depth" class="d
 <span class="normal"><a href="#__codelineno-0-817">817</a></span>
 <span class="normal"><a href="#__codelineno-0-818">818</a></span>
 <span class="normal"><a href="#__codelineno-0-819">819</a></span>
-<span class="normal"><a href="#__codelineno-0-820">820</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a><span class="k">def</span> <span class="nf">calculate_coverage_vs_depth</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">30</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]:</span>
-</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a><span class="sd">    Calculate cumulative coverage index vs cumulative sequencing depth.</span>
-</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a>
-</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a><span class="sd">    This method simulates incremental sequencing by splitting the sample signature into `n` parts and</span>
-</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a><span class="sd">    calculating the cumulative coverage index at each step. It helps in understanding how coverage</span>
-</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a><span class="sd">    improves with increased sequencing depth.</span>
-</span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a>
-</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a>
-</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a><span class="sd">    For each cumulative part \( i \) (where \( 1 \leq i \leq n \)):</span>
-</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a>
-</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a><span class="sd">    - **Cumulative Sequencing Depth** (\( D_i \)):</span>
-</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a><span class="sd">      $$</span>
-</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a><span class="sd">      D_i = \sum_{j=1}^{i} a_j</span>
-</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a><span class="sd">      $$</span>
-</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a><span class="sd">      Where \( a_j \) is the total abundance of the \( j^{th} \) part.</span>
-</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a>
-</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a><span class="sd">    - **Cumulative Coverage Index** (\( C_i \)):</span>
-</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a><span class="sd">      $$</span>
-</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a><span class="sd">      C_i = \frac{\text{Number of genomic unique k-mers in first } i \text{ parts}}{\left| \text{Reference genome k-mer set} \right|}</span>
-</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a><span class="sd">      $$</span>
-</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a>
-</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a>
-</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a><span class="sd">    - `n` (`int`): Number of parts to split the signature into.</span>
-</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a>
-</span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a>
-</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a><span class="sd">    - `List[Dict[str, Any]]`:  </span>
-</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a><span class="sd">      List of dictionaries containing:</span>
-</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a><span class="sd">        - `&quot;cumulative_parts&quot;` (`int`): Number of parts included.</span>
-</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a><span class="sd">        - `&quot;cumulative_total_abundance&quot;` (`int`): Total sequencing depth up to this part.</span>
-</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a><span class="sd">        - `&quot;cumulative_coverage_index&quot;` (`float`): Coverage index up to this part.</span>
-</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a>
-</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a><span class="sd">    **Usage Example**:</span>
-</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a>
-</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a><span class="sd">    ```python</span>
-</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a><span class="sd">    coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)</span>
-</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a><span class="sd">    for data in coverage_depth_data:</span>
-</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a><span class="sd">        print(data)</span>
-</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a><span class="sd">    ```</span>
-</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating coverage vs depth with </span><span class="si">%d</span><span class="s2"> parts.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>    <span class="c1"># Determine the ROI reference signature</span>
-</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
-</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a>        <span class="n">roi_reference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
-</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using amplicon signature as ROI reference.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>        <span class="n">roi_reference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
-</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using reference genome signature as ROI reference.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-769"><a id="__codelineno-0-769" name="__codelineno-0-769"></a>
-</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a>    <span class="c1"># Split the sample signature into n random parts</span>
-</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a>    <span class="n">split_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">split_sig_randomly</span><span class="p">(</span><span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a>
-</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a>    <span class="n">coverage_depth_data</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a>
-</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a>    <span class="n">cumulative_snipe_sig</span> <span class="o">=</span> <span class="n">split_sigs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
-</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a>    <span class="n">cumulative_total_abundance</span> <span class="o">=</span> <span class="n">cumulative_snipe_sig</span><span class="o">.</span><span class="n">total_abundance</span>
-</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a>
-</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a>    <span class="c1">#! force conversion to GENOME</span>
-</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a>    <span class="n">roi_reference_sig</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span>
-</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a>
-</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a>    <span class="c1"># Compute initial coverage index</span>
-</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a>    <span class="n">cumulative_qc</span> <span class="o">=</span> <span class="n">ReferenceQC</span><span class="p">(</span>
-</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a>        <span class="n">sample_sig</span><span class="o">=</span><span class="n">cumulative_snipe_sig</span><span class="p">,</span>
-</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a>        <span class="n">reference_sig</span><span class="o">=</span><span class="n">roi_reference_sig</span><span class="p">,</span>
-</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
-</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a>    <span class="p">)</span>
-</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a>    <span class="n">cumulative_stats</span> <span class="o">=</span> <span class="n">cumulative_qc</span><span class="o">.</span><span class="n">get_aggregated_stats</span><span class="p">()</span>
-</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a>    <span class="n">cumulative_coverage_index</span> <span class="o">=</span> <span class="n">cumulative_stats</span><span class="p">[</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">]</span>
+<span class="normal"><a href="#__codelineno-0-820">820</a></span>
+<span class="normal"><a href="#__codelineno-0-821">821</a></span>
+<span class="normal"><a href="#__codelineno-0-822">822</a></span>
+<span class="normal"><a href="#__codelineno-0-823">823</a></span>
+<span class="normal"><a href="#__codelineno-0-824">824</a></span>
+<span class="normal"><a href="#__codelineno-0-825">825</a></span>
+<span class="normal"><a href="#__codelineno-0-826">826</a></span>
+<span class="normal"><a href="#__codelineno-0-827">827</a></span>
+<span class="normal"><a href="#__codelineno-0-828">828</a></span>
+<span class="normal"><a href="#__codelineno-0-829">829</a></span>
+<span class="normal"><a href="#__codelineno-0-830">830</a></span>
+<span class="normal"><a href="#__codelineno-0-831">831</a></span>
+<span class="normal"><a href="#__codelineno-0-832">832</a></span>
+<span class="normal"><a href="#__codelineno-0-833">833</a></span>
+<span class="normal"><a href="#__codelineno-0-834">834</a></span>
+<span class="normal"><a href="#__codelineno-0-835">835</a></span>
+<span class="normal"><a href="#__codelineno-0-836">836</a></span>
+<span class="normal"><a href="#__codelineno-0-837">837</a></span>
+<span class="normal"><a href="#__codelineno-0-838">838</a></span>
+<span class="normal"><a href="#__codelineno-0-839">839</a></span>
+<span class="normal"><a href="#__codelineno-0-840">840</a></span>
+<span class="normal"><a href="#__codelineno-0-841">841</a></span>
+<span class="normal"><a href="#__codelineno-0-842">842</a></span>
+<span class="normal"><a href="#__codelineno-0-843">843</a></span>
+<span class="normal"><a href="#__codelineno-0-844">844</a></span>
+<span class="normal"><a href="#__codelineno-0-845">845</a></span>
+<span class="normal"><a href="#__codelineno-0-846">846</a></span>
+<span class="normal"><a href="#__codelineno-0-847">847</a></span>
+<span class="normal"><a href="#__codelineno-0-848">848</a></span>
+<span class="normal"><a href="#__codelineno-0-849">849</a></span>
+<span class="normal"><a href="#__codelineno-0-850">850</a></span>
+<span class="normal"><a href="#__codelineno-0-851">851</a></span>
+<span class="normal"><a href="#__codelineno-0-852">852</a></span>
+<span class="normal"><a href="#__codelineno-0-853">853</a></span>
+<span class="normal"><a href="#__codelineno-0-854">854</a></span>
+<span class="normal"><a href="#__codelineno-0-855">855</a></span>
+<span class="normal"><a href="#__codelineno-0-856">856</a></span>
+<span class="normal"><a href="#__codelineno-0-857">857</a></span>
+<span class="normal"><a href="#__codelineno-0-858">858</a></span>
+<span class="normal"><a href="#__codelineno-0-859">859</a></span>
+<span class="normal"><a href="#__codelineno-0-860">860</a></span>
+<span class="normal"><a href="#__codelineno-0-861">861</a></span>
+<span class="normal"><a href="#__codelineno-0-862">862</a></span>
+<span class="normal"><a href="#__codelineno-0-863">863</a></span>
+<span class="normal"><a href="#__codelineno-0-864">864</a></span>
+<span class="normal"><a href="#__codelineno-0-865">865</a></span>
+<span class="normal"><a href="#__codelineno-0-866">866</a></span>
+<span class="normal"><a href="#__codelineno-0-867">867</a></span>
+<span class="normal"><a href="#__codelineno-0-868">868</a></span>
+<span class="normal"><a href="#__codelineno-0-869">869</a></span>
+<span class="normal"><a href="#__codelineno-0-870">870</a></span>
+<span class="normal"><a href="#__codelineno-0-871">871</a></span>
+<span class="normal"><a href="#__codelineno-0-872">872</a></span>
+<span class="normal"><a href="#__codelineno-0-873">873</a></span>
+<span class="normal"><a href="#__codelineno-0-874">874</a></span>
+<span class="normal"><a href="#__codelineno-0-875">875</a></span>
+<span class="normal"><a href="#__codelineno-0-876">876</a></span>
+<span class="normal"><a href="#__codelineno-0-877">877</a></span>
+<span class="normal"><a href="#__codelineno-0-878">878</a></span>
+<span class="normal"><a href="#__codelineno-0-879">879</a></span>
+<span class="normal"><a href="#__codelineno-0-880">880</a></span>
+<span class="normal"><a href="#__codelineno-0-881">881</a></span>
+<span class="normal"><a href="#__codelineno-0-882">882</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a><span class="k">def</span> <span class="nf">calculate_coverage_vs_depth</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">30</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]]:</span>
+</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a><span class="sd">    Calculate cumulative coverage index vs cumulative sequencing depth.</span>
+</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a>
+</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a><span class="sd">    This method simulates incremental sequencing by splitting the sample signature into `n` parts and</span>
+</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a><span class="sd">    calculating the cumulative coverage index at each step. It helps in understanding how coverage</span>
+</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a><span class="sd">    improves with increased sequencing depth.</span>
+</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a>
+</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a><span class="sd">    **Mathematical Explanation**:</span>
+</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a>
+</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a><span class="sd">    For each cumulative part \( i \) (where \( 1 \leq i \leq n \)):</span>
+</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a>
+</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a><span class="sd">    - **Cumulative Sequencing Depth** (\( D_i \)):</span>
+</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a><span class="sd">      $$</span>
+</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a><span class="sd">      D_i = \sum_{j=1}^{i} a_j</span>
+</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a><span class="sd">      $$</span>
+</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a><span class="sd">      Where \( a_j \) is the total abundance of the \( j^{th} \) part.</span>
 </span><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a>
-</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a>    <span class="n">coverage_depth_data</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a>        <span class="s2">&quot;cumulative_parts&quot;</span><span class="p">:</span> <span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a>        <span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">:</span> <span class="n">cumulative_total_abundance</span><span class="p">,</span>
-</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>        <span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">:</span> <span class="n">cumulative_coverage_index</span><span class="p">,</span>
-</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>    <span class="p">})</span>
-</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a>
-</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a>    <span class="c1"># Iterate over the rest of the parts</span>
-</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
-</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a>        <span class="n">current_part</span> <span class="o">=</span> <span class="n">split_sigs</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a>
-</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a>        <span class="c1"># Add current part to cumulative signature</span>
-</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a>        <span class="n">cumulative_snipe_sig</span> <span class="o">+=</span> <span class="n">current_part</span>
-</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a>        <span class="n">cumulative_total_abundance</span> <span class="o">+=</span> <span class="n">current_part</span><span class="o">.</span><span class="n">total_abundance</span>
-</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a>
-</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a>        <span class="c1"># Compute new coverage index</span>
-</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a>        <span class="n">cumulative_qc</span> <span class="o">=</span> <span class="n">ReferenceQC</span><span class="p">(</span>
-</span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>            <span class="n">sample_sig</span><span class="o">=</span><span class="n">cumulative_snipe_sig</span><span class="p">,</span>
-</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a>            <span class="n">reference_sig</span><span class="o">=</span><span class="n">roi_reference_sig</span><span class="p">,</span>
-</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
-</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a>        <span class="p">)</span>
-</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a>        <span class="n">cumulative_stats</span> <span class="o">=</span> <span class="n">cumulative_qc</span><span class="o">.</span><span class="n">get_aggregated_stats</span><span class="p">()</span>
-</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>        <span class="n">cumulative_coverage_index</span> <span class="o">=</span> <span class="n">cumulative_stats</span><span class="p">[</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">]</span>
-</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a>
-</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a>        <span class="n">coverage_depth_data</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
-</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a>            <span class="s2">&quot;cumulative_parts&quot;</span><span class="p">:</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span>
-</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a>            <span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">:</span> <span class="n">cumulative_total_abundance</span><span class="p">,</span>
-</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a>            <span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">:</span> <span class="n">cumulative_coverage_index</span><span class="p">,</span>
-</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a>        <span class="p">})</span>
-</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>
-</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Coverage vs depth calculation completed.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>    <span class="k">return</span> <span class="n">coverage_depth_data</span>
+</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a><span class="sd">    - **Cumulative Coverage Index** (\( C_i \)):</span>
+</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a><span class="sd">      $$</span>
+</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a><span class="sd">      C_i = \frac{\text{Number of genomic unique k-mers in first } i \text{ parts}}{\left| \text{Reference genome k-mer set} \right|}</span>
+</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a><span class="sd">      $$</span>
+</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>
+</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a>
+</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a><span class="sd">    - `n` (`int`): Number of parts to split the signature into.</span>
+</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a>
+</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a>
+</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a><span class="sd">    - `List[Dict[str, Any]]`:  </span>
+</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a><span class="sd">      List of dictionaries containing:</span>
+</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a><span class="sd">        - `&quot;cumulative_parts&quot;` (`int`): Number of parts included.</span>
+</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a><span class="sd">        - `&quot;cumulative_total_abundance&quot;` (`int`): Total sequencing depth up to this part.</span>
+</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a><span class="sd">        - `&quot;cumulative_coverage_index&quot;` (`float`): Coverage index up to this part.</span>
+</span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>
+</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a><span class="sd">    **Usage Example**:</span>
+</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a>
+</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a><span class="sd">    ```python</span>
+</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a><span class="sd">    coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)</span>
+</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a><span class="sd">    for data in coverage_depth_data:</span>
+</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a><span class="sd">        print(data)</span>
+</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a><span class="sd">    ```</span>
+</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating coverage vs depth with </span><span class="si">%d</span><span class="s2"> parts.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a>    <span class="c1"># Determine the ROI reference signature</span>
+</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
+</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>        <span class="n">roi_reference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span>
+</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using amplicon signature as ROI reference.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a>        <span class="n">roi_reference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
+</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using reference genome signature as ROI reference.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a>
+</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a>    <span class="c1"># Split the sample signature into n random parts (cached if available)</span>
+</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a>    <span class="n">split_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">split_sig_randomly</span><span class="p">(</span><span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a>
+</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a>    <span class="n">coverage_depth_data</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a>
+</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">split_sigs</span><span class="p">:</span>
+</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;No split signatures available. Cannot calculate coverage vs depth.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a>        <span class="k">return</span> <span class="n">coverage_depth_data</span>
+</span><span id="__span-0-832"><a id="__codelineno-0-832" name="__codelineno-0-832"></a>
+</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a>    <span class="n">cumulative_snipe_sig</span> <span class="o">=</span> <span class="n">split_sigs</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span>
+</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a>    <span class="n">cumulative_total_abundance</span> <span class="o">=</span> <span class="n">cumulative_snipe_sig</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a>
+</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a>    <span class="c1"># Force conversion to GENOME</span>
+</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a>    <span class="n">roi_reference_sig</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span>
+</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a>
+</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a>    <span class="c1"># Compute initial coverage index</span>
+</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a>    <span class="n">cumulative_qc</span> <span class="o">=</span> <span class="n">ReferenceQC</span><span class="p">(</span>
+</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>        <span class="n">sample_sig</span><span class="o">=</span><span class="n">cumulative_snipe_sig</span><span class="p">,</span>
+</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a>        <span class="n">reference_sig</span><span class="o">=</span><span class="n">roi_reference_sig</span><span class="p">,</span>
+</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
+</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a>    <span class="p">)</span>
+</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a>    <span class="n">cumulative_stats</span> <span class="o">=</span> <span class="n">cumulative_qc</span><span class="o">.</span><span class="n">get_aggregated_stats</span><span class="p">()</span>
+</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a>    <span class="n">cumulative_coverage_index</span> <span class="o">=</span> <span class="n">cumulative_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a>
+</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a>    <span class="n">coverage_depth_data</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a>        <span class="s2">&quot;cumulative_parts&quot;</span><span class="p">:</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>        <span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">:</span> <span class="n">cumulative_total_abundance</span><span class="p">,</span>
+</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a>        <span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">:</span> <span class="n">cumulative_coverage_index</span><span class="p">,</span>
+</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a>    <span class="p">})</span>
+</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a>
+</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Added initial coverage depth data for part 1.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a>
+</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a>    <span class="c1"># Iterate over the rest of the parts</span>
+</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a>    <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="n">n</span><span class="p">):</span>
+</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a>        <span class="n">current_part</span> <span class="o">=</span> <span class="n">split_sigs</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a>
+</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a>        <span class="c1"># Add current part to cumulative signature</span>
+</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a>        <span class="n">cumulative_snipe_sig</span> <span class="o">+=</span> <span class="n">current_part</span>
+</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a>        <span class="n">cumulative_total_abundance</span> <span class="o">+=</span> <span class="n">current_part</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>
+</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a>        <span class="c1"># Compute new coverage index</span>
+</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a>        <span class="n">cumulative_qc</span> <span class="o">=</span> <span class="n">ReferenceQC</span><span class="p">(</span>
+</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a>            <span class="n">sample_sig</span><span class="o">=</span><span class="n">cumulative_snipe_sig</span><span class="p">,</span>
+</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>            <span class="n">reference_sig</span><span class="o">=</span><span class="n">roi_reference_sig</span><span class="p">,</span>
+</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
+</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>        <span class="p">)</span>
+</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a>        <span class="n">cumulative_stats</span> <span class="o">=</span> <span class="n">cumulative_qc</span><span class="o">.</span><span class="n">get_aggregated_stats</span><span class="p">()</span>
+</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>        <span class="n">cumulative_coverage_index</span> <span class="o">=</span> <span class="n">cumulative_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;Genome coverage index&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a>
+</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>        <span class="n">coverage_depth_data</span><span class="o">.</span><span class="n">append</span><span class="p">({</span>
+</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a>            <span class="s2">&quot;cumulative_parts&quot;</span><span class="p">:</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a>            <span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">:</span> <span class="n">cumulative_total_abundance</span><span class="p">,</span>
+</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a>            <span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">:</span> <span class="n">cumulative_coverage_index</span><span class="p">,</span>
+</span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>        <span class="p">})</span>
+</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a>
+</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Added coverage depth data for part </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">i</span> <span class="o">+</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a>
+</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Coverage vs depth calculation completed.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a>    <span class="k">return</span> <span class="n">coverage_depth_data</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4214,74 +5561,7 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.calculate_sex_chrs_metrics" class="do
 
             <details class="quote">
               <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1071">1071</a></span>
-<span class="normal"><a href="#__codelineno-0-1072">1072</a></span>
-<span class="normal"><a href="#__codelineno-0-1073">1073</a></span>
-<span class="normal"><a href="#__codelineno-0-1074">1074</a></span>
-<span class="normal"><a href="#__codelineno-0-1075">1075</a></span>
-<span class="normal"><a href="#__codelineno-0-1076">1076</a></span>
-<span class="normal"><a href="#__codelineno-0-1077">1077</a></span>
-<span class="normal"><a href="#__codelineno-0-1078">1078</a></span>
-<span class="normal"><a href="#__codelineno-0-1079">1079</a></span>
-<span class="normal"><a href="#__codelineno-0-1080">1080</a></span>
-<span class="normal"><a href="#__codelineno-0-1081">1081</a></span>
-<span class="normal"><a href="#__codelineno-0-1082">1082</a></span>
-<span class="normal"><a href="#__codelineno-0-1083">1083</a></span>
-<span class="normal"><a href="#__codelineno-0-1084">1084</a></span>
-<span class="normal"><a href="#__codelineno-0-1085">1085</a></span>
-<span class="normal"><a href="#__codelineno-0-1086">1086</a></span>
-<span class="normal"><a href="#__codelineno-0-1087">1087</a></span>
-<span class="normal"><a href="#__codelineno-0-1088">1088</a></span>
-<span class="normal"><a href="#__codelineno-0-1089">1089</a></span>
-<span class="normal"><a href="#__codelineno-0-1090">1090</a></span>
-<span class="normal"><a href="#__codelineno-0-1091">1091</a></span>
-<span class="normal"><a href="#__codelineno-0-1092">1092</a></span>
-<span class="normal"><a href="#__codelineno-0-1093">1093</a></span>
-<span class="normal"><a href="#__codelineno-0-1094">1094</a></span>
-<span class="normal"><a href="#__codelineno-0-1095">1095</a></span>
-<span class="normal"><a href="#__codelineno-0-1096">1096</a></span>
-<span class="normal"><a href="#__codelineno-0-1097">1097</a></span>
-<span class="normal"><a href="#__codelineno-0-1098">1098</a></span>
-<span class="normal"><a href="#__codelineno-0-1099">1099</a></span>
-<span class="normal"><a href="#__codelineno-0-1100">1100</a></span>
-<span class="normal"><a href="#__codelineno-0-1101">1101</a></span>
-<span class="normal"><a href="#__codelineno-0-1102">1102</a></span>
-<span class="normal"><a href="#__codelineno-0-1103">1103</a></span>
-<span class="normal"><a href="#__codelineno-0-1104">1104</a></span>
-<span class="normal"><a href="#__codelineno-0-1105">1105</a></span>
-<span class="normal"><a href="#__codelineno-0-1106">1106</a></span>
-<span class="normal"><a href="#__codelineno-0-1107">1107</a></span>
-<span class="normal"><a href="#__codelineno-0-1108">1108</a></span>
-<span class="normal"><a href="#__codelineno-0-1109">1109</a></span>
-<span class="normal"><a href="#__codelineno-0-1110">1110</a></span>
-<span class="normal"><a href="#__codelineno-0-1111">1111</a></span>
-<span class="normal"><a href="#__codelineno-0-1112">1112</a></span>
-<span class="normal"><a href="#__codelineno-0-1113">1113</a></span>
-<span class="normal"><a href="#__codelineno-0-1114">1114</a></span>
-<span class="normal"><a href="#__codelineno-0-1115">1115</a></span>
-<span class="normal"><a href="#__codelineno-0-1116">1116</a></span>
-<span class="normal"><a href="#__codelineno-0-1117">1117</a></span>
-<span class="normal"><a href="#__codelineno-0-1118">1118</a></span>
-<span class="normal"><a href="#__codelineno-0-1119">1119</a></span>
-<span class="normal"><a href="#__codelineno-0-1120">1120</a></span>
-<span class="normal"><a href="#__codelineno-0-1121">1121</a></span>
-<span class="normal"><a href="#__codelineno-0-1122">1122</a></span>
-<span class="normal"><a href="#__codelineno-0-1123">1123</a></span>
-<span class="normal"><a href="#__codelineno-0-1124">1124</a></span>
-<span class="normal"><a href="#__codelineno-0-1125">1125</a></span>
-<span class="normal"><a href="#__codelineno-0-1126">1126</a></span>
-<span class="normal"><a href="#__codelineno-0-1127">1127</a></span>
-<span class="normal"><a href="#__codelineno-0-1128">1128</a></span>
-<span class="normal"><a href="#__codelineno-0-1129">1129</a></span>
-<span class="normal"><a href="#__codelineno-0-1130">1130</a></span>
-<span class="normal"><a href="#__codelineno-0-1131">1131</a></span>
-<span class="normal"><a href="#__codelineno-0-1132">1132</a></span>
-<span class="normal"><a href="#__codelineno-0-1133">1133</a></span>
-<span class="normal"><a href="#__codelineno-0-1134">1134</a></span>
-<span class="normal"><a href="#__codelineno-0-1135">1135</a></span>
-<span class="normal"><a href="#__codelineno-0-1136">1136</a></span>
-<span class="normal"><a href="#__codelineno-0-1137">1137</a></span>
-<span class="normal"><a href="#__codelineno-0-1138">1138</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1138">1138</a></span>
 <span class="normal"><a href="#__codelineno-0-1139">1139</a></span>
 <span class="normal"><a href="#__codelineno-0-1140">1140</a></span>
 <span class="normal"><a href="#__codelineno-0-1141">1141</a></span>
@@ -4413,206 +5693,273 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.calculate_sex_chrs_metrics" class="do
 <span class="normal"><a href="#__codelineno-0-1267">1267</a></span>
 <span class="normal"><a href="#__codelineno-0-1268">1268</a></span>
 <span class="normal"><a href="#__codelineno-0-1269">1269</a></span>
-<span class="normal"><a href="#__codelineno-0-1270">1270</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a><span class="k">def</span> <span class="nf">calculate_sex_chrs_metrics</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">genome_and_chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
-</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">    Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.</span>
-</span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a>
-</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">    This method processes a collection of genome and chromosome-specific `SnipeSig` instances to compute</span>
-</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">    metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains</span>
-</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a><span class="sd">    only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome.</span>
-</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">    The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to</span>
-</span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a><span class="sd">    accurately assess sex chromosome metrics.</span>
-</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a>
-</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a>
-</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a><span class="sd">    - **X-Ploidy Score**:</span>
-</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a>
-</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a><span class="sd">      The X-Ploidy score is calculated using the formula:</span>
-</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a>
-</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a><span class="sd">      $$</span>
-</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a><span class="sd">      \text{X-Ploidy} = \left(\frac{\mu_X}{\mu_{\text{autosomal}}}\right) \times \left(\frac{N_{\text{autosomal}}}{N_X}\right)</span>
-</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a><span class="sd">      $$</span>
-</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a>
-</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a><span class="sd">      Where:</span>
-</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a><span class="sd">      - \( \mu_X \) is the mean abundance of X chromosome-specific k-mers in the sample.</span>
-</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a><span class="sd">      - \( \mu_{\text{autosomal}} \) is the mean abundance of autosomal k-mers in the sample.</span>
-</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a><span class="sd">      - \( N_{\text{autosomal}} \) is the number of autosomal k-mers in the reference genome.</span>
-</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a><span class="sd">      - \( N_X \) is the number of X chromosome-specific k-mers in the reference genome.</span>
-</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a>
-</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a><span class="sd">    - **Y-Coverage**:</span>
-</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>
-</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a><span class="sd">      The Y-Coverage is calculated using the formula:</span>
-</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>
-</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a><span class="sd">      $$</span>
-</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a><span class="sd">      \text{Y-Coverage} = \frac{\left(\frac{N_Y^{\text{sample}}}{N_Y}\right)}{\left(\frac{N_{\text{autosomal}}^{\text{sample}}}{N_{\text{autosomal}}}\right)}</span>
-</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a><span class="sd">      $$</span>
-</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>
-</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a><span class="sd">      Where:</span>
-</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a><span class="sd">      - \( N_Y^{\text{sample}} \) is the number of Y chromosome-specific k-mers in the sample.</span>
-</span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a><span class="sd">      - \( N_Y \) is the number of Y chromosome-specific k-mers in the reference genome.</span>
-</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a><span class="sd">      - \( N_{\text{autosomal}}^{\text{sample}} \) is the number of autosomal k-mers in the sample.</span>
-</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a><span class="sd">      - \( N_{\text{autosomal}} \) is the number of autosomal k-mers in the reference genome.</span>
-</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>
-</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>
-</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a><span class="sd">        - `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  </span>
-</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a><span class="sd">          A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include</span>
-</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a><span class="sd">          the autosomal genome signature (with a name ending in `&#39;-snipegenome&#39;`) and chromosome-specific</span>
-</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a><span class="sd">          signatures (e.g., `&#39;sex-x&#39;`, `&#39;sex-y&#39;`, `&#39;autosome-1&#39;`, `&#39;autosome-2&#39;`, etc.).</span>
-</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>
-</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>
-</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a><span class="sd">        - `Dict[str, Any]`:  </span>
-</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a><span class="sd">          A dictionary containing the calculated sex-related metrics:</span>
-</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a><span class="sd">              - `&quot;X-Ploidy score&quot;` (`float`):  </span>
-</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a><span class="sd">                The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance</span>
-</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a><span class="sd">                to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.</span>
-</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a><span class="sd">              - `&quot;Y-Coverage&quot;` (`float`, optional):  </span>
-</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a><span class="sd">                The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.</span>
-</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a><span class="sd">                This key is present only if a Y chromosome signature is provided.</span>
-</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>
-</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>
-</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a><span class="sd">        - `ValueError`:  </span>
-</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a><span class="sd">          - If the `&#39;sex-x&#39;` chromosome signature is not found in `genome_and_chr_to_sig`.</span>
-</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a><span class="sd">          - If the autosomal genome signature is not found or improperly labeled.</span>
-</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a>
-</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a><span class="sd">    **Usage Example**:</span>
-</span><span id="__span-0-1136"><a id="__codelineno-0-1136" name="__codelineno-0-1136"></a>
-</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a><span class="sd">    ```python</span>
-</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a><span class="sd">    # Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances</span>
-</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a><span class="sd">    genome_and_chr_signatures = {</span>
-</span><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a><span class="sd">        &quot;autosomal-snipegenome&quot;: sig_autosomal_genome,</span>
-</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a><span class="sd">        &quot;1&quot;: sig_chr1,</span>
-</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a><span class="sd">        &quot;2&quot;: sig_chr2,</span>
-</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a><span class="sd">        &quot;sex-x&quot;: sig_sex_x,</span>
-</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a><span class="sd">        &quot;sex-y&quot;: sig_sex_y</span>
-</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a><span class="sd">    }</span>
-</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a>
-</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a><span class="sd">    # Calculate sex chromosome metrics</span>
-</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a><span class="sd">    metrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)</span>
+<span class="normal"><a href="#__codelineno-0-1270">1270</a></span>
+<span class="normal"><a href="#__codelineno-0-1271">1271</a></span>
+<span class="normal"><a href="#__codelineno-0-1272">1272</a></span>
+<span class="normal"><a href="#__codelineno-0-1273">1273</a></span>
+<span class="normal"><a href="#__codelineno-0-1274">1274</a></span>
+<span class="normal"><a href="#__codelineno-0-1275">1275</a></span>
+<span class="normal"><a href="#__codelineno-0-1276">1276</a></span>
+<span class="normal"><a href="#__codelineno-0-1277">1277</a></span>
+<span class="normal"><a href="#__codelineno-0-1278">1278</a></span>
+<span class="normal"><a href="#__codelineno-0-1279">1279</a></span>
+<span class="normal"><a href="#__codelineno-0-1280">1280</a></span>
+<span class="normal"><a href="#__codelineno-0-1281">1281</a></span>
+<span class="normal"><a href="#__codelineno-0-1282">1282</a></span>
+<span class="normal"><a href="#__codelineno-0-1283">1283</a></span>
+<span class="normal"><a href="#__codelineno-0-1284">1284</a></span>
+<span class="normal"><a href="#__codelineno-0-1285">1285</a></span>
+<span class="normal"><a href="#__codelineno-0-1286">1286</a></span>
+<span class="normal"><a href="#__codelineno-0-1287">1287</a></span>
+<span class="normal"><a href="#__codelineno-0-1288">1288</a></span>
+<span class="normal"><a href="#__codelineno-0-1289">1289</a></span>
+<span class="normal"><a href="#__codelineno-0-1290">1290</a></span>
+<span class="normal"><a href="#__codelineno-0-1291">1291</a></span>
+<span class="normal"><a href="#__codelineno-0-1292">1292</a></span>
+<span class="normal"><a href="#__codelineno-0-1293">1293</a></span>
+<span class="normal"><a href="#__codelineno-0-1294">1294</a></span>
+<span class="normal"><a href="#__codelineno-0-1295">1295</a></span>
+<span class="normal"><a href="#__codelineno-0-1296">1296</a></span>
+<span class="normal"><a href="#__codelineno-0-1297">1297</a></span>
+<span class="normal"><a href="#__codelineno-0-1298">1298</a></span>
+<span class="normal"><a href="#__codelineno-0-1299">1299</a></span>
+<span class="normal"><a href="#__codelineno-0-1300">1300</a></span>
+<span class="normal"><a href="#__codelineno-0-1301">1301</a></span>
+<span class="normal"><a href="#__codelineno-0-1302">1302</a></span>
+<span class="normal"><a href="#__codelineno-0-1303">1303</a></span>
+<span class="normal"><a href="#__codelineno-0-1304">1304</a></span>
+<span class="normal"><a href="#__codelineno-0-1305">1305</a></span>
+<span class="normal"><a href="#__codelineno-0-1306">1306</a></span>
+<span class="normal"><a href="#__codelineno-0-1307">1307</a></span>
+<span class="normal"><a href="#__codelineno-0-1308">1308</a></span>
+<span class="normal"><a href="#__codelineno-0-1309">1309</a></span>
+<span class="normal"><a href="#__codelineno-0-1310">1310</a></span>
+<span class="normal"><a href="#__codelineno-0-1311">1311</a></span>
+<span class="normal"><a href="#__codelineno-0-1312">1312</a></span>
+<span class="normal"><a href="#__codelineno-0-1313">1313</a></span>
+<span class="normal"><a href="#__codelineno-0-1314">1314</a></span>
+<span class="normal"><a href="#__codelineno-0-1315">1315</a></span>
+<span class="normal"><a href="#__codelineno-0-1316">1316</a></span>
+<span class="normal"><a href="#__codelineno-0-1317">1317</a></span>
+<span class="normal"><a href="#__codelineno-0-1318">1318</a></span>
+<span class="normal"><a href="#__codelineno-0-1319">1319</a></span>
+<span class="normal"><a href="#__codelineno-0-1320">1320</a></span>
+<span class="normal"><a href="#__codelineno-0-1321">1321</a></span>
+<span class="normal"><a href="#__codelineno-0-1322">1322</a></span>
+<span class="normal"><a href="#__codelineno-0-1323">1323</a></span>
+<span class="normal"><a href="#__codelineno-0-1324">1324</a></span>
+<span class="normal"><a href="#__codelineno-0-1325">1325</a></span>
+<span class="normal"><a href="#__codelineno-0-1326">1326</a></span>
+<span class="normal"><a href="#__codelineno-0-1327">1327</a></span>
+<span class="normal"><a href="#__codelineno-0-1328">1328</a></span>
+<span class="normal"><a href="#__codelineno-0-1329">1329</a></span>
+<span class="normal"><a href="#__codelineno-0-1330">1330</a></span>
+<span class="normal"><a href="#__codelineno-0-1331">1331</a></span>
+<span class="normal"><a href="#__codelineno-0-1332">1332</a></span>
+<span class="normal"><a href="#__codelineno-0-1333">1333</a></span>
+<span class="normal"><a href="#__codelineno-0-1334">1334</a></span>
+<span class="normal"><a href="#__codelineno-0-1335">1335</a></span>
+<span class="normal"><a href="#__codelineno-0-1336">1336</a></span>
+<span class="normal"><a href="#__codelineno-0-1337">1337</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a><span class="k">def</span> <span class="nf">calculate_sex_chrs_metrics</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">genome_and_chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a><span class="sd">    Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.</span>
+</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a>
+</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a><span class="sd">    This method processes a collection of genome and chromosome-specific `SnipeSig` instances to compute</span>
+</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a><span class="sd">    metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains</span>
+</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a><span class="sd">    only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome.</span>
+</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a><span class="sd">    The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to</span>
+</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a><span class="sd">    accurately assess sex chromosome metrics.</span>
+</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a>
+</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a><span class="sd">    **Mathematical Explanation**:</span>
 </span><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a>
-</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a><span class="sd">    print(metrics)</span>
-</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a><span class="sd">    # Output Example:</span>
-</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a><span class="sd">    # {</span>
-</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a><span class="sd">    #     &quot;X-Ploidy score&quot;: 2.6667,</span>
-</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a><span class="sd">    #     &quot;Y-Coverage&quot;: 0.0</span>
-</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a><span class="sd">    # }</span>
-</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a><span class="sd">    ```</span>
+</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a><span class="sd">    - **X-Ploidy Score**:</span>
+</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a>
+</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a><span class="sd">      The X-Ploidy score is calculated using the formula:</span>
+</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a>
+</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a><span class="sd">      $$</span>
+</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a><span class="sd">      \text{X-Ploidy} = \left(\frac{\mu_X}{\mu_{\text{autosomal}}}\right) \times \left(\frac{N_{\text{autosomal}}}{N_X}\right)</span>
+</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a><span class="sd">      $$</span>
 </span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a>
-</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a><span class="sd">    **Notes**:</span>
-</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a>
-</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a><span class="sd">        - **Signature Naming Convention**:  </span>
-</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a><span class="sd">          The autosomal genome signature must have a name ending with `&#39;-snipegenome&#39;`. Chromosome-specific</span>
-</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a><span class="sd">          signatures should be named accordingly (e.g., `&#39;sex-x&#39;`, `&#39;sex-y&#39;`, `&#39;autosomal-1&#39;`, `&#39;autosomal-2&#39;`, etc.).</span>
+</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a><span class="sd">      Where:</span>
+</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a><span class="sd">      - \( \mu_X \) is the mean abundance of X chromosome-specific k-mers in the sample.</span>
+</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a><span class="sd">      - \( \mu_{\text{autosomal}} \) is the mean abundance of autosomal k-mers in the sample.</span>
+</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a><span class="sd">      - \( N_{\text{autosomal}} \) is the number of autosomal k-mers in the reference genome.</span>
+</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a><span class="sd">      - \( N_X \) is the number of X chromosome-specific k-mers in the reference genome.</span>
 </span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a>
-</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a><span class="sd">        - **Exclusion of Sex Chromosomes from Autosomal Genome**:  </span>
-</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a><span class="sd">          The Y chromosome signature (`&#39;sex-y&#39;`) is subtracted from the autosomal genome signature to ensure</span>
-</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a><span class="sd">          that Y chromosome k-mers are not counted towards autosomal metrics.</span>
+</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a><span class="sd">    - **Y-Coverage**:</span>
+</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a>
+</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a><span class="sd">      The Y-Coverage is calculated using the formula:</span>
 </span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>
-</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a><span class="sd">        - **Robustness**:  </span>
-</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a><span class="sd">          The method includes comprehensive logging for debugging purposes, tracking each major step and</span>
-</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a><span class="sd">          any exclusions made during processing.</span>
-</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a>
-</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a>    <span class="c1"># Ensure that the chromosome X signature exists</span>
-</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>    <span class="k">if</span> <span class="s1">&#39;sex-x&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">genome_and_chr_to_sig</span><span class="p">:</span>
-</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Chromosome X (&#39;sex-x&#39;) not found in the provided signatures. X-Ploidy score will be set to zero.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>        <span class="c1"># set sex-x to an empty signature</span>
-</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>        <span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-x&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
-</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
-</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>            <span class="n">ksize</span><span class="o">=</span><span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>            <span class="n">scale</span><span class="o">=</span><span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>        <span class="p">)</span>
-</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a>
-</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>    <span class="c1"># Separate the autosomal genome signature from chromosome-specific signatures</span>
-</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a>    <span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>    <span class="n">autosomals_genome_sig</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Separating autosomal genome signature from chromosome-specific signatures.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a>
-</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a>    <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a>        <span class="k">if</span> <span class="n">name</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s1">&#39;-snipegenome&#39;</span><span class="p">):</span>
-</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Identified autosomal genome signature: &#39;</span><span class="si">%s</span><span class="s2">&#39;.&quot;</span><span class="p">,</span> <span class="n">name</span><span class="p">)</span>
-</span><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a>            <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">sig</span>
-</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a>            <span class="n">chr_to_sig</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">sig</span>
+</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a><span class="sd">      $$</span>
+</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a><span class="sd">      \text{Y-Coverage} = \frac{\left(\frac{N_Y^{\text{sample}}}{N_Y}\right)}{\left(\frac{N_{\text{autosomal}}^{\text{sample}}}{N_{\text{autosomal}}}\right)}</span>
+</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a><span class="sd">      $$</span>
+</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a>
+</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a><span class="sd">      Where:</span>
+</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a><span class="sd">      - \( N_Y^{\text{sample}} \) is the number of Y chromosome-specific k-mers in the sample.</span>
+</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a><span class="sd">      - \( N_Y \) is the number of Y chromosome-specific k-mers in the reference genome.</span>
+</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a><span class="sd">      - \( N_{\text{autosomal}}^{\text{sample}} \) is the number of autosomal k-mers in the sample.</span>
+</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a><span class="sd">      - \( N_{\text{autosomal}} \) is the number of autosomal k-mers in the reference genome.</span>
+</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>
+</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>
+</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a><span class="sd">        - `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  </span>
+</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a><span class="sd">          A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include</span>
+</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a><span class="sd">          the autosomal genome signature (with a name ending in `&#39;-snipegenome&#39;`) and chromosome-specific</span>
+</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a><span class="sd">          signatures (e.g., `&#39;sex-x&#39;`, `&#39;sex-y&#39;`, `&#39;autosome-1&#39;`, `&#39;autosome-2&#39;`, etc.).</span>
+</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>
+</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>
+</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a><span class="sd">        - `Dict[str, Any]`:  </span>
+</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a><span class="sd">          A dictionary containing the calculated sex-related metrics:</span>
+</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a><span class="sd">              - `&quot;X-Ploidy score&quot;` (`float`):  </span>
+</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a><span class="sd">                The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance</span>
+</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a><span class="sd">                to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.</span>
+</span><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a><span class="sd">              - `&quot;Y-Coverage&quot;` (`float`, optional):  </span>
+</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a><span class="sd">                The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.</span>
+</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a><span class="sd">                This key is present only if a Y chromosome signature is provided.</span>
 </span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a>
-</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a>    <span class="k">if</span> <span class="n">autosomals_genome_sig</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Autosomal genome signature (ending with &#39;-snipegenome&#39;) not found.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Autosomal genome signature (ending with &#39;-snipegenome&#39;) not found.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a>
-</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a>    <span class="c1"># Ensure all chromosome signatures have unique hashes</span>
-</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a>    <span class="n">specific_chr_to_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">get_unique_signatures</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="p">)</span>
-</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a>
-</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a>    <span class="c1"># Exclude Y chromosome from the autosomal genome signature if present</span>
-</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a>    <span class="k">if</span> <span class="s1">&#39;sex-y&#39;</span> <span class="ow">in</span> <span class="n">chr_to_sig</span><span class="p">:</span>
-</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Y chromosome (&#39;sex-y&#39;) detected. Removing its hashes from the autosomal genome signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Original autosomal genome size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
-</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a>        <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-y&#39;</span><span class="p">]</span>
-</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Updated autosomal genome size after removing Y chromosome: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
-</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a>
-</span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a>    <span class="c1"># Remove X chromosome hashes from the autosomal genome signature</span>
-</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Removing X chromosome (&#39;sex-x&#39;) hashes from the autosomal genome signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a>    <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-x&#39;</span><span class="p">]</span>
-</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Updated autosomal genome size after removing X chromosome: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
-</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a>
-</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a>    <span class="c1"># Derive the X chromosome-specific signature by subtracting autosomal genome hashes</span>
-</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a>    <span class="n">specific_xchr_sig</span> <span class="o">=</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-x&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">autosomals_genome_sig</span>
-</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Derived X chromosome-specific signature size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">))</span>
-</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a>
-</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a>    <span class="c1"># Intersect the sample signature with chromosome-specific signatures</span>
-</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a>    <span class="n">sample_specific_xchr_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">specific_xchr_sig</span>
-</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_specific_xchr_sig</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No X chromosome-specific k-mers found in the sample signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with X chromosome-specific k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_specific_xchr_sig</span><span class="p">))</span>
-</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a>    <span class="n">sample_autosomal_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">autosomals_genome_sig</span>
-</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with autosomal genome k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_autosomal_sig</span><span class="p">))</span>
+</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>
+</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a><span class="sd">        - `ValueError`:  </span>
+</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a><span class="sd">          - If the `&#39;sex-x&#39;` chromosome signature is not found in `genome_and_chr_to_sig`.</span>
+</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a><span class="sd">          - If the autosomal genome signature is not found or improperly labeled.</span>
+</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a>
+</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a><span class="sd">    **Usage Example**:</span>
+</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a>
+</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a><span class="sd">    ```python</span>
+</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a><span class="sd">    # Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances</span>
+</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a><span class="sd">    genome_and_chr_signatures = {</span>
+</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a><span class="sd">        &quot;autosomal-snipegenome&quot;: sig_autosomal_genome,</span>
+</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a><span class="sd">        &quot;1&quot;: sig_chr1,</span>
+</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a><span class="sd">        &quot;2&quot;: sig_chr2,</span>
+</span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a><span class="sd">        &quot;sex-x&quot;: sig_sex_x,</span>
+</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a><span class="sd">        &quot;sex-y&quot;: sig_sex_y</span>
+</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a><span class="sd">    }</span>
+</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a>
+</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a><span class="sd">    # Calculate sex chromosome metrics</span>
+</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a><span class="sd">    metrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)</span>
+</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a>
+</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a><span class="sd">    print(metrics)</span>
+</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a><span class="sd">    # Output Example:</span>
+</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a><span class="sd">    # {</span>
+</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a><span class="sd">    #     &quot;X-Ploidy score&quot;: 2.6667,</span>
+</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a><span class="sd">    #     &quot;Y-Coverage&quot;: 0.0</span>
+</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a><span class="sd">    # }</span>
+</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a><span class="sd">    ```</span>
+</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a>
+</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a><span class="sd">    **Notes**:</span>
 </span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a>
-</span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a>    <span class="c1"># Retrieve mean abundances</span>
-</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a>    <span class="n">xchr_mean_abundance</span> <span class="o">=</span> <span class="n">sample_specific_xchr_sig</span><span class="o">.</span><span class="n">get_sample_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
-</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a>    <span class="n">autosomal_mean_abundance</span> <span class="o">=</span> <span class="n">sample_autosomal_sig</span><span class="o">.</span><span class="n">get_sample_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a><span class="sd">        - **Signature Naming Convention**:  </span>
+</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a><span class="sd">          The autosomal genome signature must have a name ending with `&#39;-snipegenome&#39;`. Chromosome-specific</span>
+</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a><span class="sd">          signatures should be named accordingly (e.g., `&#39;sex-x&#39;`, `&#39;sex-y&#39;`, `&#39;autosomal-1&#39;`, `&#39;autosomal-2&#39;`, etc.).</span>
 </span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a>
-</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a>    <span class="c1"># Calculate X-Ploidy score</span>
-</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a>    <span class="k">if</span> <span class="n">autosomal_mean_abundance</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Autosomal mean abundance is zero. Setting X-Ploidy score to zero to avoid division by zero.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a>        <span class="n">xploidy_score</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a>        <span class="n">xploidy_score</span> <span class="o">=</span> <span class="p">(</span><span class="n">xchr_mean_abundance</span> <span class="o">/</span> <span class="n">autosomal_mean_abundance</span><span class="p">)</span> <span class="o">*</span> \
-</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a>                        <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">)</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span><span class="p">)</span>
-</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a>
-</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated X-Ploidy score: </span><span class="si">%.4f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">xploidy_score</span><span class="p">)</span>
-</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;X-Ploidy score&quot;</span><span class="p">:</span> <span class="n">xploidy_score</span><span class="p">})</span>
-</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a>
-</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a>    <span class="c1"># Calculate Y-Coverage if Y chromosome is present</span>
-</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>    <span class="k">if</span> <span class="s1">&#39;sex-y&#39;</span> <span class="ow">in</span> <span class="n">specific_chr_to_sig</span><span class="p">:</span>
-</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating Y-Coverage based on Y chromosome-specific k-mers.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a>
-</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a>        <span class="c1"># Derive Y chromosome-specific k-mers by excluding autosomal and X chromosome k-mers</span>
-</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a>        <span class="n">ychr_specific_kmers</span> <span class="o">=</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-y&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">specific_xchr_sig</span>
-</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Derived Y chromosome-specific signature size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">))</span>
-</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a>
-</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a>        <span class="c1"># Intersect Y chromosome-specific k-mers with the sample signature</span>
-</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a>        <span class="n">ychr_in_sample</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">ychr_specific_kmers</span>
-</span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with Y chromosome-specific k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">))</span>
-</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No Y chromosome-specific k-mers found in the sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a><span class="sd">        - **Exclusion of Sex Chromosomes from Autosomal Genome**:  </span>
+</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a><span class="sd">          The Y chromosome signature (`&#39;sex-y&#39;`) is subtracted from the autosomal genome signature to ensure</span>
+</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a><span class="sd">          that Y chromosome k-mers are not counted towards autosomal metrics.</span>
+</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a>
+</span><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a><span class="sd">        - **Robustness**:  </span>
+</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a><span class="sd">          The method includes comprehensive logging for debugging purposes, tracking each major step and</span>
+</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a><span class="sd">          any exclusions made during processing.</span>
+</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a>
+</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>    <span class="c1"># Ensure that the chromosome X signature exists</span>
+</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a>    <span class="k">if</span> <span class="s1">&#39;sex-x&#39;</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">genome_and_chr_to_sig</span><span class="p">:</span>
+</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Chromosome X (&#39;sex-x&#39;) not found in the provided signatures. X-Ploidy score will be set to zero.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>        <span class="c1"># set sex-x to an empty signature</span>
+</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a>        <span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-x&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
+</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
+</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a>            <span class="n">ksize</span><span class="o">=</span><span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>            <span class="n">scale</span><span class="o">=</span><span class="n">genome_and_chr_to_sig</span><span class="p">[</span><span class="nb">list</span><span class="p">(</span><span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">keys</span><span class="p">())[</span><span class="mi">0</span><span class="p">]]</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a>        <span class="p">)</span>
+</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a>
+</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a>    <span class="c1"># Separate the autosomal genome signature from chromosome-specific signatures</span>
+</span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>    <span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a>    <span class="n">autosomals_genome_sig</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Separating autosomal genome signature from chromosome-specific signatures.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a>
-</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a>        <span class="c1"># Derive autosomal-specific k-mers by excluding X and Y chromosome k-mers from the reference signature</span>
-</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>        <span class="n">autosomals_specific_kmers</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span> <span class="o">-</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-x&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-y&#39;</span><span class="p">]</span>
-</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a>
-</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a>        <span class="c1"># Calculate Y-Coverage metric</span>
-</span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_specific_kmers</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Insufficient k-mers for Y-Coverage calculation. Setting Y-Coverage to zero.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a>            <span class="n">ycoverage</span> <span class="o">=</span> <span class="mf">0.0</span>
-</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>            <span class="n">ycoverage</span> <span class="o">=</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">))</span> <span class="o">/</span> \
-</span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>                    <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">sample_autosomal_sig</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_specific_kmers</span><span class="p">))</span>
+</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a>    <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">genome_and_chr_to_sig</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>        <span class="k">if</span> <span class="n">name</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s1">&#39;-snipegenome&#39;</span><span class="p">):</span>
+</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Identified autosomal genome signature: &#39;</span><span class="si">%s</span><span class="s2">&#39;.&quot;</span><span class="p">,</span> <span class="n">name</span><span class="p">)</span>
+</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a>            <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">sig</span>
+</span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a>            <span class="n">chr_to_sig</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">sig</span>
+</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a>
+</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a>    <span class="k">if</span> <span class="n">autosomals_genome_sig</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Autosomal genome signature (ending with &#39;-snipegenome&#39;) not found.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Autosomal genome signature (ending with &#39;-snipegenome&#39;) not found.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a>
-</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated Y-Coverage: </span><span class="si">%.4f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">ycoverage</span><span class="p">)</span>
-</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Y-Coverage&quot;</span><span class="p">:</span> <span class="n">ycoverage</span><span class="p">})</span>
+</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>    <span class="c1"># Ensure all chromosome signatures have unique hashes</span>
+</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>    <span class="n">specific_chr_to_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">get_unique_signatures</span><span class="p">(</span><span class="n">chr_to_sig</span><span class="p">)</span>
 </span><span id="__span-0-1269"><a id="__codelineno-0-1269" name="__codelineno-0-1269"></a>
-</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span>
+</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a>    <span class="c1"># Exclude Y chromosome from the autosomal genome signature if present</span>
+</span><span id="__span-0-1271"><a id="__codelineno-0-1271" name="__codelineno-0-1271"></a>    <span class="k">if</span> <span class="s1">&#39;sex-y&#39;</span> <span class="ow">in</span> <span class="n">chr_to_sig</span><span class="p">:</span>
+</span><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Y chromosome (&#39;sex-y&#39;) detected. Removing its hashes from the autosomal genome signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1273"><a id="__codelineno-0-1273" name="__codelineno-0-1273"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Original autosomal genome size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
+</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a>        <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-y&#39;</span><span class="p">]</span>
+</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Updated autosomal genome size after removing Y chromosome: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
+</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a>
+</span><span id="__span-0-1277"><a id="__codelineno-0-1277" name="__codelineno-0-1277"></a>    <span class="c1"># Remove X chromosome hashes from the autosomal genome signature</span>
+</span><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Removing X chromosome (&#39;sex-x&#39;) hashes from the autosomal genome signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a>    <span class="n">autosomals_genome_sig</span> <span class="o">=</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-x&#39;</span><span class="p">]</span>
+</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">- Updated autosomal genome size after removing X chromosome: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">))</span>
+</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a>
+</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a>    <span class="c1"># Derive the X chromosome-specific signature by subtracting autosomal genome hashes</span>
+</span><span id="__span-0-1283"><a id="__codelineno-0-1283" name="__codelineno-0-1283"></a>    <span class="n">specific_xchr_sig</span> <span class="o">=</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-x&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">autosomals_genome_sig</span>
+</span><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Derived X chromosome-specific signature size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">))</span>
+</span><span id="__span-0-1285"><a id="__codelineno-0-1285" name="__codelineno-0-1285"></a>
+</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a>    <span class="c1"># Intersect the sample signature with chromosome-specific signatures</span>
+</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a>    <span class="n">sample_specific_xchr_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">specific_xchr_sig</span>
+</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_specific_xchr_sig</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No X chromosome-specific k-mers found in the sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1290"><a id="__codelineno-0-1290" name="__codelineno-0-1290"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with X chromosome-specific k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_specific_xchr_sig</span><span class="p">))</span>
+</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a>    <span class="n">sample_autosomal_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">autosomals_genome_sig</span>
+</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with autosomal genome k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_autosomal_sig</span><span class="p">))</span>
+</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a>
+</span><span id="__span-0-1294"><a id="__codelineno-0-1294" name="__codelineno-0-1294"></a>    <span class="c1"># Retrieve mean abundances</span>
+</span><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a>    <span class="n">xchr_mean_abundance</span> <span class="o">=</span> <span class="n">sample_specific_xchr_sig</span><span class="o">.</span><span class="n">get_sample_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a>    <span class="n">autosomal_mean_abundance</span> <span class="o">=</span> <span class="n">sample_autosomal_sig</span><span class="o">.</span><span class="n">get_sample_stats</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a>
+</span><span id="__span-0-1298"><a id="__codelineno-0-1298" name="__codelineno-0-1298"></a>    <span class="c1"># Calculate X-Ploidy score</span>
+</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a>    <span class="k">if</span> <span class="n">autosomal_mean_abundance</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Autosomal mean abundance is zero. Setting X-Ploidy score to zero to avoid division by zero.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a>        <span class="n">xploidy_score</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1302"><a id="__codelineno-0-1302" name="__codelineno-0-1302"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a>        <span class="n">xploidy_score</span> <span class="o">=</span> <span class="p">(</span><span class="n">xchr_mean_abundance</span> <span class="o">/</span> <span class="n">autosomal_mean_abundance</span><span class="p">)</span> <span class="o">*</span> \
+</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a>                        <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">autosomals_genome_sig</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">)</span> <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">specific_xchr_sig</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span><span class="p">)</span>
+</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a>
+</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated X-Ploidy score: </span><span class="si">%.4f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">xploidy_score</span><span class="p">)</span>
+</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;X-Ploidy score&quot;</span><span class="p">:</span> <span class="n">xploidy_score</span><span class="p">})</span>
+</span><span id="__span-0-1308"><a id="__codelineno-0-1308" name="__codelineno-0-1308"></a>
+</span><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a>    <span class="c1"># Calculate Y-Coverage if Y chromosome is present</span>
+</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a>    <span class="k">if</span> <span class="s1">&#39;sex-y&#39;</span> <span class="ow">in</span> <span class="n">specific_chr_to_sig</span><span class="p">:</span>
+</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculating Y-Coverage based on Y chromosome-specific k-mers.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a>
+</span><span id="__span-0-1313"><a id="__codelineno-0-1313" name="__codelineno-0-1313"></a>        <span class="c1"># Derive Y chromosome-specific k-mers by excluding autosomal and X chromosome k-mers</span>
+</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a>        <span class="n">ychr_specific_kmers</span> <span class="o">=</span> <span class="n">chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-y&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">autosomals_genome_sig</span> <span class="o">-</span> <span class="n">specific_xchr_sig</span>
+</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Derived Y chromosome-specific signature size: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">))</span>
+</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a>
+</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a>        <span class="c1"># Intersect Y chromosome-specific k-mers with the sample signature</span>
+</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a>        <span class="n">ychr_in_sample</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">&amp;</span> <span class="n">ychr_specific_kmers</span>
+</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Intersected sample signature with Y chromosome-specific k-mers = </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">))</span>
+</span><span id="__span-0-1320"><a id="__codelineno-0-1320" name="__codelineno-0-1320"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No Y chromosome-specific k-mers found in the sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a>
+</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>        <span class="c1"># Derive autosomal-specific k-mers by excluding X and Y chromosome k-mers from the reference signature</span>
+</span><span id="__span-0-1324"><a id="__codelineno-0-1324" name="__codelineno-0-1324"></a>        <span class="n">autosomals_specific_kmers</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span> <span class="o">-</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s2">&quot;sex-x&quot;</span><span class="p">]</span> <span class="o">-</span> <span class="n">specific_chr_to_sig</span><span class="p">[</span><span class="s1">&#39;sex-y&#39;</span><span class="p">]</span>
+</span><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a>
+</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a>        <span class="c1"># Calculate Y-Coverage metric</span>
+</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span> <span class="ow">or</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_specific_kmers</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Insufficient k-mers for Y-Coverage calculation. Setting Y-Coverage to zero.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a>            <span class="n">ycoverage</span> <span class="o">=</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a>            <span class="n">ycoverage</span> <span class="o">=</span> <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">ychr_in_sample</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">ychr_specific_kmers</span><span class="p">))</span> <span class="o">/</span> \
+</span><span id="__span-0-1332"><a id="__codelineno-0-1332" name="__codelineno-0-1332"></a>                    <span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">sample_autosomal_sig</span><span class="p">)</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">autosomals_specific_kmers</span><span class="p">))</span>
+</span><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a>
+</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Calculated Y-Coverage: </span><span class="si">%.4f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">ycoverage</span><span class="p">)</span>
+</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span><span class="s2">&quot;Y-Coverage&quot;</span><span class="p">:</span> <span class="n">ycoverage</span><span class="p">})</span>
+</span><span id="__span-0-1336"><a id="__codelineno-0-1336" name="__codelineno-0-1336"></a>
+</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4660,105 +6007,105 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.distribute_kmers_random" class="doc d
 
             <details class="quote">
               <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-667">667</a></span>
-<span class="normal"><a href="#__codelineno-0-668">668</a></span>
-<span class="normal"><a href="#__codelineno-0-669">669</a></span>
-<span class="normal"><a href="#__codelineno-0-670">670</a></span>
-<span class="normal"><a href="#__codelineno-0-671">671</a></span>
-<span class="normal"><a href="#__codelineno-0-672">672</a></span>
-<span class="normal"><a href="#__codelineno-0-673">673</a></span>
-<span class="normal"><a href="#__codelineno-0-674">674</a></span>
-<span class="normal"><a href="#__codelineno-0-675">675</a></span>
-<span class="normal"><a href="#__codelineno-0-676">676</a></span>
-<span class="normal"><a href="#__codelineno-0-677">677</a></span>
-<span class="normal"><a href="#__codelineno-0-678">678</a></span>
-<span class="normal"><a href="#__codelineno-0-679">679</a></span>
-<span class="normal"><a href="#__codelineno-0-680">680</a></span>
-<span class="normal"><a href="#__codelineno-0-681">681</a></span>
-<span class="normal"><a href="#__codelineno-0-682">682</a></span>
-<span class="normal"><a href="#__codelineno-0-683">683</a></span>
-<span class="normal"><a href="#__codelineno-0-684">684</a></span>
-<span class="normal"><a href="#__codelineno-0-685">685</a></span>
-<span class="normal"><a href="#__codelineno-0-686">686</a></span>
-<span class="normal"><a href="#__codelineno-0-687">687</a></span>
-<span class="normal"><a href="#__codelineno-0-688">688</a></span>
-<span class="normal"><a href="#__codelineno-0-689">689</a></span>
-<span class="normal"><a href="#__codelineno-0-690">690</a></span>
-<span class="normal"><a href="#__codelineno-0-691">691</a></span>
-<span class="normal"><a href="#__codelineno-0-692">692</a></span>
-<span class="normal"><a href="#__codelineno-0-693">693</a></span>
-<span class="normal"><a href="#__codelineno-0-694">694</a></span>
-<span class="normal"><a href="#__codelineno-0-695">695</a></span>
-<span class="normal"><a href="#__codelineno-0-696">696</a></span>
-<span class="normal"><a href="#__codelineno-0-697">697</a></span>
-<span class="normal"><a href="#__codelineno-0-698">698</a></span>
-<span class="normal"><a href="#__codelineno-0-699">699</a></span>
-<span class="normal"><a href="#__codelineno-0-700">700</a></span>
-<span class="normal"><a href="#__codelineno-0-701">701</a></span>
-<span class="normal"><a href="#__codelineno-0-702">702</a></span>
-<span class="normal"><a href="#__codelineno-0-703">703</a></span>
-<span class="normal"><a href="#__codelineno-0-704">704</a></span>
-<span class="normal"><a href="#__codelineno-0-705">705</a></span>
-<span class="normal"><a href="#__codelineno-0-706">706</a></span>
-<span class="normal"><a href="#__codelineno-0-707">707</a></span>
-<span class="normal"><a href="#__codelineno-0-708">708</a></span>
-<span class="normal"><a href="#__codelineno-0-709">709</a></span>
-<span class="normal"><a href="#__codelineno-0-710">710</a></span>
-<span class="normal"><a href="#__codelineno-0-711">711</a></span>
-<span class="normal"><a href="#__codelineno-0-712">712</a></span>
-<span class="normal"><a href="#__codelineno-0-713">713</a></span>
-<span class="normal"><a href="#__codelineno-0-714">714</a></span>
-<span class="normal"><a href="#__codelineno-0-715">715</a></span>
-<span class="normal"><a href="#__codelineno-0-716">716</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a><span class="k">def</span> <span class="nf">distribute_kmers_random</span><span class="p">(</span><span class="n">original_dict</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">],</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">Dict</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]:</span>
-</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a><span class="sd">    Distribute the k-mers randomly into `n` parts based on their abundances.</span>
-</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a>
-</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a><span class="sd">    This helper method performs the actual distribution of k-mers using a multinomial distribution.</span>
-</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>
-</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>
-</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a><span class="sd">    Given a k-mer with hash \( h \) and abundance \( a_h \), the distribution of its abundance across \( n \)</span>
-</span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a><span class="sd">    parts is modeled as:</span>
-</span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>
-</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a><span class="sd">    $$</span>
-</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a><span class="sd">    a_{h,1}, a_{h,2}, \dots, a_{h,n} \sim \text{Multinomial}(a_h, p_1, p_2, \dots, p_n)</span>
-</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a><span class="sd">    $$</span>
-</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>
-</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a><span class="sd">    Where \( p_i = \frac{1}{n} \) for all \( i \).</span>
-</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>
-</span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>
-</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a><span class="sd">    - `original_dict` (`Dict[int, int]`):  </span>
-</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a><span class="sd">      Dictionary mapping k-mer hashes to their abundances.</span>
-</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a><span class="sd">    - `n` (`int`): Number of parts to split into.</span>
-</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>
-</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>
-</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a><span class="sd">    - `List[Dict[int, int]]`:  </span>
-</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a><span class="sd">      List of dictionaries, each mapping k-mer hashes to their abundances in that part.</span>
-</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>
-</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a><span class="sd">    **Usage Example**:</span>
-</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a>
-</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a><span class="sd">    ```python</span>
-</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a><span class="sd">    distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)</span>
-</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a><span class="sd">    ```</span>
-</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a>    <span class="c1"># Initialize the resulting dictionaries</span>
-</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>    <span class="n">distributed_dicts</span> <span class="o">=</span> <span class="p">[{}</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">)]</span>
-</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a>
-</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>    <span class="c1"># For each k-mer and its abundance</span>
-</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a>    <span class="k">for</span> <span class="n">kmer_hash</span><span class="p">,</span> <span class="n">abundance</span> <span class="ow">in</span> <span class="n">original_dict</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a>        <span class="k">if</span> <span class="n">abundance</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a>            <span class="k">continue</span>  <span class="c1"># Skip zero abundances</span>
-</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>        <span class="c1"># Generate multinomial split of abundance</span>
-</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>        <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">multinomial</span><span class="p">(</span><span class="n">abundance</span><span class="p">,</span> <span class="p">[</span><span class="mf">1.0</span> <span class="o">/</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>        <span class="c1"># Update each dictionary</span>
-</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a>        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
-</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a>            <span class="k">if</span> <span class="n">counts</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a>                <span class="n">distributed_dicts</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="n">kmer_hash</span><span class="p">]</span> <span class="o">=</span> <span class="n">counts</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
-</span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a>
-</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a>    <span class="k">return</span> <span class="n">distributed_dicts</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-721">721</a></span>
+<span class="normal"><a href="#__codelineno-0-722">722</a></span>
+<span class="normal"><a href="#__codelineno-0-723">723</a></span>
+<span class="normal"><a href="#__codelineno-0-724">724</a></span>
+<span class="normal"><a href="#__codelineno-0-725">725</a></span>
+<span class="normal"><a href="#__codelineno-0-726">726</a></span>
+<span class="normal"><a href="#__codelineno-0-727">727</a></span>
+<span class="normal"><a href="#__codelineno-0-728">728</a></span>
+<span class="normal"><a href="#__codelineno-0-729">729</a></span>
+<span class="normal"><a href="#__codelineno-0-730">730</a></span>
+<span class="normal"><a href="#__codelineno-0-731">731</a></span>
+<span class="normal"><a href="#__codelineno-0-732">732</a></span>
+<span class="normal"><a href="#__codelineno-0-733">733</a></span>
+<span class="normal"><a href="#__codelineno-0-734">734</a></span>
+<span class="normal"><a href="#__codelineno-0-735">735</a></span>
+<span class="normal"><a href="#__codelineno-0-736">736</a></span>
+<span class="normal"><a href="#__codelineno-0-737">737</a></span>
+<span class="normal"><a href="#__codelineno-0-738">738</a></span>
+<span class="normal"><a href="#__codelineno-0-739">739</a></span>
+<span class="normal"><a href="#__codelineno-0-740">740</a></span>
+<span class="normal"><a href="#__codelineno-0-741">741</a></span>
+<span class="normal"><a href="#__codelineno-0-742">742</a></span>
+<span class="normal"><a href="#__codelineno-0-743">743</a></span>
+<span class="normal"><a href="#__codelineno-0-744">744</a></span>
+<span class="normal"><a href="#__codelineno-0-745">745</a></span>
+<span class="normal"><a href="#__codelineno-0-746">746</a></span>
+<span class="normal"><a href="#__codelineno-0-747">747</a></span>
+<span class="normal"><a href="#__codelineno-0-748">748</a></span>
+<span class="normal"><a href="#__codelineno-0-749">749</a></span>
+<span class="normal"><a href="#__codelineno-0-750">750</a></span>
+<span class="normal"><a href="#__codelineno-0-751">751</a></span>
+<span class="normal"><a href="#__codelineno-0-752">752</a></span>
+<span class="normal"><a href="#__codelineno-0-753">753</a></span>
+<span class="normal"><a href="#__codelineno-0-754">754</a></span>
+<span class="normal"><a href="#__codelineno-0-755">755</a></span>
+<span class="normal"><a href="#__codelineno-0-756">756</a></span>
+<span class="normal"><a href="#__codelineno-0-757">757</a></span>
+<span class="normal"><a href="#__codelineno-0-758">758</a></span>
+<span class="normal"><a href="#__codelineno-0-759">759</a></span>
+<span class="normal"><a href="#__codelineno-0-760">760</a></span>
+<span class="normal"><a href="#__codelineno-0-761">761</a></span>
+<span class="normal"><a href="#__codelineno-0-762">762</a></span>
+<span class="normal"><a href="#__codelineno-0-763">763</a></span>
+<span class="normal"><a href="#__codelineno-0-764">764</a></span>
+<span class="normal"><a href="#__codelineno-0-765">765</a></span>
+<span class="normal"><a href="#__codelineno-0-766">766</a></span>
+<span class="normal"><a href="#__codelineno-0-767">767</a></span>
+<span class="normal"><a href="#__codelineno-0-768">768</a></span>
+<span class="normal"><a href="#__codelineno-0-769">769</a></span>
+<span class="normal"><a href="#__codelineno-0-770">770</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a><span class="k">def</span> <span class="nf">distribute_kmers_random</span><span class="p">(</span><span class="n">original_dict</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">],</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">Dict</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="nb">int</span><span class="p">]]:</span>
+</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a><span class="sd">    Distribute the k-mers randomly into `n` parts based on their abundances.</span>
+</span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a>
+</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a><span class="sd">    This helper method performs the actual distribution of k-mers using a multinomial distribution.</span>
+</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a>
+</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a><span class="sd">    **Mathematical Explanation**:</span>
+</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a>
+</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a><span class="sd">    Given a k-mer with hash \( h \) and abundance \( a_h \), the distribution of its abundance across \( n \)</span>
+</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a><span class="sd">    parts is modeled as:</span>
+</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a>
+</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a><span class="sd">    $$</span>
+</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a><span class="sd">    a_{h,1}, a_{h,2}, \dots, a_{h,n} \sim \text{Multinomial}(a_h, p_1, p_2, \dots, p_n)</span>
+</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a><span class="sd">    $$</span>
+</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a>
+</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a><span class="sd">    Where \( p_i = \frac{1}{n} \) for all \( i \).</span>
+</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a>
+</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a>
+</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a><span class="sd">    - `original_dict` (`Dict[int, int]`):  </span>
+</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a><span class="sd">      Dictionary mapping k-mer hashes to their abundances.</span>
+</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a><span class="sd">    - `n` (`int`): Number of parts to split into.</span>
+</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a>
+</span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a>
+</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a><span class="sd">    - `List[Dict[int, int]]`:  </span>
+</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a><span class="sd">      List of dictionaries, each mapping k-mer hashes to their abundances in that part.</span>
+</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a>
+</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a><span class="sd">    **Usage Example**:</span>
+</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a>
+</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a><span class="sd">    ```python</span>
+</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a><span class="sd">    distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)</span>
+</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a><span class="sd">    ```</span>
+</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a>    <span class="c1"># Initialize the resulting dictionaries</span>
+</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a>    <span class="n">distributed_dicts</span> <span class="o">=</span> <span class="p">[{}</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">)]</span>
+</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a>
+</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a>    <span class="c1"># For each k-mer and its abundance</span>
+</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a>    <span class="k">for</span> <span class="n">kmer_hash</span><span class="p">,</span> <span class="n">abundance</span> <span class="ow">in</span> <span class="n">original_dict</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a>        <span class="k">if</span> <span class="n">abundance</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>            <span class="k">continue</span>  <span class="c1"># Skip zero abundances</span>
+</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a>        <span class="c1"># Generate multinomial split of abundance</span>
+</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a>        <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">multinomial</span><span class="p">(</span><span class="n">abundance</span><span class="p">,</span> <span class="p">[</span><span class="mf">1.0</span> <span class="o">/</span> <span class="n">n</span><span class="p">]</span> <span class="o">*</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a>        <span class="c1"># Update each dictionary</span>
+</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a>        <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n</span><span class="p">):</span>
+</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>            <span class="k">if</span> <span class="n">counts</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a>                <span class="n">distributed_dicts</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="n">kmer_hash</span><span class="p">]</span> <span class="o">=</span> <span class="n">counts</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
+</span><span id="__span-0-769"><a id="__codelineno-0-769" name="__codelineno-0-769"></a>
+</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a>    <span class="k">return</span> <span class="n">distributed_dicts</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4795,89 +6142,727 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.get_aggregated_stats" class="doc doc-
 
             <details class="quote">
               <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-437">437</a></span>
-<span class="normal"><a href="#__codelineno-0-438">438</a></span>
-<span class="normal"><a href="#__codelineno-0-439">439</a></span>
-<span class="normal"><a href="#__codelineno-0-440">440</a></span>
-<span class="normal"><a href="#__codelineno-0-441">441</a></span>
-<span class="normal"><a href="#__codelineno-0-442">442</a></span>
-<span class="normal"><a href="#__codelineno-0-443">443</a></span>
-<span class="normal"><a href="#__codelineno-0-444">444</a></span>
-<span class="normal"><a href="#__codelineno-0-445">445</a></span>
-<span class="normal"><a href="#__codelineno-0-446">446</a></span>
-<span class="normal"><a href="#__codelineno-0-447">447</a></span>
-<span class="normal"><a href="#__codelineno-0-448">448</a></span>
-<span class="normal"><a href="#__codelineno-0-449">449</a></span>
-<span class="normal"><a href="#__codelineno-0-450">450</a></span>
-<span class="normal"><a href="#__codelineno-0-451">451</a></span>
-<span class="normal"><a href="#__codelineno-0-452">452</a></span>
-<span class="normal"><a href="#__codelineno-0-453">453</a></span>
-<span class="normal"><a href="#__codelineno-0-454">454</a></span>
-<span class="normal"><a href="#__codelineno-0-455">455</a></span>
-<span class="normal"><a href="#__codelineno-0-456">456</a></span>
-<span class="normal"><a href="#__codelineno-0-457">457</a></span>
-<span class="normal"><a href="#__codelineno-0-458">458</a></span>
-<span class="normal"><a href="#__codelineno-0-459">459</a></span>
-<span class="normal"><a href="#__codelineno-0-460">460</a></span>
-<span class="normal"><a href="#__codelineno-0-461">461</a></span>
-<span class="normal"><a href="#__codelineno-0-462">462</a></span>
-<span class="normal"><a href="#__codelineno-0-463">463</a></span>
-<span class="normal"><a href="#__codelineno-0-464">464</a></span>
-<span class="normal"><a href="#__codelineno-0-465">465</a></span>
-<span class="normal"><a href="#__codelineno-0-466">466</a></span>
-<span class="normal"><a href="#__codelineno-0-467">467</a></span>
-<span class="normal"><a href="#__codelineno-0-468">468</a></span>
-<span class="normal"><a href="#__codelineno-0-469">469</a></span>
-<span class="normal"><a href="#__codelineno-0-470">470</a></span>
-<span class="normal"><a href="#__codelineno-0-471">471</a></span>
-<span class="normal"><a href="#__codelineno-0-472">472</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-472">472</a></span>
 <span class="normal"><a href="#__codelineno-0-473">473</a></span>
 <span class="normal"><a href="#__codelineno-0-474">474</a></span>
 <span class="normal"><a href="#__codelineno-0-475">475</a></span>
 <span class="normal"><a href="#__codelineno-0-476">476</a></span>
 <span class="normal"><a href="#__codelineno-0-477">477</a></span>
-<span class="normal"><a href="#__codelineno-0-478">478</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a><span class="k">def</span> <span class="nf">get_aggregated_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">include_advanced</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
-</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a><span class="sd">    Retrieve aggregated statistics from the quality control analysis.</span>
-</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>
-</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a><span class="sd">    **Parameters**</span>
-</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>
-</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a><span class="sd">    - `include_advanced (bool)`:  </span>
-</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a><span class="sd">      If set to `True`, includes advanced metrics in the aggregated statistics.</span>
-</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>
-</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a><span class="sd">    **Returns**</span>
-</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>
-</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a><span class="sd">    - `Dict[str, Any]`:  </span>
-</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a><span class="sd">      A dictionary containing the aggregated statistics, which may include:</span>
-</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a><span class="sd">      - Sample statistics</span>
-</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a><span class="sd">      - Genome statistics</span>
-</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a><span class="sd">      - Amplicon statistics (if provided)</span>
-</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a><span class="sd">      - Predicted assay type</span>
-</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a><span class="sd">      - Advanced statistics (if `include_advanced` is `True`)</span>
-</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>    <span class="n">aggregated_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>    <span class="c1"># Include sample_stats</span>
-</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>    <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">)</span>
-</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>    <span class="c1"># Include genome_stats</span>
-</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>    <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">)</span>
-</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>    <span class="c1"># Include amplicon_stats if available</span>
-</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;While aggregating stats; amplicon signature provided.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">)</span>
-</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>        <span class="n">aggregated_stats</span><span class="p">[</span><span class="s2">&quot;Predicted Assay Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span>
-</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>
-</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">:</span>
-</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">)</span>
-</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>
-</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">:</span>
-</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">)</span>
-</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>
-</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>    <span class="c1"># Include advanced_stats if requested</span>
-</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>    <span class="k">if</span> <span class="n">include_advanced</span><span class="p">:</span>
-</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_advanced_stats</span><span class="p">()</span>
-</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-478">478</a></span>
+<span class="normal"><a href="#__codelineno-0-479">479</a></span>
+<span class="normal"><a href="#__codelineno-0-480">480</a></span>
+<span class="normal"><a href="#__codelineno-0-481">481</a></span>
+<span class="normal"><a href="#__codelineno-0-482">482</a></span>
+<span class="normal"><a href="#__codelineno-0-483">483</a></span>
+<span class="normal"><a href="#__codelineno-0-484">484</a></span>
+<span class="normal"><a href="#__codelineno-0-485">485</a></span>
+<span class="normal"><a href="#__codelineno-0-486">486</a></span>
+<span class="normal"><a href="#__codelineno-0-487">487</a></span>
+<span class="normal"><a href="#__codelineno-0-488">488</a></span>
+<span class="normal"><a href="#__codelineno-0-489">489</a></span>
+<span class="normal"><a href="#__codelineno-0-490">490</a></span>
+<span class="normal"><a href="#__codelineno-0-491">491</a></span>
+<span class="normal"><a href="#__codelineno-0-492">492</a></span>
+<span class="normal"><a href="#__codelineno-0-493">493</a></span>
+<span class="normal"><a href="#__codelineno-0-494">494</a></span>
+<span class="normal"><a href="#__codelineno-0-495">495</a></span>
+<span class="normal"><a href="#__codelineno-0-496">496</a></span>
+<span class="normal"><a href="#__codelineno-0-497">497</a></span>
+<span class="normal"><a href="#__codelineno-0-498">498</a></span>
+<span class="normal"><a href="#__codelineno-0-499">499</a></span>
+<span class="normal"><a href="#__codelineno-0-500">500</a></span>
+<span class="normal"><a href="#__codelineno-0-501">501</a></span>
+<span class="normal"><a href="#__codelineno-0-502">502</a></span>
+<span class="normal"><a href="#__codelineno-0-503">503</a></span>
+<span class="normal"><a href="#__codelineno-0-504">504</a></span>
+<span class="normal"><a href="#__codelineno-0-505">505</a></span>
+<span class="normal"><a href="#__codelineno-0-506">506</a></span>
+<span class="normal"><a href="#__codelineno-0-507">507</a></span>
+<span class="normal"><a href="#__codelineno-0-508">508</a></span>
+<span class="normal"><a href="#__codelineno-0-509">509</a></span>
+<span class="normal"><a href="#__codelineno-0-510">510</a></span>
+<span class="normal"><a href="#__codelineno-0-511">511</a></span>
+<span class="normal"><a href="#__codelineno-0-512">512</a></span>
+<span class="normal"><a href="#__codelineno-0-513">513</a></span>
+<span class="normal"><a href="#__codelineno-0-514">514</a></span>
+<span class="normal"><a href="#__codelineno-0-515">515</a></span>
+<span class="normal"><a href="#__codelineno-0-516">516</a></span>
+<span class="normal"><a href="#__codelineno-0-517">517</a></span>
+<span class="normal"><a href="#__codelineno-0-518">518</a></span>
+<span class="normal"><a href="#__codelineno-0-519">519</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a><span class="k">def</span> <span class="nf">get_aggregated_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">include_advanced</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a><span class="sd">    Retrieve aggregated statistics from the quality control analysis.</span>
+</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>
+</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a><span class="sd">    **Parameters**</span>
 </span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>
-</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>    <span class="k">return</span> <span class="n">aggregated_stats</span>
+</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a><span class="sd">    - `include_advanced (bool)`:  </span>
+</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a><span class="sd">      If set to `True`, includes advanced metrics in the aggregated statistics.</span>
+</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>
+</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a><span class="sd">    **Returns**</span>
+</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>
+</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a><span class="sd">    - `Dict[str, Any]`:  </span>
+</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a><span class="sd">      A dictionary containing the aggregated statistics, which may include:</span>
+</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a><span class="sd">      - Sample statistics</span>
+</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a><span class="sd">      - Genome statistics</span>
+</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a><span class="sd">      - Amplicon statistics (if provided)</span>
+</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a><span class="sd">      - Predicted assay type</span>
+</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a><span class="sd">      - Advanced statistics (if `include_advanced` is `True`)</span>
+</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>    <span class="n">aggregated_stats</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>    <span class="c1"># Include sample_stats</span>
+</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>    <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_stats</span><span class="p">)</span>
+</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>    <span class="c1"># Include genome_stats</span>
+</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>    <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">genome_stats</span><span class="p">)</span>
+</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>    <span class="c1"># Include amplicon_stats if available</span>
+</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">amplicon_sig</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;While aggregating stats; amplicon signature provided.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">amplicon_stats</span><span class="p">)</span>
+</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>        <span class="n">aggregated_stats</span><span class="p">[</span><span class="s2">&quot;Predicted Assay Type&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predicted_assay_type</span>
+</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">:</span>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">chrs_stats</span><span class="p">)</span>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">:</span>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sex_stats</span><span class="p">)</span>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>
+</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="p">:</span>
+</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="p">)</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>    <span class="c1"># Include advanced_stats if requested</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>    <span class="k">if</span> <span class="n">include_advanced</span><span class="p">:</span>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_calculate_advanced_stats</span><span class="p">()</span>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">advanced_stats</span><span class="p">)</span>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>
+</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">predicted_error_contamination_index</span><span class="p">:</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>        <span class="n">aggregated_stats</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">predicted_error_contamination_index</span><span class="p">)</span>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>    <span class="k">return</span> <span class="n">aggregated_stats</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.reference_QC.ReferenceQC.load_genome_sig_to_dict" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">load_genome_sig_to_dict</span><span class="p">(</span><span class="o">*</span><span class="p">,</span> <span class="n">zip_file_path</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></code>
+
+<a href="#snipe.api.reference_QC.ReferenceQC.load_genome_sig_to_dict" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Load a genome signature into a dictionary of SnipeSig instances.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                <code>zip_file_path</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Path to the zip file containing the genome signatures.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>**kwargs</code>
+            </td>
+            <td>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Additional keyword arguments to pass to the SnipeSig constructor.</p>
+              </div>
+            </td>
+            <td>
+                  <code>{}</code>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+
+    <p><span class="doc-section-title">Returns:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Type</th>
+          <th>Description</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                  <code>Dict[str, SnipeSig]</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Dict[str, SnipeSig]: A dictionary mapping genome names to SnipeSig instances.</p>
+              </div>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1503">1503</a></span>
+<span class="normal"><a href="#__codelineno-0-1504">1504</a></span>
+<span class="normal"><a href="#__codelineno-0-1505">1505</a></span>
+<span class="normal"><a href="#__codelineno-0-1506">1506</a></span>
+<span class="normal"><a href="#__codelineno-0-1507">1507</a></span>
+<span class="normal"><a href="#__codelineno-0-1508">1508</a></span>
+<span class="normal"><a href="#__codelineno-0-1509">1509</a></span>
+<span class="normal"><a href="#__codelineno-0-1510">1510</a></span>
+<span class="normal"><a href="#__codelineno-0-1511">1511</a></span>
+<span class="normal"><a href="#__codelineno-0-1512">1512</a></span>
+<span class="normal"><a href="#__codelineno-0-1513">1513</a></span>
+<span class="normal"><a href="#__codelineno-0-1514">1514</a></span>
+<span class="normal"><a href="#__codelineno-0-1515">1515</a></span>
+<span class="normal"><a href="#__codelineno-0-1516">1516</a></span>
+<span class="normal"><a href="#__codelineno-0-1517">1517</a></span>
+<span class="normal"><a href="#__codelineno-0-1518">1518</a></span>
+<span class="normal"><a href="#__codelineno-0-1519">1519</a></span>
+<span class="normal"><a href="#__codelineno-0-1520">1520</a></span>
+<span class="normal"><a href="#__codelineno-0-1521">1521</a></span>
+<span class="normal"><a href="#__codelineno-0-1522">1522</a></span>
+<span class="normal"><a href="#__codelineno-0-1523">1523</a></span>
+<span class="normal"><a href="#__codelineno-0-1524">1524</a></span>
+<span class="normal"><a href="#__codelineno-0-1525">1525</a></span>
+<span class="normal"><a href="#__codelineno-0-1526">1526</a></span>
+<span class="normal"><a href="#__codelineno-0-1527">1527</a></span>
+<span class="normal"><a href="#__codelineno-0-1528">1528</a></span>
+<span class="normal"><a href="#__codelineno-0-1529">1529</a></span>
+<span class="normal"><a href="#__codelineno-0-1530">1530</a></span>
+<span class="normal"><a href="#__codelineno-0-1531">1531</a></span>
+<span class="normal"><a href="#__codelineno-0-1532">1532</a></span>
+<span class="normal"><a href="#__codelineno-0-1533">1533</a></span>
+<span class="normal"><a href="#__codelineno-0-1534">1534</a></span>
+<span class="normal"><a href="#__codelineno-0-1535">1535</a></span>
+<span class="normal"><a href="#__codelineno-0-1536">1536</a></span>
+<span class="normal"><a href="#__codelineno-0-1537">1537</a></span>
+<span class="normal"><a href="#__codelineno-0-1538">1538</a></span>
+<span class="normal"><a href="#__codelineno-0-1539">1539</a></span>
+<span class="normal"><a href="#__codelineno-0-1540">1540</a></span>
+<span class="normal"><a href="#__codelineno-0-1541">1541</a></span>
+<span class="normal"><a href="#__codelineno-0-1542">1542</a></span>
+<span class="normal"><a href="#__codelineno-0-1543">1543</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1503"><a id="__codelineno-0-1503" name="__codelineno-0-1503"></a><span class="k">def</span> <span class="nf">load_genome_sig_to_dict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="n">zip_file_path</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">]:</span>
+</span><span id="__span-0-1504"><a id="__codelineno-0-1504" name="__codelineno-0-1504"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1505"><a id="__codelineno-0-1505" name="__codelineno-0-1505"></a><span class="sd">    Load a genome signature into a dictionary of SnipeSig instances.</span>
+</span><span id="__span-0-1506"><a id="__codelineno-0-1506" name="__codelineno-0-1506"></a>
+</span><span id="__span-0-1507"><a id="__codelineno-0-1507" name="__codelineno-0-1507"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1508"><a id="__codelineno-0-1508" name="__codelineno-0-1508"></a><span class="sd">        zip_file_path (str): Path to the zip file containing the genome signatures.</span>
+</span><span id="__span-0-1509"><a id="__codelineno-0-1509" name="__codelineno-0-1509"></a><span class="sd">        **kwargs: Additional keyword arguments to pass to the SnipeSig constructor.</span>
+</span><span id="__span-0-1510"><a id="__codelineno-0-1510" name="__codelineno-0-1510"></a>
+</span><span id="__span-0-1511"><a id="__codelineno-0-1511" name="__codelineno-0-1511"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1512"><a id="__codelineno-0-1512" name="__codelineno-0-1512"></a><span class="sd">        Dict[str, SnipeSig]: A dictionary mapping genome names to SnipeSig instances.</span>
+</span><span id="__span-0-1513"><a id="__codelineno-0-1513" name="__codelineno-0-1513"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1514"><a id="__codelineno-0-1514" name="__codelineno-0-1514"></a>
+</span><span id="__span-0-1515"><a id="__codelineno-0-1515" name="__codelineno-0-1515"></a>    <span class="n">genome_chr_name_to_sig</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1516"><a id="__codelineno-0-1516" name="__codelineno-0-1516"></a>
+</span><span id="__span-0-1517"><a id="__codelineno-0-1517" name="__codelineno-0-1517"></a>    <span class="n">sourmash_sigs</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">load_file_as_signatures</span><span class="p">(</span><span class="n">zip_file_path</span><span class="p">)</span>
+</span><span id="__span-0-1518"><a id="__codelineno-0-1518" name="__codelineno-0-1518"></a>    <span class="n">sex_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-1519"><a id="__codelineno-0-1519" name="__codelineno-0-1519"></a>    <span class="n">autosome_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-1520"><a id="__codelineno-0-1520" name="__codelineno-0-1520"></a>    <span class="n">genome_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-1521"><a id="__codelineno-0-1521" name="__codelineno-0-1521"></a>    <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
+</span><span id="__span-0-1522"><a id="__codelineno-0-1522" name="__codelineno-0-1522"></a>        <span class="n">name</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span>
+</span><span id="__span-0-1523"><a id="__codelineno-0-1523" name="__codelineno-0-1523"></a>        <span class="k">if</span> <span class="n">name</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">):</span>
+</span><span id="__span-0-1524"><a id="__codelineno-0-1524" name="__codelineno-0-1524"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Loading genome signature: </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1525"><a id="__codelineno-0-1525" name="__codelineno-0-1525"></a>            <span class="n">restored_name</span> <span class="o">=</span> <span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1526"><a id="__codelineno-0-1526" name="__codelineno-0-1526"></a>            <span class="n">genome_chr_name_to_sig</span><span class="p">[</span><span class="n">restored_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">)</span>
+</span><span id="__span-0-1527"><a id="__codelineno-0-1527" name="__codelineno-0-1527"></a>            <span class="n">genome_count</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-1528"><a id="__codelineno-0-1528" name="__codelineno-0-1528"></a>        <span class="k">elif</span> <span class="s2">&quot;sex&quot;</span> <span class="ow">in</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-1529"><a id="__codelineno-0-1529" name="__codelineno-0-1529"></a>            <span class="n">sex_count</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-1530"><a id="__codelineno-0-1530" name="__codelineno-0-1530"></a>            <span class="n">genome_chr_name_to_sig</span><span class="p">[</span><span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;sex-&#39;</span><span class="p">,</span><span class="s1">&#39;&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">)</span>
+</span><span id="__span-0-1531"><a id="__codelineno-0-1531" name="__codelineno-0-1531"></a>        <span class="k">elif</span> <span class="s2">&quot;autosome&quot;</span> <span class="ow">in</span> <span class="n">name</span><span class="p">:</span>
+</span><span id="__span-0-1532"><a id="__codelineno-0-1532" name="__codelineno-0-1532"></a>            <span class="n">autosome_count</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-1533"><a id="__codelineno-0-1533" name="__codelineno-0-1533"></a>            <span class="n">genome_chr_name_to_sig</span><span class="p">[</span><span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s1">&#39;autosome-&#39;</span><span class="p">,</span><span class="s1">&#39;&#39;</span><span class="p">)]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">)</span>
+</span><span id="__span-0-1534"><a id="__codelineno-0-1534" name="__codelineno-0-1534"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1535"><a id="__codelineno-0-1535" name="__codelineno-0-1535"></a>            <span class="n">logging</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unknown genome signature name: </span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">, are you sure you generated this with `snipe sketch --ref`?&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1536"><a id="__codelineno-0-1536" name="__codelineno-0-1536"></a>
+</span><span id="__span-0-1537"><a id="__codelineno-0-1537" name="__codelineno-0-1537"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded </span><span class="si">%d</span><span class="s2"> genome signatures and </span><span class="si">%d</span><span class="s2"> sex chrs and </span><span class="si">%d</span><span class="s2"> autosome chrs&quot;</span><span class="p">,</span> <span class="n">genome_count</span><span class="p">,</span> <span class="n">sex_count</span><span class="p">,</span> <span class="n">autosome_count</span><span class="p">)</span>
+</span><span id="__span-0-1538"><a id="__codelineno-0-1538" name="__codelineno-0-1538"></a>
+</span><span id="__span-0-1539"><a id="__codelineno-0-1539" name="__codelineno-0-1539"></a>    <span class="k">if</span> <span class="n">genome_count</span> <span class="o">!=</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-1540"><a id="__codelineno-0-1540" name="__codelineno-0-1540"></a>        <span class="n">logging</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Expected 1 genome signature, found </span><span class="si">{</span><span class="n">genome_count</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1541"><a id="__codelineno-0-1541" name="__codelineno-0-1541"></a>
+</span><span id="__span-0-1542"><a id="__codelineno-0-1542" name="__codelineno-0-1542"></a>
+</span><span id="__span-0-1543"><a id="__codelineno-0-1543" name="__codelineno-0-1543"></a>    <span class="k">return</span> <span class="n">genome_chr_name_to_sig</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.reference_QC.ReferenceQC.nonref_consume_from_vars" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">nonref_consume_from_vars</span><span class="p">(</span><span class="o">*</span><span class="p">,</span> <span class="nb">vars</span><span class="p">,</span> <span class="n">vars_order</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></code>
+
+<a href="#snipe.api.reference_QC.ReferenceQC.nonref_consume_from_vars" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Consume and analyze non-reference k-mers from provided variable signatures.</p>
+<p>This method processes non-reference k-mers in the sample signature by intersecting them with a set of
+variable-specific <code>SnipeSig</code> instances. It calculates coverage and total abundance metrics for each
+variable in a specified order, ensuring that each non-reference k-mer is accounted for without overlap
+between variables. The method updates internal statistics that reflect the distribution of non-reference
+k-mers across the provided variables.</p>
+<p><strong>Process Overview</strong>:</p>
+<ol>
+<li><strong>Validation</strong>:</li>
+<li>Verifies that all variable names specified in <code>vars_order</code> are present in the <code>vars</code> dictionary.</li>
+<li>
+<p>Raises a <code>ValueError</code> if any variable in <code>vars_order</code> is missing from <code>vars</code>.</p>
+</li>
+<li>
+<p><strong>Non-Reference K-mer Extraction</strong>:</p>
+</li>
+<li>Computes the set of non-reference non-singleton k-mers by subtracting the reference signature from the sample signature.</li>
+<li>
+<p>If no non-reference k-mers are found, the method logs a warning and returns an empty dictionary.</p>
+</li>
+<li>
+<p><strong>Variable-wise Consumption</strong>:</p>
+</li>
+<li>Iterates over each variable name in <code>vars_order</code>.</li>
+<li>
+<p>For each variable:</p>
+<ul>
+<li>Intersects the remaining non-reference k-mers with the variable-specific signature.</li>
+<li>Calculates the total abundance and coverage index for the intersected k-mers.</li>
+<li>Updates the <code>vars_nonref_stats</code> dictionary with the computed metrics.</li>
+<li>Removes the consumed k-mers from the remaining non-reference set to prevent overlap.</li>
+</ul>
+</li>
+<li>
+<p><strong>Final State Logging</strong>:</p>
+</li>
+<li>Logs the final size and total abundance of the remaining non-reference k-mers after consumption.</li>
+</ol>
+<p><strong>Parameters</strong>:</p>
+<div class="language-text highlight"><pre><span></span><code>- `vars` (`Dict[str, SnipeSig]`):  
+A dictionary mapping variable names to their corresponding `SnipeSig` instances. Each `SnipeSig` 
+represents a set of k-mers associated with a specific non-reference category or variable.
+
+- `vars_order` (`List[str]`):  
+A list specifying the order in which variables should be processed. The order determines the priority 
+of consumption, ensuring that earlier variables in the list have their k-mers accounted for before 
+later ones.
+
+- `**kwargs`:  
+Additional keyword arguments. Reserved for future extensions and should not be used in the current context.
+</code></pre></div>
+<p><strong>Returns</strong>:</p>
+<div class="language-text highlight"><pre><span></span><code>- `Dict[str, float]`:  
+A dictionary containing statistics for each variable name in `vars_order`, 
+    - `&quot;non-genomic total k-mer abundance&quot;` (`float`):  
+        The sum of abundances of non-reference k-mers associated with the variable.
+    - `&quot;non-genomic coverage index&quot;` (`float`):  
+        The ratio of unique non-reference k-mers associated with the variable to the total number 
+        of non-reference k-mers in the sample before consumption.
+
+Example Output:
+```python
+{
+    &quot;variable_A non-genomic total k-mer abundance&quot;: 1500.0,
+    &quot;variable_A non-genomic coverage index&quot;: 0.20
+    &quot;variable_B non-genomic total k-mer abundance&quot;: 3500.0,
+    &quot;variable_B non-genomic coverage index&quot;: 0.70
+    &quot;non-var non-genomic total k-mer abundance&quot;: 0.10,
+    &quot;non-var non-genomic coverage index&quot;: 218
+}
+```
+</code></pre></div>
+<p><strong>Raises</strong>:</p>
+<div class="language-text highlight"><pre><span></span><code>- `ValueError`:  
+- If any variable specified in `vars_order` is not present in the `vars` dictionary.
+- This ensures that all variables intended for consumption are available for processing.
+</code></pre></div>
+<p><strong>Usage Example</strong>:</p>
+<div class="language-python highlight"><pre><span></span><code><span id="__span-1-1"><a id="__codelineno-1-1" name="__codelineno-1-1" href="#__codelineno-1-1"></a><span class="c1"># Assume `variables_signatures` is a dictionary of variable-specific SnipeSig instances</span>
+</span><span id="__span-1-2"><a id="__codelineno-1-2" name="__codelineno-1-2" href="#__codelineno-1-2"></a><span class="n">variables_signatures</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-1-3"><a id="__codelineno-1-3" name="__codelineno-1-3" href="#__codelineno-1-3"></a>    <span class="s2">&quot;GTDB&quot;</span><span class="p">:</span> <span class="n">sig_GTDB</span><span class="p">,</span>
+</span><span id="__span-1-4"><a id="__codelineno-1-4" name="__codelineno-1-4" href="#__codelineno-1-4"></a>    <span class="s2">&quot;VIRALDB&quot;</span><span class="p">:</span> <span class="n">sig_VIRALDB</span><span class="p">,</span>
+</span><span id="__span-1-5"><a id="__codelineno-1-5" name="__codelineno-1-5" href="#__codelineno-1-5"></a>    <span class="s2">&quot;contaminant_X&quot;</span><span class="p">:</span> <span class="n">sig_contaminant_x</span>
+</span><span id="__span-1-6"><a id="__codelineno-1-6" name="__codelineno-1-6" href="#__codelineno-1-6"></a><span class="p">}</span>
+</span><span id="__span-1-7"><a id="__codelineno-1-7" name="__codelineno-1-7" href="#__codelineno-1-7"></a>
+</span><span id="__span-1-8"><a id="__codelineno-1-8" name="__codelineno-1-8" href="#__codelineno-1-8"></a><span class="c1"># Define the order in which variables should be processed</span>
+</span><span id="__span-1-9"><a id="__codelineno-1-9" name="__codelineno-1-9" href="#__codelineno-1-9"></a><span class="n">processing_order</span> <span class="o">=</span> <span class="p">[</span><span class="s2">&quot;GTDB&quot;</span><span class="p">,</span> <span class="s2">&quot;VIRALDB&quot;</span><span class="p">,</span> <span class="s2">&quot;contaminant_X&quot;</span><span class="p">]</span>
+</span><span id="__span-1-10"><a id="__codelineno-1-10" name="__codelineno-1-10" href="#__codelineno-1-10"></a>
+</span><span id="__span-1-11"><a id="__codelineno-1-11" name="__codelineno-1-11" href="#__codelineno-1-11"></a><span class="c1"># Consume non-reference k-mers and retrieve statistics</span>
+</span><span id="__span-1-12"><a id="__codelineno-1-12" name="__codelineno-1-12" href="#__codelineno-1-12"></a><span class="n">nonref_stats</span> <span class="o">=</span> <span class="n">qc</span><span class="o">.</span><span class="n">nonref_consume_from_vars</span><span class="p">(</span><span class="nb">vars</span><span class="o">=</span><span class="n">variables_signatures</span><span class="p">,</span> <span class="n">vars_order</span><span class="o">=</span><span class="n">processing_order</span><span class="p">)</span>
+</span><span id="__span-1-13"><a id="__codelineno-1-13" name="__codelineno-1-13" href="#__codelineno-1-13"></a>
+</span><span id="__span-1-14"><a id="__codelineno-1-14" name="__codelineno-1-14" href="#__codelineno-1-14"></a><span class="nb">print</span><span class="p">(</span><span class="n">nonref_stats</span><span class="p">)</span>
+</span><span id="__span-1-15"><a id="__codelineno-1-15" name="__codelineno-1-15" href="#__codelineno-1-15"></a><span class="c1"># Output Example:</span>
+</span><span id="__span-1-16"><a id="__codelineno-1-16" name="__codelineno-1-16" href="#__codelineno-1-16"></a><span class="c1"># {</span>
+</span><span id="__span-1-17"><a id="__codelineno-1-17" name="__codelineno-1-17" href="#__codelineno-1-17"></a><span class="c1">#     &quot;GTDB non-genomic total k-mer abundance&quot;: 1500.0,</span>
+</span><span id="__span-1-18"><a id="__codelineno-1-18" name="__codelineno-1-18" href="#__codelineno-1-18"></a><span class="c1">#     &quot;GTDB non-genomic coverage index&quot;: 0.2,</span>
+</span><span id="__span-1-19"><a id="__codelineno-1-19" name="__codelineno-1-19" href="#__codelineno-1-19"></a><span class="c1">#     &quot;VIRALDB non-genomic total k-mer abundance&quot;: 3500.0,</span>
+</span><span id="__span-1-20"><a id="__codelineno-1-20" name="__codelineno-1-20" href="#__codelineno-1-20"></a><span class="c1">#     &quot;VIRALDB non-genomic coverage index&quot;: 0.70,</span>
+</span><span id="__span-1-21"><a id="__codelineno-1-21" name="__codelineno-1-21" href="#__codelineno-1-21"></a><span class="c1">#     &quot;contaminant_X non-genomic total k-mer abundance&quot;: 0.0,</span>
+</span><span id="__span-1-22"><a id="__codelineno-1-22" name="__codelineno-1-22" href="#__codelineno-1-22"></a><span class="c1">#     &quot;contaminant_X non-genomic coverage index&quot;: 0.0,</span>
+</span><span id="__span-1-23"><a id="__codelineno-1-23" name="__codelineno-1-23" href="#__codelineno-1-23"></a><span class="c1">#     &quot;non-var non-genomic total k-mer abundance&quot;: 100.0,</span>
+</span><span id="__span-1-24"><a id="__codelineno-1-24" name="__codelineno-1-24" href="#__codelineno-1-24"></a><span class="c1">#     &quot;non-var non-genomic coverage index&quot;: 0.1</span>
+</span><span id="__span-1-25"><a id="__codelineno-1-25" name="__codelineno-1-25" href="#__codelineno-1-25"></a><span class="c1"># }</span>
+</span></code></pre></div>
+<p><strong>Notes</strong>:</p>
+<div class="language-text highlight"><pre><span></span><code>- **Variable Processing Order**:  
+The `vars_order` list determines the sequence in which variables are processed. This order is crucial
+when there is potential overlap in k-mers between variables, as earlier variables in the list have 
+higher priority in consuming shared k-mers.
+
+- **Non-Reference K-mers Definition**:  
+Non-reference k-mers are defined as those present in the sample signature but absent in the reference 
+signature. This method focuses on characterizing these unique k-mers relative to provided variables.
+</code></pre></div>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1341">1341</a></span>
+<span class="normal"><a href="#__codelineno-0-1342">1342</a></span>
+<span class="normal"><a href="#__codelineno-0-1343">1343</a></span>
+<span class="normal"><a href="#__codelineno-0-1344">1344</a></span>
+<span class="normal"><a href="#__codelineno-0-1345">1345</a></span>
+<span class="normal"><a href="#__codelineno-0-1346">1346</a></span>
+<span class="normal"><a href="#__codelineno-0-1347">1347</a></span>
+<span class="normal"><a href="#__codelineno-0-1348">1348</a></span>
+<span class="normal"><a href="#__codelineno-0-1349">1349</a></span>
+<span class="normal"><a href="#__codelineno-0-1350">1350</a></span>
+<span class="normal"><a href="#__codelineno-0-1351">1351</a></span>
+<span class="normal"><a href="#__codelineno-0-1352">1352</a></span>
+<span class="normal"><a href="#__codelineno-0-1353">1353</a></span>
+<span class="normal"><a href="#__codelineno-0-1354">1354</a></span>
+<span class="normal"><a href="#__codelineno-0-1355">1355</a></span>
+<span class="normal"><a href="#__codelineno-0-1356">1356</a></span>
+<span class="normal"><a href="#__codelineno-0-1357">1357</a></span>
+<span class="normal"><a href="#__codelineno-0-1358">1358</a></span>
+<span class="normal"><a href="#__codelineno-0-1359">1359</a></span>
+<span class="normal"><a href="#__codelineno-0-1360">1360</a></span>
+<span class="normal"><a href="#__codelineno-0-1361">1361</a></span>
+<span class="normal"><a href="#__codelineno-0-1362">1362</a></span>
+<span class="normal"><a href="#__codelineno-0-1363">1363</a></span>
+<span class="normal"><a href="#__codelineno-0-1364">1364</a></span>
+<span class="normal"><a href="#__codelineno-0-1365">1365</a></span>
+<span class="normal"><a href="#__codelineno-0-1366">1366</a></span>
+<span class="normal"><a href="#__codelineno-0-1367">1367</a></span>
+<span class="normal"><a href="#__codelineno-0-1368">1368</a></span>
+<span class="normal"><a href="#__codelineno-0-1369">1369</a></span>
+<span class="normal"><a href="#__codelineno-0-1370">1370</a></span>
+<span class="normal"><a href="#__codelineno-0-1371">1371</a></span>
+<span class="normal"><a href="#__codelineno-0-1372">1372</a></span>
+<span class="normal"><a href="#__codelineno-0-1373">1373</a></span>
+<span class="normal"><a href="#__codelineno-0-1374">1374</a></span>
+<span class="normal"><a href="#__codelineno-0-1375">1375</a></span>
+<span class="normal"><a href="#__codelineno-0-1376">1376</a></span>
+<span class="normal"><a href="#__codelineno-0-1377">1377</a></span>
+<span class="normal"><a href="#__codelineno-0-1378">1378</a></span>
+<span class="normal"><a href="#__codelineno-0-1379">1379</a></span>
+<span class="normal"><a href="#__codelineno-0-1380">1380</a></span>
+<span class="normal"><a href="#__codelineno-0-1381">1381</a></span>
+<span class="normal"><a href="#__codelineno-0-1382">1382</a></span>
+<span class="normal"><a href="#__codelineno-0-1383">1383</a></span>
+<span class="normal"><a href="#__codelineno-0-1384">1384</a></span>
+<span class="normal"><a href="#__codelineno-0-1385">1385</a></span>
+<span class="normal"><a href="#__codelineno-0-1386">1386</a></span>
+<span class="normal"><a href="#__codelineno-0-1387">1387</a></span>
+<span class="normal"><a href="#__codelineno-0-1388">1388</a></span>
+<span class="normal"><a href="#__codelineno-0-1389">1389</a></span>
+<span class="normal"><a href="#__codelineno-0-1390">1390</a></span>
+<span class="normal"><a href="#__codelineno-0-1391">1391</a></span>
+<span class="normal"><a href="#__codelineno-0-1392">1392</a></span>
+<span class="normal"><a href="#__codelineno-0-1393">1393</a></span>
+<span class="normal"><a href="#__codelineno-0-1394">1394</a></span>
+<span class="normal"><a href="#__codelineno-0-1395">1395</a></span>
+<span class="normal"><a href="#__codelineno-0-1396">1396</a></span>
+<span class="normal"><a href="#__codelineno-0-1397">1397</a></span>
+<span class="normal"><a href="#__codelineno-0-1398">1398</a></span>
+<span class="normal"><a href="#__codelineno-0-1399">1399</a></span>
+<span class="normal"><a href="#__codelineno-0-1400">1400</a></span>
+<span class="normal"><a href="#__codelineno-0-1401">1401</a></span>
+<span class="normal"><a href="#__codelineno-0-1402">1402</a></span>
+<span class="normal"><a href="#__codelineno-0-1403">1403</a></span>
+<span class="normal"><a href="#__codelineno-0-1404">1404</a></span>
+<span class="normal"><a href="#__codelineno-0-1405">1405</a></span>
+<span class="normal"><a href="#__codelineno-0-1406">1406</a></span>
+<span class="normal"><a href="#__codelineno-0-1407">1407</a></span>
+<span class="normal"><a href="#__codelineno-0-1408">1408</a></span>
+<span class="normal"><a href="#__codelineno-0-1409">1409</a></span>
+<span class="normal"><a href="#__codelineno-0-1410">1410</a></span>
+<span class="normal"><a href="#__codelineno-0-1411">1411</a></span>
+<span class="normal"><a href="#__codelineno-0-1412">1412</a></span>
+<span class="normal"><a href="#__codelineno-0-1413">1413</a></span>
+<span class="normal"><a href="#__codelineno-0-1414">1414</a></span>
+<span class="normal"><a href="#__codelineno-0-1415">1415</a></span>
+<span class="normal"><a href="#__codelineno-0-1416">1416</a></span>
+<span class="normal"><a href="#__codelineno-0-1417">1417</a></span>
+<span class="normal"><a href="#__codelineno-0-1418">1418</a></span>
+<span class="normal"><a href="#__codelineno-0-1419">1419</a></span>
+<span class="normal"><a href="#__codelineno-0-1420">1420</a></span>
+<span class="normal"><a href="#__codelineno-0-1421">1421</a></span>
+<span class="normal"><a href="#__codelineno-0-1422">1422</a></span>
+<span class="normal"><a href="#__codelineno-0-1423">1423</a></span>
+<span class="normal"><a href="#__codelineno-0-1424">1424</a></span>
+<span class="normal"><a href="#__codelineno-0-1425">1425</a></span>
+<span class="normal"><a href="#__codelineno-0-1426">1426</a></span>
+<span class="normal"><a href="#__codelineno-0-1427">1427</a></span>
+<span class="normal"><a href="#__codelineno-0-1428">1428</a></span>
+<span class="normal"><a href="#__codelineno-0-1429">1429</a></span>
+<span class="normal"><a href="#__codelineno-0-1430">1430</a></span>
+<span class="normal"><a href="#__codelineno-0-1431">1431</a></span>
+<span class="normal"><a href="#__codelineno-0-1432">1432</a></span>
+<span class="normal"><a href="#__codelineno-0-1433">1433</a></span>
+<span class="normal"><a href="#__codelineno-0-1434">1434</a></span>
+<span class="normal"><a href="#__codelineno-0-1435">1435</a></span>
+<span class="normal"><a href="#__codelineno-0-1436">1436</a></span>
+<span class="normal"><a href="#__codelineno-0-1437">1437</a></span>
+<span class="normal"><a href="#__codelineno-0-1438">1438</a></span>
+<span class="normal"><a href="#__codelineno-0-1439">1439</a></span>
+<span class="normal"><a href="#__codelineno-0-1440">1440</a></span>
+<span class="normal"><a href="#__codelineno-0-1441">1441</a></span>
+<span class="normal"><a href="#__codelineno-0-1442">1442</a></span>
+<span class="normal"><a href="#__codelineno-0-1443">1443</a></span>
+<span class="normal"><a href="#__codelineno-0-1444">1444</a></span>
+<span class="normal"><a href="#__codelineno-0-1445">1445</a></span>
+<span class="normal"><a href="#__codelineno-0-1446">1446</a></span>
+<span class="normal"><a href="#__codelineno-0-1447">1447</a></span>
+<span class="normal"><a href="#__codelineno-0-1448">1448</a></span>
+<span class="normal"><a href="#__codelineno-0-1449">1449</a></span>
+<span class="normal"><a href="#__codelineno-0-1450">1450</a></span>
+<span class="normal"><a href="#__codelineno-0-1451">1451</a></span>
+<span class="normal"><a href="#__codelineno-0-1452">1452</a></span>
+<span class="normal"><a href="#__codelineno-0-1453">1453</a></span>
+<span class="normal"><a href="#__codelineno-0-1454">1454</a></span>
+<span class="normal"><a href="#__codelineno-0-1455">1455</a></span>
+<span class="normal"><a href="#__codelineno-0-1456">1456</a></span>
+<span class="normal"><a href="#__codelineno-0-1457">1457</a></span>
+<span class="normal"><a href="#__codelineno-0-1458">1458</a></span>
+<span class="normal"><a href="#__codelineno-0-1459">1459</a></span>
+<span class="normal"><a href="#__codelineno-0-1460">1460</a></span>
+<span class="normal"><a href="#__codelineno-0-1461">1461</a></span>
+<span class="normal"><a href="#__codelineno-0-1462">1462</a></span>
+<span class="normal"><a href="#__codelineno-0-1463">1463</a></span>
+<span class="normal"><a href="#__codelineno-0-1464">1464</a></span>
+<span class="normal"><a href="#__codelineno-0-1465">1465</a></span>
+<span class="normal"><a href="#__codelineno-0-1466">1466</a></span>
+<span class="normal"><a href="#__codelineno-0-1467">1467</a></span>
+<span class="normal"><a href="#__codelineno-0-1468">1468</a></span>
+<span class="normal"><a href="#__codelineno-0-1469">1469</a></span>
+<span class="normal"><a href="#__codelineno-0-1470">1470</a></span>
+<span class="normal"><a href="#__codelineno-0-1471">1471</a></span>
+<span class="normal"><a href="#__codelineno-0-1472">1472</a></span>
+<span class="normal"><a href="#__codelineno-0-1473">1473</a></span>
+<span class="normal"><a href="#__codelineno-0-1474">1474</a></span>
+<span class="normal"><a href="#__codelineno-0-1475">1475</a></span>
+<span class="normal"><a href="#__codelineno-0-1476">1476</a></span>
+<span class="normal"><a href="#__codelineno-0-1477">1477</a></span>
+<span class="normal"><a href="#__codelineno-0-1478">1478</a></span>
+<span class="normal"><a href="#__codelineno-0-1479">1479</a></span>
+<span class="normal"><a href="#__codelineno-0-1480">1480</a></span>
+<span class="normal"><a href="#__codelineno-0-1481">1481</a></span>
+<span class="normal"><a href="#__codelineno-0-1482">1482</a></span>
+<span class="normal"><a href="#__codelineno-0-1483">1483</a></span>
+<span class="normal"><a href="#__codelineno-0-1484">1484</a></span>
+<span class="normal"><a href="#__codelineno-0-1485">1485</a></span>
+<span class="normal"><a href="#__codelineno-0-1486">1486</a></span>
+<span class="normal"><a href="#__codelineno-0-1487">1487</a></span>
+<span class="normal"><a href="#__codelineno-0-1488">1488</a></span>
+<span class="normal"><a href="#__codelineno-0-1489">1489</a></span>
+<span class="normal"><a href="#__codelineno-0-1490">1490</a></span>
+<span class="normal"><a href="#__codelineno-0-1491">1491</a></span>
+<span class="normal"><a href="#__codelineno-0-1492">1492</a></span>
+<span class="normal"><a href="#__codelineno-0-1493">1493</a></span>
+<span class="normal"><a href="#__codelineno-0-1494">1494</a></span>
+<span class="normal"><a href="#__codelineno-0-1495">1495</a></span>
+<span class="normal"><a href="#__codelineno-0-1496">1496</a></span>
+<span class="normal"><a href="#__codelineno-0-1497">1497</a></span>
+<span class="normal"><a href="#__codelineno-0-1498">1498</a></span>
+<span class="normal"><a href="#__codelineno-0-1499">1499</a></span>
+<span class="normal"><a href="#__codelineno-0-1500">1500</a></span>
+<span class="normal"><a href="#__codelineno-0-1501">1501</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a><span class="k">def</span> <span class="nf">nonref_consume_from_vars</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="nb">vars</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">],</span> <span class="n">vars_order</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">float</span><span class="p">]:</span>
+</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a><span class="sd">    Consume and analyze non-reference k-mers from provided variable signatures.</span>
+</span><span id="__span-0-1344"><a id="__codelineno-0-1344" name="__codelineno-0-1344"></a>
+</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a><span class="sd">    This method processes non-reference k-mers in the sample signature by intersecting them with a set of</span>
+</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a><span class="sd">    variable-specific `SnipeSig` instances. It calculates coverage and total abundance metrics for each</span>
+</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a><span class="sd">    variable in a specified order, ensuring that each non-reference k-mer is accounted for without overlap</span>
+</span><span id="__span-0-1348"><a id="__codelineno-0-1348" name="__codelineno-0-1348"></a><span class="sd">    between variables. The method updates internal statistics that reflect the distribution of non-reference</span>
+</span><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a><span class="sd">    k-mers across the provided variables.</span>
+</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a>
+</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a><span class="sd">    **Process Overview**:</span>
+</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a>
+</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a><span class="sd">    1. **Validation**:</span>
+</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a><span class="sd">    - Verifies that all variable names specified in `vars_order` are present in the `vars` dictionary.</span>
+</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a><span class="sd">    - Raises a `ValueError` if any variable in `vars_order` is missing from `vars`.</span>
+</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a>
+</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a><span class="sd">    2. **Non-Reference K-mer Extraction**:</span>
+</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a><span class="sd">    - Computes the set of non-reference non-singleton k-mers by subtracting the reference signature from the sample signature.</span>
+</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a><span class="sd">    - If no non-reference k-mers are found, the method logs a warning and returns an empty dictionary.</span>
+</span><span id="__span-0-1360"><a id="__codelineno-0-1360" name="__codelineno-0-1360"></a>
+</span><span id="__span-0-1361"><a id="__codelineno-0-1361" name="__codelineno-0-1361"></a><span class="sd">    3. **Variable-wise Consumption**:</span>
+</span><span id="__span-0-1362"><a id="__codelineno-0-1362" name="__codelineno-0-1362"></a><span class="sd">    - Iterates over each variable name in `vars_order`.</span>
+</span><span id="__span-0-1363"><a id="__codelineno-0-1363" name="__codelineno-0-1363"></a><span class="sd">    - For each variable:</span>
+</span><span id="__span-0-1364"><a id="__codelineno-0-1364" name="__codelineno-0-1364"></a><span class="sd">        - Intersects the remaining non-reference k-mers with the variable-specific signature.</span>
+</span><span id="__span-0-1365"><a id="__codelineno-0-1365" name="__codelineno-0-1365"></a><span class="sd">        - Calculates the total abundance and coverage index for the intersected k-mers.</span>
+</span><span id="__span-0-1366"><a id="__codelineno-0-1366" name="__codelineno-0-1366"></a><span class="sd">        - Updates the `vars_nonref_stats` dictionary with the computed metrics.</span>
+</span><span id="__span-0-1367"><a id="__codelineno-0-1367" name="__codelineno-0-1367"></a><span class="sd">        - Removes the consumed k-mers from the remaining non-reference set to prevent overlap.</span>
+</span><span id="__span-0-1368"><a id="__codelineno-0-1368" name="__codelineno-0-1368"></a>
+</span><span id="__span-0-1369"><a id="__codelineno-0-1369" name="__codelineno-0-1369"></a><span class="sd">    4. **Final State Logging**:</span>
+</span><span id="__span-0-1370"><a id="__codelineno-0-1370" name="__codelineno-0-1370"></a><span class="sd">    - Logs the final size and total abundance of the remaining non-reference k-mers after consumption.</span>
+</span><span id="__span-0-1371"><a id="__codelineno-0-1371" name="__codelineno-0-1371"></a>
+</span><span id="__span-0-1372"><a id="__codelineno-0-1372" name="__codelineno-0-1372"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-1373"><a id="__codelineno-0-1373" name="__codelineno-0-1373"></a>
+</span><span id="__span-0-1374"><a id="__codelineno-0-1374" name="__codelineno-0-1374"></a><span class="sd">        - `vars` (`Dict[str, SnipeSig]`):  </span>
+</span><span id="__span-0-1375"><a id="__codelineno-0-1375" name="__codelineno-0-1375"></a><span class="sd">        A dictionary mapping variable names to their corresponding `SnipeSig` instances. Each `SnipeSig` </span>
+</span><span id="__span-0-1376"><a id="__codelineno-0-1376" name="__codelineno-0-1376"></a><span class="sd">        represents a set of k-mers associated with a specific non-reference category or variable.</span>
+</span><span id="__span-0-1377"><a id="__codelineno-0-1377" name="__codelineno-0-1377"></a>
+</span><span id="__span-0-1378"><a id="__codelineno-0-1378" name="__codelineno-0-1378"></a><span class="sd">        - `vars_order` (`List[str]`):  </span>
+</span><span id="__span-0-1379"><a id="__codelineno-0-1379" name="__codelineno-0-1379"></a><span class="sd">        A list specifying the order in which variables should be processed. The order determines the priority </span>
+</span><span id="__span-0-1380"><a id="__codelineno-0-1380" name="__codelineno-0-1380"></a><span class="sd">        of consumption, ensuring that earlier variables in the list have their k-mers accounted for before </span>
+</span><span id="__span-0-1381"><a id="__codelineno-0-1381" name="__codelineno-0-1381"></a><span class="sd">        later ones.</span>
+</span><span id="__span-0-1382"><a id="__codelineno-0-1382" name="__codelineno-0-1382"></a>
+</span><span id="__span-0-1383"><a id="__codelineno-0-1383" name="__codelineno-0-1383"></a><span class="sd">        - `**kwargs`:  </span>
+</span><span id="__span-0-1384"><a id="__codelineno-0-1384" name="__codelineno-0-1384"></a><span class="sd">        Additional keyword arguments. Reserved for future extensions and should not be used in the current context.</span>
+</span><span id="__span-0-1385"><a id="__codelineno-0-1385" name="__codelineno-0-1385"></a>
+</span><span id="__span-0-1386"><a id="__codelineno-0-1386" name="__codelineno-0-1386"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-1387"><a id="__codelineno-0-1387" name="__codelineno-0-1387"></a>
+</span><span id="__span-0-1388"><a id="__codelineno-0-1388" name="__codelineno-0-1388"></a><span class="sd">        - `Dict[str, float]`:  </span>
+</span><span id="__span-0-1389"><a id="__codelineno-0-1389" name="__codelineno-0-1389"></a><span class="sd">        A dictionary containing statistics for each variable name in `vars_order`, </span>
+</span><span id="__span-0-1390"><a id="__codelineno-0-1390" name="__codelineno-0-1390"></a><span class="sd">            - `&quot;non-genomic total k-mer abundance&quot;` (`float`):  </span>
+</span><span id="__span-0-1391"><a id="__codelineno-0-1391" name="__codelineno-0-1391"></a><span class="sd">                The sum of abundances of non-reference k-mers associated with the variable.</span>
+</span><span id="__span-0-1392"><a id="__codelineno-0-1392" name="__codelineno-0-1392"></a><span class="sd">            - `&quot;non-genomic coverage index&quot;` (`float`):  </span>
+</span><span id="__span-0-1393"><a id="__codelineno-0-1393" name="__codelineno-0-1393"></a><span class="sd">                The ratio of unique non-reference k-mers associated with the variable to the total number </span>
+</span><span id="__span-0-1394"><a id="__codelineno-0-1394" name="__codelineno-0-1394"></a><span class="sd">                of non-reference k-mers in the sample before consumption.</span>
+</span><span id="__span-0-1395"><a id="__codelineno-0-1395" name="__codelineno-0-1395"></a>
+</span><span id="__span-0-1396"><a id="__codelineno-0-1396" name="__codelineno-0-1396"></a><span class="sd">        Example Output:</span>
+</span><span id="__span-0-1397"><a id="__codelineno-0-1397" name="__codelineno-0-1397"></a><span class="sd">        ```python</span>
+</span><span id="__span-0-1398"><a id="__codelineno-0-1398" name="__codelineno-0-1398"></a><span class="sd">        {</span>
+</span><span id="__span-0-1399"><a id="__codelineno-0-1399" name="__codelineno-0-1399"></a><span class="sd">            &quot;variable_A non-genomic total k-mer abundance&quot;: 1500.0,</span>
+</span><span id="__span-0-1400"><a id="__codelineno-0-1400" name="__codelineno-0-1400"></a><span class="sd">            &quot;variable_A non-genomic coverage index&quot;: 0.20</span>
+</span><span id="__span-0-1401"><a id="__codelineno-0-1401" name="__codelineno-0-1401"></a><span class="sd">            &quot;variable_B non-genomic total k-mer abundance&quot;: 3500.0,</span>
+</span><span id="__span-0-1402"><a id="__codelineno-0-1402" name="__codelineno-0-1402"></a><span class="sd">            &quot;variable_B non-genomic coverage index&quot;: 0.70</span>
+</span><span id="__span-0-1403"><a id="__codelineno-0-1403" name="__codelineno-0-1403"></a><span class="sd">            &quot;non-var non-genomic total k-mer abundance&quot;: 0.10,</span>
+</span><span id="__span-0-1404"><a id="__codelineno-0-1404" name="__codelineno-0-1404"></a><span class="sd">            &quot;non-var non-genomic coverage index&quot;: 218</span>
+</span><span id="__span-0-1405"><a id="__codelineno-0-1405" name="__codelineno-0-1405"></a><span class="sd">        }</span>
+</span><span id="__span-0-1406"><a id="__codelineno-0-1406" name="__codelineno-0-1406"></a><span class="sd">        ```</span>
+</span><span id="__span-0-1407"><a id="__codelineno-0-1407" name="__codelineno-0-1407"></a>
+</span><span id="__span-0-1408"><a id="__codelineno-0-1408" name="__codelineno-0-1408"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-1409"><a id="__codelineno-0-1409" name="__codelineno-0-1409"></a>
+</span><span id="__span-0-1410"><a id="__codelineno-0-1410" name="__codelineno-0-1410"></a><span class="sd">        - `ValueError`:  </span>
+</span><span id="__span-0-1411"><a id="__codelineno-0-1411" name="__codelineno-0-1411"></a><span class="sd">        - If any variable specified in `vars_order` is not present in the `vars` dictionary.</span>
+</span><span id="__span-0-1412"><a id="__codelineno-0-1412" name="__codelineno-0-1412"></a><span class="sd">        - This ensures that all variables intended for consumption are available for processing.</span>
+</span><span id="__span-0-1413"><a id="__codelineno-0-1413" name="__codelineno-0-1413"></a>
+</span><span id="__span-0-1414"><a id="__codelineno-0-1414" name="__codelineno-0-1414"></a><span class="sd">    **Usage Example**:</span>
+</span><span id="__span-0-1415"><a id="__codelineno-0-1415" name="__codelineno-0-1415"></a>
+</span><span id="__span-0-1416"><a id="__codelineno-0-1416" name="__codelineno-0-1416"></a><span class="sd">    ```python</span>
+</span><span id="__span-0-1417"><a id="__codelineno-0-1417" name="__codelineno-0-1417"></a><span class="sd">    # Assume `variables_signatures` is a dictionary of variable-specific SnipeSig instances</span>
+</span><span id="__span-0-1418"><a id="__codelineno-0-1418" name="__codelineno-0-1418"></a><span class="sd">    variables_signatures = {</span>
+</span><span id="__span-0-1419"><a id="__codelineno-0-1419" name="__codelineno-0-1419"></a><span class="sd">        &quot;GTDB&quot;: sig_GTDB,</span>
+</span><span id="__span-0-1420"><a id="__codelineno-0-1420" name="__codelineno-0-1420"></a><span class="sd">        &quot;VIRALDB&quot;: sig_VIRALDB,</span>
+</span><span id="__span-0-1421"><a id="__codelineno-0-1421" name="__codelineno-0-1421"></a><span class="sd">        &quot;contaminant_X&quot;: sig_contaminant_x</span>
+</span><span id="__span-0-1422"><a id="__codelineno-0-1422" name="__codelineno-0-1422"></a><span class="sd">    }</span>
+</span><span id="__span-0-1423"><a id="__codelineno-0-1423" name="__codelineno-0-1423"></a>
+</span><span id="__span-0-1424"><a id="__codelineno-0-1424" name="__codelineno-0-1424"></a><span class="sd">    # Define the order in which variables should be processed</span>
+</span><span id="__span-0-1425"><a id="__codelineno-0-1425" name="__codelineno-0-1425"></a><span class="sd">    processing_order = [&quot;GTDB&quot;, &quot;VIRALDB&quot;, &quot;contaminant_X&quot;]</span>
+</span><span id="__span-0-1426"><a id="__codelineno-0-1426" name="__codelineno-0-1426"></a>
+</span><span id="__span-0-1427"><a id="__codelineno-0-1427" name="__codelineno-0-1427"></a><span class="sd">    # Consume non-reference k-mers and retrieve statistics</span>
+</span><span id="__span-0-1428"><a id="__codelineno-0-1428" name="__codelineno-0-1428"></a><span class="sd">    nonref_stats = qc.nonref_consume_from_vars(vars=variables_signatures, vars_order=processing_order)</span>
+</span><span id="__span-0-1429"><a id="__codelineno-0-1429" name="__codelineno-0-1429"></a>
+</span><span id="__span-0-1430"><a id="__codelineno-0-1430" name="__codelineno-0-1430"></a><span class="sd">    print(nonref_stats)</span>
+</span><span id="__span-0-1431"><a id="__codelineno-0-1431" name="__codelineno-0-1431"></a><span class="sd">    # Output Example:</span>
+</span><span id="__span-0-1432"><a id="__codelineno-0-1432" name="__codelineno-0-1432"></a><span class="sd">    # {</span>
+</span><span id="__span-0-1433"><a id="__codelineno-0-1433" name="__codelineno-0-1433"></a><span class="sd">    #     &quot;GTDB non-genomic total k-mer abundance&quot;: 1500.0,</span>
+</span><span id="__span-0-1434"><a id="__codelineno-0-1434" name="__codelineno-0-1434"></a><span class="sd">    #     &quot;GTDB non-genomic coverage index&quot;: 0.2,</span>
+</span><span id="__span-0-1435"><a id="__codelineno-0-1435" name="__codelineno-0-1435"></a><span class="sd">    #     &quot;VIRALDB non-genomic total k-mer abundance&quot;: 3500.0,</span>
+</span><span id="__span-0-1436"><a id="__codelineno-0-1436" name="__codelineno-0-1436"></a><span class="sd">    #     &quot;VIRALDB non-genomic coverage index&quot;: 0.70,</span>
+</span><span id="__span-0-1437"><a id="__codelineno-0-1437" name="__codelineno-0-1437"></a><span class="sd">    #     &quot;contaminant_X non-genomic total k-mer abundance&quot;: 0.0,</span>
+</span><span id="__span-0-1438"><a id="__codelineno-0-1438" name="__codelineno-0-1438"></a><span class="sd">    #     &quot;contaminant_X non-genomic coverage index&quot;: 0.0,</span>
+</span><span id="__span-0-1439"><a id="__codelineno-0-1439" name="__codelineno-0-1439"></a><span class="sd">    #     &quot;non-var non-genomic total k-mer abundance&quot;: 100.0,</span>
+</span><span id="__span-0-1440"><a id="__codelineno-0-1440" name="__codelineno-0-1440"></a><span class="sd">    #     &quot;non-var non-genomic coverage index&quot;: 0.1</span>
+</span><span id="__span-0-1441"><a id="__codelineno-0-1441" name="__codelineno-0-1441"></a><span class="sd">    # }</span>
+</span><span id="__span-0-1442"><a id="__codelineno-0-1442" name="__codelineno-0-1442"></a><span class="sd">    ```</span>
+</span><span id="__span-0-1443"><a id="__codelineno-0-1443" name="__codelineno-0-1443"></a>
+</span><span id="__span-0-1444"><a id="__codelineno-0-1444" name="__codelineno-0-1444"></a><span class="sd">    **Notes**:</span>
+</span><span id="__span-0-1445"><a id="__codelineno-0-1445" name="__codelineno-0-1445"></a>
+</span><span id="__span-0-1446"><a id="__codelineno-0-1446" name="__codelineno-0-1446"></a><span class="sd">        - **Variable Processing Order**:  </span>
+</span><span id="__span-0-1447"><a id="__codelineno-0-1447" name="__codelineno-0-1447"></a><span class="sd">        The `vars_order` list determines the sequence in which variables are processed. This order is crucial</span>
+</span><span id="__span-0-1448"><a id="__codelineno-0-1448" name="__codelineno-0-1448"></a><span class="sd">        when there is potential overlap in k-mers between variables, as earlier variables in the list have </span>
+</span><span id="__span-0-1449"><a id="__codelineno-0-1449" name="__codelineno-0-1449"></a><span class="sd">        higher priority in consuming shared k-mers.</span>
+</span><span id="__span-0-1450"><a id="__codelineno-0-1450" name="__codelineno-0-1450"></a>
+</span><span id="__span-0-1451"><a id="__codelineno-0-1451" name="__codelineno-0-1451"></a><span class="sd">        - **Non-Reference K-mers Definition**:  </span>
+</span><span id="__span-0-1452"><a id="__codelineno-0-1452" name="__codelineno-0-1452"></a><span class="sd">        Non-reference k-mers are defined as those present in the sample signature but absent in the reference </span>
+</span><span id="__span-0-1453"><a id="__codelineno-0-1453" name="__codelineno-0-1453"></a><span class="sd">        signature. This method focuses on characterizing these unique k-mers relative to provided variables.</span>
+</span><span id="__span-0-1454"><a id="__codelineno-0-1454" name="__codelineno-0-1454"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1455"><a id="__codelineno-0-1455" name="__codelineno-0-1455"></a>
+</span><span id="__span-0-1456"><a id="__codelineno-0-1456" name="__codelineno-0-1456"></a>    <span class="c1"># check the all vars in vars_order are in vars</span>
+</span><span id="__span-0-1457"><a id="__codelineno-0-1457" name="__codelineno-0-1457"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">all</span><span class="p">([</span><span class="n">var</span> <span class="ow">in</span> <span class="nb">vars</span> <span class="k">for</span> <span class="n">var</span> <span class="ow">in</span> <span class="n">vars_order</span><span class="p">]):</span>
+</span><span id="__span-0-1458"><a id="__codelineno-0-1458" name="__codelineno-0-1458"></a>        <span class="c1"># report dict keys, and the vars order</span>
+</span><span id="__span-0-1459"><a id="__codelineno-0-1459" name="__codelineno-0-1459"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Provided vars_order: </span><span class="si">%s</span><span class="s2">, and vars keys: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">vars_order</span><span class="p">,</span> <span class="nb">list</span><span class="p">(</span><span class="nb">vars</span><span class="o">.</span><span class="n">keys</span><span class="p">()))</span>
+</span><span id="__span-0-1460"><a id="__codelineno-0-1460" name="__codelineno-0-1460"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;All variables in vars_order must be present in vars.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1461"><a id="__codelineno-0-1461" name="__codelineno-0-1461"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All variables in vars_order must be present in vars.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1462"><a id="__codelineno-0-1462" name="__codelineno-0-1462"></a>
+</span><span id="__span-0-1463"><a id="__codelineno-0-1463" name="__codelineno-0-1463"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Consuming non-reference k-mers from provided variables.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1464"><a id="__codelineno-0-1464" name="__codelineno-0-1464"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Current size of the sample signature: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="p">))</span>
+</span><span id="__span-0-1465"><a id="__codelineno-0-1465" name="__codelineno-0-1465"></a>
+</span><span id="__span-0-1466"><a id="__codelineno-0-1466" name="__codelineno-0-1466"></a>    <span class="n">sample_nonref</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span> <span class="o">-</span> <span class="bp">self</span><span class="o">.</span><span class="n">reference_sig</span>
+</span><span id="__span-0-1467"><a id="__codelineno-0-1467" name="__codelineno-0-1467"></a>
+</span><span id="__span-0-1468"><a id="__codelineno-0-1468" name="__codelineno-0-1468"></a>    <span class="n">sample_nonref</span><span class="o">.</span><span class="n">trim_singletons</span><span class="p">()</span>
+</span><span id="__span-0-1469"><a id="__codelineno-0-1469" name="__codelineno-0-1469"></a>
+</span><span id="__span-0-1470"><a id="__codelineno-0-1470" name="__codelineno-0-1470"></a>    <span class="n">sample_nonref_unique_hashes</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">)</span>
+</span><span id="__span-0-1471"><a id="__codelineno-0-1471" name="__codelineno-0-1471"></a>
+</span><span id="__span-0-1472"><a id="__codelineno-0-1472" name="__codelineno-0-1472"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Size of non-reference k-mers in the sample signature: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">))</span>
+</span><span id="__span-0-1473"><a id="__codelineno-0-1473" name="__codelineno-0-1473"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1474"><a id="__codelineno-0-1474" name="__codelineno-0-1474"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;No non-reference k-mers found in the sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1475"><a id="__codelineno-0-1475" name="__codelineno-0-1475"></a>        <span class="k">return</span> <span class="p">{}</span>
+</span><span id="__span-0-1476"><a id="__codelineno-0-1476" name="__codelineno-0-1476"></a>
+</span><span id="__span-0-1477"><a id="__codelineno-0-1477" name="__codelineno-0-1477"></a>    <span class="c1"># intersect and report coverage and depth, then subtract from sample_nonref so sum will be 100%</span>
+</span><span id="__span-0-1478"><a id="__codelineno-0-1478" name="__codelineno-0-1478"></a>    <span class="k">for</span> <span class="n">var_name</span> <span class="ow">in</span> <span class="n">vars_order</span><span class="p">:</span>
+</span><span id="__span-0-1479"><a id="__codelineno-0-1479" name="__codelineno-0-1479"></a>        <span class="n">sample_nonref_var</span><span class="p">:</span> <span class="n">SnipeSig</span> <span class="o">=</span> <span class="n">sample_nonref</span> <span class="o">&amp;</span> <span class="nb">vars</span><span class="p">[</span><span class="n">var_name</span><span class="p">]</span>
+</span><span id="__span-0-1480"><a id="__codelineno-0-1480" name="__codelineno-0-1480"></a>        <span class="n">sample_nonref_var_total_abundance</span> <span class="o">=</span> <span class="n">sample_nonref_var</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-1481"><a id="__codelineno-0-1481" name="__codelineno-0-1481"></a>        <span class="n">sample_nonref_var_unique_hashes</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref_var</span><span class="p">)</span>
+</span><span id="__span-0-1482"><a id="__codelineno-0-1482" name="__codelineno-0-1482"></a>        <span class="n">sample_nonref_var_coverage_index</span> <span class="o">=</span> <span class="n">sample_nonref_var_unique_hashes</span> <span class="o">/</span> <span class="n">sample_nonref_unique_hashes</span>
+</span><span id="__span-0-1483"><a id="__codelineno-0-1483" name="__codelineno-0-1483"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="o">.</span><span class="n">update</span><span class="p">({</span>
+</span><span id="__span-0-1484"><a id="__codelineno-0-1484" name="__codelineno-0-1484"></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2"> non-genomic total k-mer abundance&quot;</span><span class="p">:</span> <span class="n">sample_nonref_var_total_abundance</span><span class="p">,</span>
+</span><span id="__span-0-1485"><a id="__codelineno-0-1485" name="__codelineno-0-1485"></a>            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">var_name</span><span class="si">}</span><span class="s2"> non-genomic coverage index&quot;</span><span class="p">:</span> <span class="n">sample_nonref_var_coverage_index</span>
+</span><span id="__span-0-1486"><a id="__codelineno-0-1486" name="__codelineno-0-1486"></a>        <span class="p">})</span>
+</span><span id="__span-0-1487"><a id="__codelineno-0-1487" name="__codelineno-0-1487"></a>
+</span><span id="__span-0-1488"><a id="__codelineno-0-1488" name="__codelineno-0-1488"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Consuming non-reference k-mers from variable &#39;</span><span class="si">%s</span><span class="s2">&#39;.&quot;</span><span class="p">,</span> <span class="n">var_name</span><span class="p">)</span>
+</span><span id="__span-0-1489"><a id="__codelineno-0-1489" name="__codelineno-0-1489"></a>        <span class="n">sample_nonref</span> <span class="o">-=</span> <span class="n">sample_nonref_var</span>
+</span><span id="__span-0-1490"><a id="__codelineno-0-1490" name="__codelineno-0-1490"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;</span><span class="se">\t</span><span class="s2">-Size of remaining non-reference k-mers in the sample signature: </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">))</span>
+</span><span id="__span-0-1491"><a id="__codelineno-0-1491" name="__codelineno-0-1491"></a>
+</span><span id="__span-0-1492"><a id="__codelineno-0-1492" name="__codelineno-0-1492"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="p">[</span><span class="s2">&quot;non-var non-genomic total k-mer abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">sample_nonref</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-1493"><a id="__codelineno-0-1493" name="__codelineno-0-1493"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span><span class="p">[</span><span class="s2">&quot;non-var non-genomic coverage index&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">)</span> <span class="o">/</span> <span class="n">sample_nonref_unique_hashes</span> <span class="k">if</span> <span class="n">sample_nonref_unique_hashes</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="k">else</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1494"><a id="__codelineno-0-1494" name="__codelineno-0-1494"></a>
+</span><span id="__span-0-1495"><a id="__codelineno-0-1495" name="__codelineno-0-1495"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span>
+</span><span id="__span-0-1496"><a id="__codelineno-0-1496" name="__codelineno-0-1496"></a>        <span class="s2">&quot;After consuming all vars from the non reference k-mers, the size of the sample signature is: </span><span class="si">%d</span><span class="s2"> hashes, &quot;</span>
+</span><span id="__span-0-1497"><a id="__codelineno-0-1497" name="__codelineno-0-1497"></a>        <span class="s2">&quot;with total abundance of </span><span class="si">%s</span><span class="s2">.&quot;</span><span class="p">,</span> 
+</span><span id="__span-0-1498"><a id="__codelineno-0-1498" name="__codelineno-0-1498"></a>        <span class="nb">len</span><span class="p">(</span><span class="n">sample_nonref</span><span class="p">),</span> <span class="n">sample_nonref</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-1499"><a id="__codelineno-0-1499" name="__codelineno-0-1499"></a>    <span class="p">)</span>
+</span><span id="__span-0-1500"><a id="__codelineno-0-1500" name="__codelineno-0-1500"></a>
+</span><span id="__span-0-1501"><a id="__codelineno-0-1501" name="__codelineno-0-1501"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">vars_nonref_stats</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5002,299 +6987,299 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.predict_coverage" class="doc doc-head
 
             <details class="quote">
               <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-822">822</a></span>
-<span class="normal"><a href="#__codelineno-0-823">823</a></span>
-<span class="normal"><a href="#__codelineno-0-824">824</a></span>
-<span class="normal"><a href="#__codelineno-0-825">825</a></span>
-<span class="normal"><a href="#__codelineno-0-826">826</a></span>
-<span class="normal"><a href="#__codelineno-0-827">827</a></span>
-<span class="normal"><a href="#__codelineno-0-828">828</a></span>
-<span class="normal"><a href="#__codelineno-0-829">829</a></span>
-<span class="normal"><a href="#__codelineno-0-830">830</a></span>
-<span class="normal"><a href="#__codelineno-0-831">831</a></span>
-<span class="normal"><a href="#__codelineno-0-832">832</a></span>
-<span class="normal"><a href="#__codelineno-0-833">833</a></span>
-<span class="normal"><a href="#__codelineno-0-834">834</a></span>
-<span class="normal"><a href="#__codelineno-0-835">835</a></span>
-<span class="normal"><a href="#__codelineno-0-836">836</a></span>
-<span class="normal"><a href="#__codelineno-0-837">837</a></span>
-<span class="normal"><a href="#__codelineno-0-838">838</a></span>
-<span class="normal"><a href="#__codelineno-0-839">839</a></span>
-<span class="normal"><a href="#__codelineno-0-840">840</a></span>
-<span class="normal"><a href="#__codelineno-0-841">841</a></span>
-<span class="normal"><a href="#__codelineno-0-842">842</a></span>
-<span class="normal"><a href="#__codelineno-0-843">843</a></span>
-<span class="normal"><a href="#__codelineno-0-844">844</a></span>
-<span class="normal"><a href="#__codelineno-0-845">845</a></span>
-<span class="normal"><a href="#__codelineno-0-846">846</a></span>
-<span class="normal"><a href="#__codelineno-0-847">847</a></span>
-<span class="normal"><a href="#__codelineno-0-848">848</a></span>
-<span class="normal"><a href="#__codelineno-0-849">849</a></span>
-<span class="normal"><a href="#__codelineno-0-850">850</a></span>
-<span class="normal"><a href="#__codelineno-0-851">851</a></span>
-<span class="normal"><a href="#__codelineno-0-852">852</a></span>
-<span class="normal"><a href="#__codelineno-0-853">853</a></span>
-<span class="normal"><a href="#__codelineno-0-854">854</a></span>
-<span class="normal"><a href="#__codelineno-0-855">855</a></span>
-<span class="normal"><a href="#__codelineno-0-856">856</a></span>
-<span class="normal"><a href="#__codelineno-0-857">857</a></span>
-<span class="normal"><a href="#__codelineno-0-858">858</a></span>
-<span class="normal"><a href="#__codelineno-0-859">859</a></span>
-<span class="normal"><a href="#__codelineno-0-860">860</a></span>
-<span class="normal"><a href="#__codelineno-0-861">861</a></span>
-<span class="normal"><a href="#__codelineno-0-862">862</a></span>
-<span class="normal"><a href="#__codelineno-0-863">863</a></span>
-<span class="normal"><a href="#__codelineno-0-864">864</a></span>
-<span class="normal"><a href="#__codelineno-0-865">865</a></span>
-<span class="normal"><a href="#__codelineno-0-866">866</a></span>
-<span class="normal"><a href="#__codelineno-0-867">867</a></span>
-<span class="normal"><a href="#__codelineno-0-868">868</a></span>
-<span class="normal"><a href="#__codelineno-0-869">869</a></span>
-<span class="normal"><a href="#__codelineno-0-870">870</a></span>
-<span class="normal"><a href="#__codelineno-0-871">871</a></span>
-<span class="normal"><a href="#__codelineno-0-872">872</a></span>
-<span class="normal"><a href="#__codelineno-0-873">873</a></span>
-<span class="normal"><a href="#__codelineno-0-874">874</a></span>
-<span class="normal"><a href="#__codelineno-0-875">875</a></span>
-<span class="normal"><a href="#__codelineno-0-876">876</a></span>
-<span class="normal"><a href="#__codelineno-0-877">877</a></span>
-<span class="normal"><a href="#__codelineno-0-878">878</a></span>
-<span class="normal"><a href="#__codelineno-0-879">879</a></span>
-<span class="normal"><a href="#__codelineno-0-880">880</a></span>
-<span class="normal"><a href="#__codelineno-0-881">881</a></span>
-<span class="normal"><a href="#__codelineno-0-882">882</a></span>
-<span class="normal"><a href="#__codelineno-0-883">883</a></span>
-<span class="normal"><a href="#__codelineno-0-884">884</a></span>
-<span class="normal"><a href="#__codelineno-0-885">885</a></span>
-<span class="normal"><a href="#__codelineno-0-886">886</a></span>
-<span class="normal"><a href="#__codelineno-0-887">887</a></span>
-<span class="normal"><a href="#__codelineno-0-888">888</a></span>
-<span class="normal"><a href="#__codelineno-0-889">889</a></span>
-<span class="normal"><a href="#__codelineno-0-890">890</a></span>
-<span class="normal"><a href="#__codelineno-0-891">891</a></span>
-<span class="normal"><a href="#__codelineno-0-892">892</a></span>
-<span class="normal"><a href="#__codelineno-0-893">893</a></span>
-<span class="normal"><a href="#__codelineno-0-894">894</a></span>
-<span class="normal"><a href="#__codelineno-0-895">895</a></span>
-<span class="normal"><a href="#__codelineno-0-896">896</a></span>
-<span class="normal"><a href="#__codelineno-0-897">897</a></span>
-<span class="normal"><a href="#__codelineno-0-898">898</a></span>
-<span class="normal"><a href="#__codelineno-0-899">899</a></span>
-<span class="normal"><a href="#__codelineno-0-900">900</a></span>
-<span class="normal"><a href="#__codelineno-0-901">901</a></span>
-<span class="normal"><a href="#__codelineno-0-902">902</a></span>
-<span class="normal"><a href="#__codelineno-0-903">903</a></span>
-<span class="normal"><a href="#__codelineno-0-904">904</a></span>
-<span class="normal"><a href="#__codelineno-0-905">905</a></span>
-<span class="normal"><a href="#__codelineno-0-906">906</a></span>
-<span class="normal"><a href="#__codelineno-0-907">907</a></span>
-<span class="normal"><a href="#__codelineno-0-908">908</a></span>
-<span class="normal"><a href="#__codelineno-0-909">909</a></span>
-<span class="normal"><a href="#__codelineno-0-910">910</a></span>
-<span class="normal"><a href="#__codelineno-0-911">911</a></span>
-<span class="normal"><a href="#__codelineno-0-912">912</a></span>
-<span class="normal"><a href="#__codelineno-0-913">913</a></span>
-<span class="normal"><a href="#__codelineno-0-914">914</a></span>
-<span class="normal"><a href="#__codelineno-0-915">915</a></span>
-<span class="normal"><a href="#__codelineno-0-916">916</a></span>
-<span class="normal"><a href="#__codelineno-0-917">917</a></span>
-<span class="normal"><a href="#__codelineno-0-918">918</a></span>
-<span class="normal"><a href="#__codelineno-0-919">919</a></span>
-<span class="normal"><a href="#__codelineno-0-920">920</a></span>
-<span class="normal"><a href="#__codelineno-0-921">921</a></span>
-<span class="normal"><a href="#__codelineno-0-922">922</a></span>
-<span class="normal"><a href="#__codelineno-0-923">923</a></span>
-<span class="normal"><a href="#__codelineno-0-924">924</a></span>
-<span class="normal"><a href="#__codelineno-0-925">925</a></span>
-<span class="normal"><a href="#__codelineno-0-926">926</a></span>
-<span class="normal"><a href="#__codelineno-0-927">927</a></span>
-<span class="normal"><a href="#__codelineno-0-928">928</a></span>
-<span class="normal"><a href="#__codelineno-0-929">929</a></span>
-<span class="normal"><a href="#__codelineno-0-930">930</a></span>
-<span class="normal"><a href="#__codelineno-0-931">931</a></span>
-<span class="normal"><a href="#__codelineno-0-932">932</a></span>
-<span class="normal"><a href="#__codelineno-0-933">933</a></span>
-<span class="normal"><a href="#__codelineno-0-934">934</a></span>
-<span class="normal"><a href="#__codelineno-0-935">935</a></span>
-<span class="normal"><a href="#__codelineno-0-936">936</a></span>
-<span class="normal"><a href="#__codelineno-0-937">937</a></span>
-<span class="normal"><a href="#__codelineno-0-938">938</a></span>
-<span class="normal"><a href="#__codelineno-0-939">939</a></span>
-<span class="normal"><a href="#__codelineno-0-940">940</a></span>
-<span class="normal"><a href="#__codelineno-0-941">941</a></span>
-<span class="normal"><a href="#__codelineno-0-942">942</a></span>
-<span class="normal"><a href="#__codelineno-0-943">943</a></span>
-<span class="normal"><a href="#__codelineno-0-944">944</a></span>
-<span class="normal"><a href="#__codelineno-0-945">945</a></span>
-<span class="normal"><a href="#__codelineno-0-946">946</a></span>
-<span class="normal"><a href="#__codelineno-0-947">947</a></span>
-<span class="normal"><a href="#__codelineno-0-948">948</a></span>
-<span class="normal"><a href="#__codelineno-0-949">949</a></span>
-<span class="normal"><a href="#__codelineno-0-950">950</a></span>
-<span class="normal"><a href="#__codelineno-0-951">951</a></span>
-<span class="normal"><a href="#__codelineno-0-952">952</a></span>
-<span class="normal"><a href="#__codelineno-0-953">953</a></span>
-<span class="normal"><a href="#__codelineno-0-954">954</a></span>
-<span class="normal"><a href="#__codelineno-0-955">955</a></span>
-<span class="normal"><a href="#__codelineno-0-956">956</a></span>
-<span class="normal"><a href="#__codelineno-0-957">957</a></span>
-<span class="normal"><a href="#__codelineno-0-958">958</a></span>
-<span class="normal"><a href="#__codelineno-0-959">959</a></span>
-<span class="normal"><a href="#__codelineno-0-960">960</a></span>
-<span class="normal"><a href="#__codelineno-0-961">961</a></span>
-<span class="normal"><a href="#__codelineno-0-962">962</a></span>
-<span class="normal"><a href="#__codelineno-0-963">963</a></span>
-<span class="normal"><a href="#__codelineno-0-964">964</a></span>
-<span class="normal"><a href="#__codelineno-0-965">965</a></span>
-<span class="normal"><a href="#__codelineno-0-966">966</a></span>
-<span class="normal"><a href="#__codelineno-0-967">967</a></span>
-<span class="normal"><a href="#__codelineno-0-968">968</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a><span class="k">def</span> <span class="nf">predict_coverage</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">30</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a><span class="sd">    Predict the coverage index if additional sequencing is performed.</span>
-</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a>
-</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a><span class="sd">    This method estimates the potential increase in the genome coverage index when the sequencing depth</span>
-</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a><span class="sd">    is increased by a specified fold (extra sequencing). It does so by:</span>
-</span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a>
-</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a><span class="sd">    1. **Cumulative Coverage Calculation**:</span>
-</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a><span class="sd">    - Splitting the sample signature into `n` random parts to simulate incremental sequencing data.</span>
-</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a><span class="sd">    - Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.</span>
-</span><span id="__span-0-832"><a id="__codelineno-0-832" name="__codelineno-0-832"></a>
-</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a><span class="sd">    2. **Saturation Curve Fitting**:</span>
-</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a><span class="sd">    - Modeling the relationship between cumulative coverage and cumulative sequencing depth using</span>
-</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a><span class="sd">        a hyperbolic saturation function.</span>
-</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a><span class="sd">    - The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.</span>
-</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a>
-</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a><span class="sd">    3. **Coverage Prediction**:</span>
-</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a><span class="sd">    - Using the fitted model to predict the coverage index at an increased sequencing depth (current depth</span>
-</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a><span class="sd">        multiplied by `1 + extra_fold`).</span>
-</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>
-</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a>
-</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a><span class="sd">    - **Saturation Model**:</span>
-</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a><span class="sd">    The coverage index \( C \) as a function of sequencing depth \( D \) is modeled using the function:</span>
-</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a>
-</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a><span class="sd">    $$</span>
-</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a><span class="sd">    C(D) = \frac{a \cdot D}{b + D}</span>
-</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a><span class="sd">    $$</span>
-</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>
-</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a><span class="sd">    Where:</span>
-</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a><span class="sd">    - \( a \) and \( b \) are parameters estimated from the data.</span>
-</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a><span class="sd">    - \( D \) is the cumulative sequencing depth (total abundance).</span>
-</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a><span class="sd">    - \( C(D) \) is the cumulative coverage index at depth \( D \).</span>
-</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a>
-</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a><span class="sd">    - **Parameter Estimation**:</span>
-</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a><span class="sd">    The parameters \( a \) and \( b \) are determined by fitting the model to the observed cumulative</span>
-</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a><span class="sd">    coverage and depth data using non-linear least squares optimization.</span>
-</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a>
-</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a><span class="sd">    - **Coverage Prediction**:</span>
-</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a><span class="sd">    The predicted coverage index \( C_{\text{pred}} \) at an increased sequencing depth \( D_{\text{pred}} \)</span>
-</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a><span class="sd">    is calculated as:</span>
-</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>
-</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a><span class="sd">    $$</span>
-</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a><span class="sd">    D_{\text{pred}} = D_{\text{current}} \times (1 + \text{extra\_fold})</span>
-</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a><span class="sd">    $$</span>
-</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>
-</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a><span class="sd">    $$</span>
-</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a><span class="sd">    C_{\text{pred}} = \frac{a \cdot D_{\text{pred}}}{b + D_{\text{pred}}}</span>
-</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a><span class="sd">    $$</span>
-</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>
-</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>
-</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a><span class="sd">    - `extra_fold` (*float*):  </span>
-</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a><span class="sd">      The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling</span>
-</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a><span class="sd">      the current sequencing depth.</span>
-</span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>
-</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a><span class="sd">    - `n` (*int, optional*):  </span>
-</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a><span class="sd">      The number of parts to split the sample signature into for modeling the saturation curve.</span>
-</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a><span class="sd">      Default is 30.</span>
-</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>
-</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a><span class="sd">        - `float`:  </span>
-</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a><span class="sd">          The predicted genome coverage index at the increased sequencing depth.</span>
-</span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a>
-</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a><span class="sd">        - `RuntimeError`:  </span>
-</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a><span class="sd">          If the saturation model fails to converge during curve fitting.</span>
-</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a>
-</span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a><span class="sd">    **Usage Example**:</span>
-</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a>
-</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a><span class="sd">    ```python</span>
-</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a><span class="sd">    # Create a ReferenceQC instance with sample and reference signatures</span>
-</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a><span class="sd">    qc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)</span>
-</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a>
-</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a><span class="sd">    # Predict coverage index after increasing sequencing depth by 50%</span>
-</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a><span class="sd">    predicted_coverage = qc.predict_coverage(extra_fold=0.5)</span>
-</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a>
-</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a><span class="sd">    print(f&quot;Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}&quot;)</span>
-</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a><span class="sd">    ```</span>
-</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a>
-</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a><span class="sd">    **Implementation Details**:</span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-884"> 884</a></span>
+<span class="normal"><a href="#__codelineno-0-885"> 885</a></span>
+<span class="normal"><a href="#__codelineno-0-886"> 886</a></span>
+<span class="normal"><a href="#__codelineno-0-887"> 887</a></span>
+<span class="normal"><a href="#__codelineno-0-888"> 888</a></span>
+<span class="normal"><a href="#__codelineno-0-889"> 889</a></span>
+<span class="normal"><a href="#__codelineno-0-890"> 890</a></span>
+<span class="normal"><a href="#__codelineno-0-891"> 891</a></span>
+<span class="normal"><a href="#__codelineno-0-892"> 892</a></span>
+<span class="normal"><a href="#__codelineno-0-893"> 893</a></span>
+<span class="normal"><a href="#__codelineno-0-894"> 894</a></span>
+<span class="normal"><a href="#__codelineno-0-895"> 895</a></span>
+<span class="normal"><a href="#__codelineno-0-896"> 896</a></span>
+<span class="normal"><a href="#__codelineno-0-897"> 897</a></span>
+<span class="normal"><a href="#__codelineno-0-898"> 898</a></span>
+<span class="normal"><a href="#__codelineno-0-899"> 899</a></span>
+<span class="normal"><a href="#__codelineno-0-900"> 900</a></span>
+<span class="normal"><a href="#__codelineno-0-901"> 901</a></span>
+<span class="normal"><a href="#__codelineno-0-902"> 902</a></span>
+<span class="normal"><a href="#__codelineno-0-903"> 903</a></span>
+<span class="normal"><a href="#__codelineno-0-904"> 904</a></span>
+<span class="normal"><a href="#__codelineno-0-905"> 905</a></span>
+<span class="normal"><a href="#__codelineno-0-906"> 906</a></span>
+<span class="normal"><a href="#__codelineno-0-907"> 907</a></span>
+<span class="normal"><a href="#__codelineno-0-908"> 908</a></span>
+<span class="normal"><a href="#__codelineno-0-909"> 909</a></span>
+<span class="normal"><a href="#__codelineno-0-910"> 910</a></span>
+<span class="normal"><a href="#__codelineno-0-911"> 911</a></span>
+<span class="normal"><a href="#__codelineno-0-912"> 912</a></span>
+<span class="normal"><a href="#__codelineno-0-913"> 913</a></span>
+<span class="normal"><a href="#__codelineno-0-914"> 914</a></span>
+<span class="normal"><a href="#__codelineno-0-915"> 915</a></span>
+<span class="normal"><a href="#__codelineno-0-916"> 916</a></span>
+<span class="normal"><a href="#__codelineno-0-917"> 917</a></span>
+<span class="normal"><a href="#__codelineno-0-918"> 918</a></span>
+<span class="normal"><a href="#__codelineno-0-919"> 919</a></span>
+<span class="normal"><a href="#__codelineno-0-920"> 920</a></span>
+<span class="normal"><a href="#__codelineno-0-921"> 921</a></span>
+<span class="normal"><a href="#__codelineno-0-922"> 922</a></span>
+<span class="normal"><a href="#__codelineno-0-923"> 923</a></span>
+<span class="normal"><a href="#__codelineno-0-924"> 924</a></span>
+<span class="normal"><a href="#__codelineno-0-925"> 925</a></span>
+<span class="normal"><a href="#__codelineno-0-926"> 926</a></span>
+<span class="normal"><a href="#__codelineno-0-927"> 927</a></span>
+<span class="normal"><a href="#__codelineno-0-928"> 928</a></span>
+<span class="normal"><a href="#__codelineno-0-929"> 929</a></span>
+<span class="normal"><a href="#__codelineno-0-930"> 930</a></span>
+<span class="normal"><a href="#__codelineno-0-931"> 931</a></span>
+<span class="normal"><a href="#__codelineno-0-932"> 932</a></span>
+<span class="normal"><a href="#__codelineno-0-933"> 933</a></span>
+<span class="normal"><a href="#__codelineno-0-934"> 934</a></span>
+<span class="normal"><a href="#__codelineno-0-935"> 935</a></span>
+<span class="normal"><a href="#__codelineno-0-936"> 936</a></span>
+<span class="normal"><a href="#__codelineno-0-937"> 937</a></span>
+<span class="normal"><a href="#__codelineno-0-938"> 938</a></span>
+<span class="normal"><a href="#__codelineno-0-939"> 939</a></span>
+<span class="normal"><a href="#__codelineno-0-940"> 940</a></span>
+<span class="normal"><a href="#__codelineno-0-941"> 941</a></span>
+<span class="normal"><a href="#__codelineno-0-942"> 942</a></span>
+<span class="normal"><a href="#__codelineno-0-943"> 943</a></span>
+<span class="normal"><a href="#__codelineno-0-944"> 944</a></span>
+<span class="normal"><a href="#__codelineno-0-945"> 945</a></span>
+<span class="normal"><a href="#__codelineno-0-946"> 946</a></span>
+<span class="normal"><a href="#__codelineno-0-947"> 947</a></span>
+<span class="normal"><a href="#__codelineno-0-948"> 948</a></span>
+<span class="normal"><a href="#__codelineno-0-949"> 949</a></span>
+<span class="normal"><a href="#__codelineno-0-950"> 950</a></span>
+<span class="normal"><a href="#__codelineno-0-951"> 951</a></span>
+<span class="normal"><a href="#__codelineno-0-952"> 952</a></span>
+<span class="normal"><a href="#__codelineno-0-953"> 953</a></span>
+<span class="normal"><a href="#__codelineno-0-954"> 954</a></span>
+<span class="normal"><a href="#__codelineno-0-955"> 955</a></span>
+<span class="normal"><a href="#__codelineno-0-956"> 956</a></span>
+<span class="normal"><a href="#__codelineno-0-957"> 957</a></span>
+<span class="normal"><a href="#__codelineno-0-958"> 958</a></span>
+<span class="normal"><a href="#__codelineno-0-959"> 959</a></span>
+<span class="normal"><a href="#__codelineno-0-960"> 960</a></span>
+<span class="normal"><a href="#__codelineno-0-961"> 961</a></span>
+<span class="normal"><a href="#__codelineno-0-962"> 962</a></span>
+<span class="normal"><a href="#__codelineno-0-963"> 963</a></span>
+<span class="normal"><a href="#__codelineno-0-964"> 964</a></span>
+<span class="normal"><a href="#__codelineno-0-965"> 965</a></span>
+<span class="normal"><a href="#__codelineno-0-966"> 966</a></span>
+<span class="normal"><a href="#__codelineno-0-967"> 967</a></span>
+<span class="normal"><a href="#__codelineno-0-968"> 968</a></span>
+<span class="normal"><a href="#__codelineno-0-969"> 969</a></span>
+<span class="normal"><a href="#__codelineno-0-970"> 970</a></span>
+<span class="normal"><a href="#__codelineno-0-971"> 971</a></span>
+<span class="normal"><a href="#__codelineno-0-972"> 972</a></span>
+<span class="normal"><a href="#__codelineno-0-973"> 973</a></span>
+<span class="normal"><a href="#__codelineno-0-974"> 974</a></span>
+<span class="normal"><a href="#__codelineno-0-975"> 975</a></span>
+<span class="normal"><a href="#__codelineno-0-976"> 976</a></span>
+<span class="normal"><a href="#__codelineno-0-977"> 977</a></span>
+<span class="normal"><a href="#__codelineno-0-978"> 978</a></span>
+<span class="normal"><a href="#__codelineno-0-979"> 979</a></span>
+<span class="normal"><a href="#__codelineno-0-980"> 980</a></span>
+<span class="normal"><a href="#__codelineno-0-981"> 981</a></span>
+<span class="normal"><a href="#__codelineno-0-982"> 982</a></span>
+<span class="normal"><a href="#__codelineno-0-983"> 983</a></span>
+<span class="normal"><a href="#__codelineno-0-984"> 984</a></span>
+<span class="normal"><a href="#__codelineno-0-985"> 985</a></span>
+<span class="normal"><a href="#__codelineno-0-986"> 986</a></span>
+<span class="normal"><a href="#__codelineno-0-987"> 987</a></span>
+<span class="normal"><a href="#__codelineno-0-988"> 988</a></span>
+<span class="normal"><a href="#__codelineno-0-989"> 989</a></span>
+<span class="normal"><a href="#__codelineno-0-990"> 990</a></span>
+<span class="normal"><a href="#__codelineno-0-991"> 991</a></span>
+<span class="normal"><a href="#__codelineno-0-992"> 992</a></span>
+<span class="normal"><a href="#__codelineno-0-993"> 993</a></span>
+<span class="normal"><a href="#__codelineno-0-994"> 994</a></span>
+<span class="normal"><a href="#__codelineno-0-995"> 995</a></span>
+<span class="normal"><a href="#__codelineno-0-996"> 996</a></span>
+<span class="normal"><a href="#__codelineno-0-997"> 997</a></span>
+<span class="normal"><a href="#__codelineno-0-998"> 998</a></span>
+<span class="normal"><a href="#__codelineno-0-999"> 999</a></span>
+<span class="normal"><a href="#__codelineno-0-1000">1000</a></span>
+<span class="normal"><a href="#__codelineno-0-1001">1001</a></span>
+<span class="normal"><a href="#__codelineno-0-1002">1002</a></span>
+<span class="normal"><a href="#__codelineno-0-1003">1003</a></span>
+<span class="normal"><a href="#__codelineno-0-1004">1004</a></span>
+<span class="normal"><a href="#__codelineno-0-1005">1005</a></span>
+<span class="normal"><a href="#__codelineno-0-1006">1006</a></span>
+<span class="normal"><a href="#__codelineno-0-1007">1007</a></span>
+<span class="normal"><a href="#__codelineno-0-1008">1008</a></span>
+<span class="normal"><a href="#__codelineno-0-1009">1009</a></span>
+<span class="normal"><a href="#__codelineno-0-1010">1010</a></span>
+<span class="normal"><a href="#__codelineno-0-1011">1011</a></span>
+<span class="normal"><a href="#__codelineno-0-1012">1012</a></span>
+<span class="normal"><a href="#__codelineno-0-1013">1013</a></span>
+<span class="normal"><a href="#__codelineno-0-1014">1014</a></span>
+<span class="normal"><a href="#__codelineno-0-1015">1015</a></span>
+<span class="normal"><a href="#__codelineno-0-1016">1016</a></span>
+<span class="normal"><a href="#__codelineno-0-1017">1017</a></span>
+<span class="normal"><a href="#__codelineno-0-1018">1018</a></span>
+<span class="normal"><a href="#__codelineno-0-1019">1019</a></span>
+<span class="normal"><a href="#__codelineno-0-1020">1020</a></span>
+<span class="normal"><a href="#__codelineno-0-1021">1021</a></span>
+<span class="normal"><a href="#__codelineno-0-1022">1022</a></span>
+<span class="normal"><a href="#__codelineno-0-1023">1023</a></span>
+<span class="normal"><a href="#__codelineno-0-1024">1024</a></span>
+<span class="normal"><a href="#__codelineno-0-1025">1025</a></span>
+<span class="normal"><a href="#__codelineno-0-1026">1026</a></span>
+<span class="normal"><a href="#__codelineno-0-1027">1027</a></span>
+<span class="normal"><a href="#__codelineno-0-1028">1028</a></span>
+<span class="normal"><a href="#__codelineno-0-1029">1029</a></span>
+<span class="normal"><a href="#__codelineno-0-1030">1030</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a><span class="k">def</span> <span class="nf">predict_coverage</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">:</span> <span class="nb">float</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">30</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a><span class="sd">    Predict the coverage index if additional sequencing is performed.</span>
+</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a>
+</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a><span class="sd">    This method estimates the potential increase in the genome coverage index when the sequencing depth</span>
+</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a><span class="sd">    is increased by a specified fold (extra sequencing). It does so by:</span>
+</span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a>
+</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a><span class="sd">    1. **Cumulative Coverage Calculation**:</span>
+</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a><span class="sd">    - Splitting the sample signature into `n` random parts to simulate incremental sequencing data.</span>
+</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a><span class="sd">    - Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.</span>
+</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a>
+</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a><span class="sd">    2. **Saturation Curve Fitting**:</span>
+</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a><span class="sd">    - Modeling the relationship between cumulative coverage and cumulative sequencing depth using</span>
+</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a><span class="sd">        a hyperbolic saturation function.</span>
+</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a><span class="sd">    - The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.</span>
+</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a>
+</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a><span class="sd">    3. **Coverage Prediction**:</span>
+</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a><span class="sd">    - Using the fitted model to predict the coverage index at an increased sequencing depth (current depth</span>
+</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a><span class="sd">        multiplied by `1 + extra_fold`).</span>
 </span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a>
-</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a><span class="sd">    - **Splitting the Sample Signature**:</span>
-</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a><span class="sd">        - The sample signature is split into `n` random parts using a multinomial distribution based on k-mer abundances.</span>
-</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a><span class="sd">        - Each part represents an incremental addition of sequencing data.</span>
-</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>
-</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a><span class="sd">    - **Cumulative Calculations**:</span>
-</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a><span class="sd">        - At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.</span>
-</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>
-</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a><span class="sd">    - **Curve Fitting**:</span>
-</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a><span class="sd">        - The `scipy.optimize.curve_fit` function is used to fit the saturation model to the cumulative data.</span>
-</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a><span class="sd">        - Initial parameter guesses are based on the observed data to aid convergence.</span>
-</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>    <span class="k">if</span> <span class="n">extra_fold</span> <span class="o">&lt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;extra_fold must be &gt;= 1.0.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a><span class="sd">    **Mathematical Explanation**:</span>
+</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a>
+</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a><span class="sd">    - **Saturation Model**:</span>
+</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a><span class="sd">    The coverage index \( C \) as a function of sequencing depth \( D \) is modeled using the function:</span>
+</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a>
+</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a><span class="sd">    $$</span>
+</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a><span class="sd">    C(D) = \frac{a \cdot D}{b + D}</span>
+</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a><span class="sd">    $$</span>
+</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a>
+</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a><span class="sd">    Where:</span>
+</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a><span class="sd">    - \( a \) and \( b \) are parameters estimated from the data.</span>
+</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a><span class="sd">    - \( D \) is the cumulative sequencing depth (total abundance).</span>
+</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a><span class="sd">    - \( C(D) \) is the cumulative coverage index at depth \( D \).</span>
 </span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>
-</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>    <span class="k">if</span> <span class="n">n</span> <span class="o">&lt;</span> <span class="mi">1</span> <span class="ow">or</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="nb">int</span><span class="p">):</span>
-</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;n must be a positive integer.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>
-</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicting coverage with extra fold: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">)</span>
-</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>    <span class="n">coverage_depth_data</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">calculate_coverage_vs_depth</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>
-</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>    <span class="c1"># Extract cumulative total abundance and coverage index</span>
-</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>    <span class="n">x_data</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">coverage_depth_data</span><span class="p">])</span>
-</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>    <span class="n">y_data</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">coverage_depth_data</span><span class="p">])</span>
-</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>
-</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>    <span class="c1"># Saturation model function</span>
-</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>    <span class="k">def</span> <span class="nf">saturation_model</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">):</span>
-</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>        <span class="k">return</span> <span class="n">a</span> <span class="o">*</span> <span class="n">x</span> <span class="o">/</span> <span class="p">(</span><span class="n">b</span> <span class="o">+</span> <span class="n">x</span><span class="p">)</span>
-</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>
-</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>    <span class="c1"># Initial parameter guesses</span>
-</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>    <span class="n">initial_guess</span> <span class="o">=</span> <span class="p">[</span><span class="n">y_data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span> <span class="n">x_data</span><span class="p">[</span><span class="nb">int</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">x_data</span><span class="p">)</span> <span class="o">/</span> <span class="mi">2</span><span class="p">)]]</span>
-</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>
-</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>    <span class="c1"># Fit the model to the data</span>
-</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>    <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>        <span class="k">with</span> <span class="n">warnings</span><span class="o">.</span><span class="n">catch_warnings</span><span class="p">():</span>
-</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>            <span class="n">warnings</span><span class="o">.</span><span class="n">simplefilter</span><span class="p">(</span><span class="s2">&quot;error&quot;</span><span class="p">,</span> <span class="n">OptimizeWarning</span><span class="p">)</span>
-</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>            <span class="n">params</span><span class="p">,</span> <span class="n">covariance</span> <span class="o">=</span> <span class="n">curve_fit</span><span class="p">(</span>
-</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>                <span class="n">saturation_model</span><span class="p">,</span>
-</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>                <span class="n">x_data</span><span class="p">,</span>
-</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>                <span class="n">y_data</span><span class="p">,</span>
-</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>                <span class="n">p0</span><span class="o">=</span><span class="n">initial_guess</span><span class="p">,</span>
-</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>                <span class="n">bounds</span><span class="o">=</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">inf</span><span class="p">),</span>
-</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>                <span class="n">maxfev</span><span class="o">=</span><span class="mi">10000</span>
-</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>            <span class="p">)</span>
-</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>    <span class="k">except</span> <span class="p">(</span><span class="ne">RuntimeError</span><span class="p">,</span> <span class="n">OptimizeWarning</span><span class="p">)</span> <span class="k">as</span> <span class="n">exc</span><span class="p">:</span>
-</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Curve fitting failed.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Saturation model fitting failed. Cannot predict coverage.&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">exc</span>
-</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>
-</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>    <span class="c1"># Check if covariance contains inf or nan</span>
-</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>    <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">isinf</span><span class="p">(</span><span class="n">covariance</span><span class="p">)</span><span class="o">.</span><span class="n">any</span><span class="p">()</span> <span class="ow">or</span> <span class="n">np</span><span class="o">.</span><span class="n">isnan</span><span class="p">(</span><span class="n">covariance</span><span class="p">)</span><span class="o">.</span><span class="n">any</span><span class="p">():</span>
-</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Covariance of parameters could not be estimated.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Saturation model fitting failed. Cannot predict coverage.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>
-</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>    <span class="n">a</span><span class="p">,</span> <span class="n">b</span> <span class="o">=</span> <span class="n">params</span>
+</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a><span class="sd">    - **Parameter Estimation**:</span>
+</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a><span class="sd">    The parameters \( a \) and \( b \) are determined by fitting the model to the observed cumulative</span>
+</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a><span class="sd">    coverage and depth data using non-linear least squares optimization.</span>
+</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>
+</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a><span class="sd">    - **Coverage Prediction**:</span>
+</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a><span class="sd">    The predicted coverage index \( C_{\text{pred}} \) at an increased sequencing depth \( D_{\text{pred}} \)</span>
+</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a><span class="sd">    is calculated as:</span>
+</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>
+</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a><span class="sd">    $$</span>
+</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a><span class="sd">    D_{\text{pred}} = D_{\text{current}} \times (1 + \text{extra\_fold})</span>
+</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a><span class="sd">    $$</span>
+</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>
+</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a><span class="sd">    $$</span>
+</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a><span class="sd">    C_{\text{pred}} = \frac{a \cdot D_{\text{pred}}}{b + D_{\text{pred}}}</span>
+</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a><span class="sd">    $$</span>
+</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>
+</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>
+</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a><span class="sd">    - `extra_fold` (*float*):  </span>
+</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a><span class="sd">      The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling</span>
+</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a><span class="sd">      the current sequencing depth.</span>
+</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>
+</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a><span class="sd">    - `n` (*int, optional*):  </span>
+</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a><span class="sd">      The number of parts to split the sample signature into for modeling the saturation curve.</span>
+</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a><span class="sd">      Default is 30.</span>
+</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>
+</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a><span class="sd">        - `float`:  </span>
+</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a><span class="sd">          The predicted genome coverage index at the increased sequencing depth.</span>
+</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>
+</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a><span class="sd">        - `RuntimeError`:  </span>
+</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a><span class="sd">          If the saturation model fails to converge during curve fitting.</span>
+</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>
+</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a><span class="sd">    **Usage Example**:</span>
+</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>
+</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a><span class="sd">    ```python</span>
+</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a><span class="sd">    # Create a ReferenceQC instance with sample and reference signatures</span>
+</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a><span class="sd">    qc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)</span>
 </span><span id="__span-0-957"><a id="__codelineno-0-957" name="__codelineno-0-957"></a>
-</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a>    <span class="c1"># Predict coverage at increased sequencing depth</span>
-</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a>    <span class="n">total_abundance</span> <span class="o">=</span> <span class="n">x_data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
-</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>    <span class="n">predicted_total_abundance</span> <span class="o">=</span> <span class="n">total_abundance</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">+</span> <span class="n">extra_fold</span><span class="p">)</span>
-</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a>    <span class="n">predicted_coverage</span> <span class="o">=</span> <span class="n">saturation_model</span><span class="p">(</span><span class="n">predicted_total_abundance</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">)</span>
-</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>
-</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>    <span class="c1"># Ensure the predicted coverage does not exceed maximum possible coverage</span>
-</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>    <span class="n">max_coverage</span> <span class="o">=</span> <span class="mf">1.0</span>  <span class="c1"># Coverage index cannot exceed 1</span>
-</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>    <span class="n">predicted_coverage</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">predicted_coverage</span><span class="p">,</span> <span class="n">max_coverage</span><span class="p">)</span>
-</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>
-</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicted coverage at </span><span class="si">%.2f</span><span class="s2">-fold increase: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">,</span> <span class="n">predicted_coverage</span><span class="p">)</span>
-</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>    <span class="k">return</span> <span class="n">predicted_coverage</span>
+</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a><span class="sd">    # Predict coverage index after increasing sequencing depth by 50%</span>
+</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a><span class="sd">    predicted_coverage = qc.predict_coverage(extra_fold=0.5)</span>
+</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>
+</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a><span class="sd">    print(f&quot;Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}&quot;)</span>
+</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a><span class="sd">    ```</span>
+</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>
+</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a><span class="sd">    **Implementation Details**:</span>
+</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>
+</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a><span class="sd">    - **Splitting the Sample Signature**:</span>
+</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a><span class="sd">        - The sample signature is split into `n` random parts using a multinomial distribution based on k-mer abundances.</span>
+</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a><span class="sd">        - Each part represents an incremental addition of sequencing data.</span>
+</span><span id="__span-0-969"><a id="__codelineno-0-969" name="__codelineno-0-969"></a>
+</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a><span class="sd">    - **Cumulative Calculations**:</span>
+</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a><span class="sd">        - At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.</span>
+</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a>
+</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a><span class="sd">    - **Curve Fitting**:</span>
+</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a><span class="sd">        - The `scipy.optimize.curve_fit` function is used to fit the saturation model to the cumulative data.</span>
+</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a><span class="sd">        - Initial parameter guesses are based on the observed data to aid convergence.</span>
+</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>    <span class="k">if</span> <span class="n">extra_fold</span> <span class="o">&lt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;extra_fold must be &gt;= 1.0.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>
+</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>    <span class="k">if</span> <span class="n">n</span> <span class="o">&lt;</span> <span class="mi">1</span> <span class="ow">or</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">n</span><span class="p">,</span> <span class="nb">int</span><span class="p">):</span>
+</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;n must be a positive integer.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>
+</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicting coverage with extra fold: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">)</span>
+</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>    <span class="n">coverage_depth_data</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">calculate_coverage_vs_depth</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>
+</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>    <span class="c1"># Extract cumulative total abundance and coverage index</span>
+</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>    <span class="n">x_data</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s2">&quot;cumulative_total_abundance&quot;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">coverage_depth_data</span><span class="p">])</span>
+</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>    <span class="n">y_data</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">d</span><span class="p">[</span><span class="s2">&quot;cumulative_coverage_index&quot;</span><span class="p">]</span> <span class="k">for</span> <span class="n">d</span> <span class="ow">in</span> <span class="n">coverage_depth_data</span><span class="p">])</span>
+</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>
+</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>    <span class="c1"># Saturation model function</span>
+</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a>    <span class="k">def</span> <span class="nf">saturation_model</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">):</span>
+</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a>        <span class="k">return</span> <span class="n">a</span> <span class="o">*</span> <span class="n">x</span> <span class="o">/</span> <span class="p">(</span><span class="n">b</span> <span class="o">+</span> <span class="n">x</span><span class="p">)</span>
+</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a>
+</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>    <span class="c1"># Initial parameter guesses</span>
+</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a>    <span class="n">initial_guess</span> <span class="o">=</span> <span class="p">[</span><span class="n">y_data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span> <span class="n">x_data</span><span class="p">[</span><span class="nb">int</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">x_data</span><span class="p">)</span> <span class="o">/</span> <span class="mi">2</span><span class="p">)]]</span>
+</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>
+</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a>    <span class="c1"># Fit the model to the data</span>
+</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a>        <span class="k">with</span> <span class="n">warnings</span><span class="o">.</span><span class="n">catch_warnings</span><span class="p">():</span>
+</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a>            <span class="n">warnings</span><span class="o">.</span><span class="n">simplefilter</span><span class="p">(</span><span class="s2">&quot;error&quot;</span><span class="p">,</span> <span class="n">OptimizeWarning</span><span class="p">)</span>
+</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>            <span class="n">params</span><span class="p">,</span> <span class="n">covariance</span> <span class="o">=</span> <span class="n">curve_fit</span><span class="p">(</span>
+</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a>                <span class="n">saturation_model</span><span class="p">,</span>
+</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a>                <span class="n">x_data</span><span class="p">,</span>
+</span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a>                <span class="n">y_data</span><span class="p">,</span>
+</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a>                <span class="n">p0</span><span class="o">=</span><span class="n">initial_guess</span><span class="p">,</span>
+</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>                <span class="n">bounds</span><span class="o">=</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">inf</span><span class="p">),</span>
+</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a>                <span class="n">maxfev</span><span class="o">=</span><span class="mi">10000</span>
+</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>            <span class="p">)</span>
+</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>    <span class="k">except</span> <span class="p">(</span><span class="ne">RuntimeError</span><span class="p">,</span> <span class="n">OptimizeWarning</span><span class="p">)</span> <span class="k">as</span> <span class="n">exc</span><span class="p">:</span>
+</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Curve fitting failed.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a>        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Saturation model fitting failed. Cannot predict coverage.&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">exc</span>
+</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>
+</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a>    <span class="c1"># Check if covariance contains inf or nan</span>
+</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a>    <span class="k">if</span> <span class="n">np</span><span class="o">.</span><span class="n">isinf</span><span class="p">(</span><span class="n">covariance</span><span class="p">)</span><span class="o">.</span><span class="n">any</span><span class="p">()</span> <span class="ow">or</span> <span class="n">np</span><span class="o">.</span><span class="n">isnan</span><span class="p">(</span><span class="n">covariance</span><span class="p">)</span><span class="o">.</span><span class="n">any</span><span class="p">():</span>
+</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Covariance of parameters could not be estimated.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Saturation model fitting failed. Cannot predict coverage.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>
+</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>    <span class="n">a</span><span class="p">,</span> <span class="n">b</span> <span class="o">=</span> <span class="n">params</span>
+</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>
+</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>    <span class="c1"># Predict coverage at increased sequencing depth</span>
+</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>    <span class="n">total_abundance</span> <span class="o">=</span> <span class="n">x_data</span><span class="p">[</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
+</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>    <span class="n">predicted_total_abundance</span> <span class="o">=</span> <span class="n">total_abundance</span> <span class="o">*</span> <span class="p">(</span><span class="mi">1</span> <span class="o">+</span> <span class="n">extra_fold</span><span class="p">)</span>
+</span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a>    <span class="n">predicted_coverage</span> <span class="o">=</span> <span class="n">saturation_model</span><span class="p">(</span><span class="n">predicted_total_abundance</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">b</span><span class="p">)</span>
+</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>
+</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>    <span class="c1"># Ensure the predicted coverage does not exceed maximum possible coverage</span>
+</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>    <span class="n">max_coverage</span> <span class="o">=</span> <span class="mf">1.0</span>  <span class="c1"># Coverage index cannot exceed 1</span>
+</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>    <span class="n">predicted_coverage</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">predicted_coverage</span><span class="p">,</span> <span class="n">max_coverage</span><span class="p">)</span>
+</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>
+</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Predicted coverage at </span><span class="si">%.2f</span><span class="s2">-fold increase: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">extra_fold</span><span class="p">,</span> <span class="n">predicted_coverage</span><span class="p">)</span>
+</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>    <span class="k">return</span> <span class="n">predicted_coverage</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5341,48 +7326,7 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.split_sig_randomly" class="doc doc-he
 
             <details class="quote">
               <summary>Source code in <code>src/snipe/api/reference_QC.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-612">612</a></span>
-<span class="normal"><a href="#__codelineno-0-613">613</a></span>
-<span class="normal"><a href="#__codelineno-0-614">614</a></span>
-<span class="normal"><a href="#__codelineno-0-615">615</a></span>
-<span class="normal"><a href="#__codelineno-0-616">616</a></span>
-<span class="normal"><a href="#__codelineno-0-617">617</a></span>
-<span class="normal"><a href="#__codelineno-0-618">618</a></span>
-<span class="normal"><a href="#__codelineno-0-619">619</a></span>
-<span class="normal"><a href="#__codelineno-0-620">620</a></span>
-<span class="normal"><a href="#__codelineno-0-621">621</a></span>
-<span class="normal"><a href="#__codelineno-0-622">622</a></span>
-<span class="normal"><a href="#__codelineno-0-623">623</a></span>
-<span class="normal"><a href="#__codelineno-0-624">624</a></span>
-<span class="normal"><a href="#__codelineno-0-625">625</a></span>
-<span class="normal"><a href="#__codelineno-0-626">626</a></span>
-<span class="normal"><a href="#__codelineno-0-627">627</a></span>
-<span class="normal"><a href="#__codelineno-0-628">628</a></span>
-<span class="normal"><a href="#__codelineno-0-629">629</a></span>
-<span class="normal"><a href="#__codelineno-0-630">630</a></span>
-<span class="normal"><a href="#__codelineno-0-631">631</a></span>
-<span class="normal"><a href="#__codelineno-0-632">632</a></span>
-<span class="normal"><a href="#__codelineno-0-633">633</a></span>
-<span class="normal"><a href="#__codelineno-0-634">634</a></span>
-<span class="normal"><a href="#__codelineno-0-635">635</a></span>
-<span class="normal"><a href="#__codelineno-0-636">636</a></span>
-<span class="normal"><a href="#__codelineno-0-637">637</a></span>
-<span class="normal"><a href="#__codelineno-0-638">638</a></span>
-<span class="normal"><a href="#__codelineno-0-639">639</a></span>
-<span class="normal"><a href="#__codelineno-0-640">640</a></span>
-<span class="normal"><a href="#__codelineno-0-641">641</a></span>
-<span class="normal"><a href="#__codelineno-0-642">642</a></span>
-<span class="normal"><a href="#__codelineno-0-643">643</a></span>
-<span class="normal"><a href="#__codelineno-0-644">644</a></span>
-<span class="normal"><a href="#__codelineno-0-645">645</a></span>
-<span class="normal"><a href="#__codelineno-0-646">646</a></span>
-<span class="normal"><a href="#__codelineno-0-647">647</a></span>
-<span class="normal"><a href="#__codelineno-0-648">648</a></span>
-<span class="normal"><a href="#__codelineno-0-649">649</a></span>
-<span class="normal"><a href="#__codelineno-0-650">650</a></span>
-<span class="normal"><a href="#__codelineno-0-651">651</a></span>
-<span class="normal"><a href="#__codelineno-0-652">652</a></span>
-<span class="normal"><a href="#__codelineno-0-653">653</a></span>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-653">653</a></span>
 <span class="normal"><a href="#__codelineno-0-654">654</a></span>
 <span class="normal"><a href="#__codelineno-0-655">655</a></span>
 <span class="normal"><a href="#__codelineno-0-656">656</a></span>
@@ -5394,60 +7338,127 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.split_sig_randomly" class="doc doc-he
 <span class="normal"><a href="#__codelineno-0-662">662</a></span>
 <span class="normal"><a href="#__codelineno-0-663">663</a></span>
 <span class="normal"><a href="#__codelineno-0-664">664</a></span>
-<span class="normal"><a href="#__codelineno-0-665">665</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a><span class="k">def</span> <span class="nf">split_sig_randomly</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]:</span>
-</span><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a><span class="sd">    Split the sample signature into `n` random parts based on abundances.</span>
-</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a>
-</span><span id="__span-0-616"><a id="__codelineno-0-616" name="__codelineno-0-616"></a><span class="sd">    This method distributes the k-mers of the sample signature into `n` parts using a multinomial distribution</span>
-</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a><span class="sd">    based on their abundances. Each k-mer&#39;s abundance is split across the `n` parts proportionally.</span>
-</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a>
-</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a>
-</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a><span class="sd">    For each k-mer with hash \( h \) and abundance \( a_h \), its abundance is distributed into \( n \) parts</span>
-</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a><span class="sd">    according to a multinomial distribution. Specifically, the abundance in each part \( i \) is given by:</span>
-</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a>
-</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a><span class="sd">    $$</span>
-</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a><span class="sd">    a_{h,i} \sim \text{Multinomial}(a_h, \frac{1}{n}, \frac{1}{n}, \dots, \frac{1}{n})</span>
-</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a><span class="sd">    $$</span>
-</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>
-</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a><span class="sd">    Where:</span>
-</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a><span class="sd">    - \( a_{h,i} \) is the abundance of k-mer \( h \) in part \( i \).</span>
-</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a><span class="sd">    - Each \( a_{h,i} \) is a non-negative integer such that \( \sum_{i=1}^{n} a_{h,i} = a_h \).</span>
-</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a>
-</span><span id="__span-0-632"><a id="__codelineno-0-632" name="__codelineno-0-632"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a>
-</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a><span class="sd">    - `n` (`int`): Number of parts to split into.</span>
-</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a>
-</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-637"><a id="__codelineno-0-637" name="__codelineno-0-637"></a>
-</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a><span class="sd">    - `List[SnipeSig]`:  </span>
-</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a><span class="sd">      List of `SnipeSig` instances representing the split parts.</span>
-</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a>
-</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a><span class="sd">    **Usage Example**:</span>
-</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a>
-</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a><span class="sd">    ```python</span>
-</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a><span class="sd">    split_sigs = qc.split_sig_randomly(n=3)</span>
-</span><span id="__span-0-645"><a id="__codelineno-0-645" name="__codelineno-0-645"></a><span class="sd">    for idx, sig in enumerate(split_sigs, 1):</span>
-</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a><span class="sd">        print(f&quot;Signature part {idx}: {sig}&quot;)</span>
-</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a><span class="sd">    ```</span>
-</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-649"><a id="__codelineno-0-649" name="__codelineno-0-649"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Splitting sample signature into </span><span class="si">%d</span><span class="s2"> random parts.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a>    <span class="c1"># Get k-mers and abundances</span>
-</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a>    <span class="n">hash_to_abund</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
-</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a>    <span class="n">random_split_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">distribute_kmers_random</span><span class="p">(</span><span class="n">hash_to_abund</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
-</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a>    <span class="n">split_sigs</span> <span class="o">=</span> <span class="p">[</span>
-</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a>        <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">kmer_dict</span><span class="o">.</span><span class="n">keys</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
-</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">kmer_dict</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
-</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">name</span><span class="si">}</span><span class="s2">_part_</span><span class="si">{</span><span class="n">i</span><span class="o">+</span><span class="mi">1</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a>            <span class="n">filename</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">filename</span><span class="p">,</span>
-</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
-</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a>        <span class="p">)</span>
-</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">kmer_dict</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">random_split_sigs</span><span class="p">)</span>
-</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a>    <span class="p">]</span>
-</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a>    <span class="k">return</span> <span class="n">split_sigs</span>
+<span class="normal"><a href="#__codelineno-0-665">665</a></span>
+<span class="normal"><a href="#__codelineno-0-666">666</a></span>
+<span class="normal"><a href="#__codelineno-0-667">667</a></span>
+<span class="normal"><a href="#__codelineno-0-668">668</a></span>
+<span class="normal"><a href="#__codelineno-0-669">669</a></span>
+<span class="normal"><a href="#__codelineno-0-670">670</a></span>
+<span class="normal"><a href="#__codelineno-0-671">671</a></span>
+<span class="normal"><a href="#__codelineno-0-672">672</a></span>
+<span class="normal"><a href="#__codelineno-0-673">673</a></span>
+<span class="normal"><a href="#__codelineno-0-674">674</a></span>
+<span class="normal"><a href="#__codelineno-0-675">675</a></span>
+<span class="normal"><a href="#__codelineno-0-676">676</a></span>
+<span class="normal"><a href="#__codelineno-0-677">677</a></span>
+<span class="normal"><a href="#__codelineno-0-678">678</a></span>
+<span class="normal"><a href="#__codelineno-0-679">679</a></span>
+<span class="normal"><a href="#__codelineno-0-680">680</a></span>
+<span class="normal"><a href="#__codelineno-0-681">681</a></span>
+<span class="normal"><a href="#__codelineno-0-682">682</a></span>
+<span class="normal"><a href="#__codelineno-0-683">683</a></span>
+<span class="normal"><a href="#__codelineno-0-684">684</a></span>
+<span class="normal"><a href="#__codelineno-0-685">685</a></span>
+<span class="normal"><a href="#__codelineno-0-686">686</a></span>
+<span class="normal"><a href="#__codelineno-0-687">687</a></span>
+<span class="normal"><a href="#__codelineno-0-688">688</a></span>
+<span class="normal"><a href="#__codelineno-0-689">689</a></span>
+<span class="normal"><a href="#__codelineno-0-690">690</a></span>
+<span class="normal"><a href="#__codelineno-0-691">691</a></span>
+<span class="normal"><a href="#__codelineno-0-692">692</a></span>
+<span class="normal"><a href="#__codelineno-0-693">693</a></span>
+<span class="normal"><a href="#__codelineno-0-694">694</a></span>
+<span class="normal"><a href="#__codelineno-0-695">695</a></span>
+<span class="normal"><a href="#__codelineno-0-696">696</a></span>
+<span class="normal"><a href="#__codelineno-0-697">697</a></span>
+<span class="normal"><a href="#__codelineno-0-698">698</a></span>
+<span class="normal"><a href="#__codelineno-0-699">699</a></span>
+<span class="normal"><a href="#__codelineno-0-700">700</a></span>
+<span class="normal"><a href="#__codelineno-0-701">701</a></span>
+<span class="normal"><a href="#__codelineno-0-702">702</a></span>
+<span class="normal"><a href="#__codelineno-0-703">703</a></span>
+<span class="normal"><a href="#__codelineno-0-704">704</a></span>
+<span class="normal"><a href="#__codelineno-0-705">705</a></span>
+<span class="normal"><a href="#__codelineno-0-706">706</a></span>
+<span class="normal"><a href="#__codelineno-0-707">707</a></span>
+<span class="normal"><a href="#__codelineno-0-708">708</a></span>
+<span class="normal"><a href="#__codelineno-0-709">709</a></span>
+<span class="normal"><a href="#__codelineno-0-710">710</a></span>
+<span class="normal"><a href="#__codelineno-0-711">711</a></span>
+<span class="normal"><a href="#__codelineno-0-712">712</a></span>
+<span class="normal"><a href="#__codelineno-0-713">713</a></span>
+<span class="normal"><a href="#__codelineno-0-714">714</a></span>
+<span class="normal"><a href="#__codelineno-0-715">715</a></span>
+<span class="normal"><a href="#__codelineno-0-716">716</a></span>
+<span class="normal"><a href="#__codelineno-0-717">717</a></span>
+<span class="normal"><a href="#__codelineno-0-718">718</a></span>
+<span class="normal"><a href="#__codelineno-0-719">719</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a><span class="k">def</span> <span class="nf">split_sig_randomly</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">List</span><span class="p">[</span><span class="n">SnipeSig</span><span class="p">]:</span>
+</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="sd">    Split the sample signature into `n` random parts based on abundances.</span>
+</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a>
+</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a><span class="sd">    This method distributes the k-mers of the sample signature into `n` parts using a multinomial distribution</span>
+</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a><span class="sd">    based on their abundances. Each k-mer&#39;s abundance is split across the `n` parts proportionally.</span>
+</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a>
+</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a><span class="sd">    **Mathematical Explanation**:</span>
+</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a>
+</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a><span class="sd">    For each k-mer with hash \( h \) and abundance \( a_h \), its abundance is distributed into \( n \) parts</span>
+</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a><span class="sd">    according to a multinomial distribution. Specifically, the abundance in each part \( i \) is given by:</span>
+</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a>
+</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a><span class="sd">    $$</span>
+</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a><span class="sd">    a_{h,i} \sim \text{Multinomial}(a_h, \frac{1}{n}, \frac{1}{n}, \dots, \frac{1}{n})</span>
+</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a><span class="sd">    $$</span>
+</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>
+</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a><span class="sd">    Where:</span>
+</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a><span class="sd">    - \( a_{h,i} \) is the abundance of k-mer \( h \) in part \( i \).</span>
+</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a><span class="sd">    - Each \( a_{h,i} \) is a non-negative integer such that \( \sum_{i=1}^{n} a_{h,i} = a_h \).</span>
+</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a>
+</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>
+</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a><span class="sd">    - `n` (`int`): Number of parts to split into.</span>
+</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>
+</span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>
+</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a><span class="sd">    - `List[SnipeSig]`:  </span>
+</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a><span class="sd">      List of `SnipeSig` instances representing the split parts.</span>
+</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>
+</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a><span class="sd">    **Usage Example**:</span>
+</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>
+</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a><span class="sd">    ```python</span>
+</span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a><span class="sd">    split_sigs = qc.split_sig_randomly(n=3)</span>
+</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a><span class="sd">    for idx, sig in enumerate(split_sigs, 1):</span>
+</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a><span class="sd">        print(f&quot;Signature part {idx}: {sig}&quot;)</span>
+</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a><span class="sd">    ```</span>
+</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Attempting to split sample signature into </span><span class="si">%d</span><span class="s2"> random parts.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a>
+</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>    <span class="c1"># Check if the split for this n is already cached</span>
+</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>    <span class="k">if</span> <span class="n">n</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_split_cache</span><span class="p">:</span>
+</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Using cached split signatures for n=</span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>        <span class="c1"># Return deep copies to prevent external modifications</span>
+</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a>        <span class="k">return</span> <span class="p">[</span><span class="n">sig</span><span class="o">.</span><span class="n">copy</span><span class="p">()</span> <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">_split_cache</span><span class="p">[</span><span class="n">n</span><span class="p">]]</span>
+</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a>
+</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No cached splits found for n=</span><span class="si">%d</span><span class="s2">. Proceeding to split.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a>    <span class="c1"># Get k-mers and abundances</span>
+</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a>    <span class="n">hash_to_abund</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
+</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a>    <span class="n">random_split_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">distribute_kmers_random</span><span class="p">(</span><span class="n">hash_to_abund</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a>    <span class="n">split_sigs</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>        <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">kmer_dict</span><span class="o">.</span><span class="n">keys</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
+</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">kmer_dict</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
+</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">name</span><span class="si">}</span><span class="s2">_part_</span><span class="si">{</span><span class="n">i</span><span class="o">+</span><span class="mi">1</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>            <span class="n">filename</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sample_sig</span><span class="o">.</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">enable_logging</span>
+</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>        <span class="p">)</span>
+</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a>        <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">kmer_dict</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">random_split_sigs</span><span class="p">)</span>
+</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a>    <span class="p">]</span>
+</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a>
+</span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a>    <span class="c1"># Cache the split signatures</span>
+</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_split_cache</span><span class="p">[</span><span class="n">n</span><span class="p">]</span> <span class="o">=</span> <span class="n">split_sigs</span>
+</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Cached split signatures for n=</span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">n</span><span class="p">)</span>
+</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a>
+</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>    <span class="k">return</span> <span class="n">split_sigs</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5492,7 +7503,7 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.split_sig_randomly" class="doc doc-he
     <span class="md-icon" title="Last update">
       <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M21 13.1c-.1 0-.3.1-.4.2l-1 1 2.1 2.1 1-1c.2-.2.2-.6 0-.8l-1.3-1.3c-.1-.1-.2-.2-.4-.2m-1.9 1.8-6.1 6V23h2.1l6.1-6.1zM12.5 7v5.2l4 2.4-1 1L11 13V7zM11 21.9c-5.1-.5-9-4.8-9-9.9C2 6.5 6.5 2 12 2c5.3 0 9.6 4.1 10 9.3-.3-.1-.6-.2-1-.2s-.7.1-1 .2C19.6 7.2 16.2 4 12 4c-4.4 0-8 3.6-8 8 0 4.1 3.1 7.5 7.1 7.9l-.1.2z"/></svg>
     </span>
-    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 13, 2024</span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
   </span>
 
     
@@ -5502,7 +7513,7 @@ <h3 id="snipe.api.reference_QC.ReferenceQC.split_sig_randomly" class="doc doc-he
     <span class="md-icon" title="Created">
       <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M14.47 15.08 11 13V7h1.5v5.25l3.08 1.83c-.41.28-.79.62-1.11 1m-1.39 4.84c-.36.05-.71.08-1.08.08-4.42 0-8-3.58-8-8s3.58-8 8-8 8 3.58 8 8c0 .37-.03.72-.08 1.08.69.1 1.33.32 1.92.64.1-.56.16-1.13.16-1.72 0-5.5-4.5-10-10-10S2 6.5 2 12s4.47 10 10 10c.59 0 1.16-.06 1.72-.16-.32-.59-.54-1.23-.64-1.92M18 15v3h-3v2h3v3h2v-3h3v-2h-3v-3z"/></svg>
     </span>
-    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 13, 2024</span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
   </span>
 
     
diff --git a/Sketch/index.html b/Sketch/index.html
new file mode 100644
index 0000000..8946c1c
--- /dev/null
+++ b/Sketch/index.html
@@ -0,0 +1,3574 @@
+
+<!doctype html>
+<html lang="en" class="no-js">
+  <head>
+    
+      <meta charset="utf-8">
+      <meta name="viewport" content="width=device-width,initial-scale=1">
+      
+        <meta name="description" content="Snipe, an ultrafast and memory-efficient alignment-free sequencing quality control tool.">
+      
+      
+        <meta name="author" content="Mohamed Abuelanin">
+      
+      
+        <link rel="canonical" href="https://snipe-bio.github.io/snipe/Sketch/">
+      
+      
+        <link rel="prev" href="../ReferenceQC/">
+      
+      
+        <link rel="next" href="../cli/">
+      
+      
+      <link rel="icon" href="../assets/images/favicon.png">
+      <meta name="generator" content="mkdocs-1.6.1, mkdocs-material-9.5.40">
+    
+    
+      
+        <title>Sketch - Snipe Documentation</title>
+      
+    
+    
+      <link rel="stylesheet" href="../assets/stylesheets/main.8c3ca2c6.min.css">
+      
+        
+        <link rel="stylesheet" href="../assets/stylesheets/palette.06af60db.min.css">
+      
+      
+
+
+    
+    
+      
+    
+    
+      
+        
+        
+        <link rel="preconnect" href="https://fonts.gstatic.com" crossorigin>
+        <link rel="stylesheet" href="https://fonts.googleapis.com/css?family=Open+Sans:300,300i,400,400i,700,700i%7CFira+Code:400,400i,700,700i&display=fallback">
+        <style>:root{--md-text-font:"Open Sans";--md-code-font:"Fira Code"}</style>
+      
+    
+    
+      <link rel="stylesheet" href="../assets/_mkdocstrings.css">
+    
+      <link rel="stylesheet" href="../stylesheets/extra.css">
+    
+    <script>__md_scope=new URL("..",location),__md_hash=e=>[...e].reduce(((e,_)=>(e<<5)-e+_.charCodeAt(0)),0),__md_get=(e,_=localStorage,t=__md_scope)=>JSON.parse(_.getItem(t.pathname+"."+e)),__md_set=(e,_,t=localStorage,a=__md_scope)=>{try{t.setItem(a.pathname+"."+e,JSON.stringify(_))}catch(e){}}</script>
+    
+      
+  
+
+
+  
+  
+
+<script id="__analytics">function __md_analytics(){function e(){dataLayer.push(arguments)}window.dataLayer=window.dataLayer||[],e("js",new Date),e("config","GTM-N5RW3TB3"),document.addEventListener("DOMContentLoaded",(function(){document.forms.search&&document.forms.search.query.addEventListener("blur",(function(){this.value&&e("event","search",{search_term:this.value})}));document$.subscribe((function(){var t=document.forms.feedback;if(void 0!==t)for(var a of t.querySelectorAll("[type=submit]"))a.addEventListener("click",(function(a){a.preventDefault();var n=document.location.pathname,d=this.getAttribute("data-md-value");e("event","feedback",{page:n,data:d}),t.firstElementChild.disabled=!0;var r=t.querySelector(".md-feedback__note [data-md-value='"+d+"']");r&&(r.hidden=!1)})),t.hidden=!1})),location$.subscribe((function(t){e("config","GTM-N5RW3TB3",{page_path:t.pathname})}))}));var t=document.createElement("script");t.async=!0,t.src="https://www.googletagmanager.com/gtag/js?id=GTM-N5RW3TB3",document.getElementById("__analytics").insertAdjacentElement("afterEnd",t)}</script>
+  
+    <script>"undefined"!=typeof __md_analytics&&__md_analytics()</script>
+  
+
+    
+    
+    
+  </head>
+  
+  
+    
+    
+      
+    
+    
+    
+    
+    <body dir="ltr" data-md-color-scheme="default" data-md-color-primary="deep-purple" data-md-color-accent="teal">
+  
+    
+    <input class="md-toggle" data-md-toggle="drawer" type="checkbox" id="__drawer" autocomplete="off">
+    <input class="md-toggle" data-md-toggle="search" type="checkbox" id="__search" autocomplete="off">
+    <label class="md-overlay" for="__drawer"></label>
+    <div data-md-component="skip">
+      
+        
+        <a href="#python-api-documentation" class="md-skip">
+          Skip to content
+        </a>
+      
+    </div>
+    <div data-md-component="announce">
+      
+    </div>
+    
+    
+      
+
+  
+
+<header class="md-header md-header--shadow md-header--lifted" data-md-component="header">
+  <nav class="md-header__inner md-grid" aria-label="Header">
+    <a href=".." title="Snipe Documentation" class="md-header__button md-logo" aria-label="Snipe Documentation" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    <label class="md-header__button md-icon" for="__drawer">
+      
+      <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M3 6h18v2H3zm0 5h18v2H3zm0 5h18v2H3z"/></svg>
+    </label>
+    <div class="md-header__title" data-md-component="header-title">
+      <div class="md-header__ellipsis">
+        <div class="md-header__topic">
+          <span class="md-ellipsis">
+            Snipe Documentation
+          </span>
+        </div>
+        <div class="md-header__topic" data-md-component="header-topic">
+          <span class="md-ellipsis">
+            
+              Sketch
+            
+          </span>
+        </div>
+      </div>
+    </div>
+    
+      
+        <form class="md-header__option" data-md-component="palette">
+  
+    
+    
+    
+    <input class="md-option" data-md-color-media="(prefers-color-scheme: light)" data-md-color-scheme="default" data-md-color-primary="deep-purple" data-md-color-accent="teal"  aria-label="Switch to dark mode"  type="radio" name="__palette" id="__palette_0">
+    
+      <label class="md-header__button md-icon" title="Switch to dark mode" for="__palette_1" hidden>
+        <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 7a5 5 0 0 1 5 5 5 5 0 0 1-5 5 5 5 0 0 1-5-5 5 5 0 0 1 5-5m0 2a3 3 0 0 0-3 3 3 3 0 0 0 3 3 3 3 0 0 0 3-3 3 3 0 0 0-3-3m0-7 2.39 3.42C13.65 5.15 12.84 5 12 5s-1.65.15-2.39.42zM3.34 7l4.16-.35A7.2 7.2 0 0 0 5.94 8.5c-.44.74-.69 1.5-.83 2.29zm.02 10 1.76-3.77a7.131 7.131 0 0 0 2.38 4.14zM20.65 7l-1.77 3.79a7.02 7.02 0 0 0-2.38-4.15zm-.01 10-4.14.36c.59-.51 1.12-1.14 1.54-1.86.42-.73.69-1.5.83-2.29zM12 22l-2.41-3.44c.74.27 1.55.44 2.41.44.82 0 1.63-.17 2.37-.44z"/></svg>
+      </label>
+    
+  
+    
+    
+    
+    <input class="md-option" data-md-color-media="(prefers-color-scheme: dark)" data-md-color-scheme="slate" data-md-color-primary="deep-purple" data-md-color-accent="teal"  aria-label="Switch to light mode"  type="radio" name="__palette" id="__palette_1">
+    
+      <label class="md-header__button md-icon" title="Switch to light mode" for="__palette_0" hidden>
+        <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="m17.75 4.09-2.53 1.94.91 3.06-2.63-1.81-2.63 1.81.91-3.06-2.53-1.94L12.44 4l1.06-3 1.06 3zm3.5 6.91-1.64 1.25.59 1.98-1.7-1.17-1.7 1.17.59-1.98L15.75 11l2.06-.05L18.5 9l.69 1.95zm-2.28 4.95c.83-.08 1.72 1.1 1.19 1.85-.32.45-.66.87-1.08 1.27C15.17 23 8.84 23 4.94 19.07c-3.91-3.9-3.91-10.24 0-14.14.4-.4.82-.76 1.27-1.08.75-.53 1.93.36 1.85 1.19-.27 2.86.69 5.83 2.89 8.02a9.96 9.96 0 0 0 8.02 2.89m-1.64 2.02a12.08 12.08 0 0 1-7.8-3.47c-2.17-2.19-3.33-5-3.49-7.82-2.81 3.14-2.7 7.96.31 10.98 3.02 3.01 7.84 3.12 10.98.31"/></svg>
+      </label>
+    
+  
+</form>
+      
+    
+    
+      <script>var palette=__md_get("__palette");if(palette&&palette.color){if("(prefers-color-scheme)"===palette.color.media){var media=matchMedia("(prefers-color-scheme: light)"),input=document.querySelector(media.matches?"[data-md-color-media='(prefers-color-scheme: light)']":"[data-md-color-media='(prefers-color-scheme: dark)']");palette.color.media=input.getAttribute("data-md-color-media"),palette.color.scheme=input.getAttribute("data-md-color-scheme"),palette.color.primary=input.getAttribute("data-md-color-primary"),palette.color.accent=input.getAttribute("data-md-color-accent")}for(var[key,value]of Object.entries(palette.color))document.body.setAttribute("data-md-color-"+key,value)}</script>
+    
+    
+    
+      <label class="md-header__button md-icon" for="__search">
+        
+        <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.52 6.52 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5"/></svg>
+      </label>
+      <div class="md-search" data-md-component="search" role="dialog">
+  <label class="md-search__overlay" for="__search"></label>
+  <div class="md-search__inner" role="search">
+    <form class="md-search__form" name="search">
+      <input type="text" class="md-search__input" name="query" aria-label="Search" placeholder="Search" autocapitalize="off" autocorrect="off" autocomplete="off" spellcheck="false" data-md-component="search-query" required>
+      <label class="md-search__icon md-icon" for="__search">
+        
+        <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M9.5 3A6.5 6.5 0 0 1 16 9.5c0 1.61-.59 3.09-1.56 4.23l.27.27h.79l5 5-1.5 1.5-5-5v-.79l-.27-.27A6.52 6.52 0 0 1 9.5 16 6.5 6.5 0 0 1 3 9.5 6.5 6.5 0 0 1 9.5 3m0 2C7 5 5 7 5 9.5S7 14 9.5 14 14 12 14 9.5 12 5 9.5 5"/></svg>
+        
+        <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M20 11v2H8l5.5 5.5-1.42 1.42L4.16 12l7.92-7.92L13.5 5.5 8 11z"/></svg>
+      </label>
+      <nav class="md-search__options" aria-label="Search">
+        
+        <button type="reset" class="md-search__icon md-icon" title="Clear" aria-label="Clear" tabindex="-1">
+          
+          <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M19 6.41 17.59 5 12 10.59 6.41 5 5 6.41 10.59 12 5 17.59 6.41 19 12 13.41 17.59 19 19 17.59 13.41 12z"/></svg>
+        </button>
+      </nav>
+      
+    </form>
+    <div class="md-search__output">
+      <div class="md-search__scrollwrap" tabindex="0" data-md-scrollfix>
+        <div class="md-search-result" data-md-component="search-result">
+          <div class="md-search-result__meta">
+            Initializing search
+          </div>
+          <ol class="md-search-result__list" role="presentation"></ol>
+        </div>
+      </div>
+    </div>
+  </div>
+</div>
+    
+    
+  </nav>
+  
+    
+      
+<nav class="md-tabs" aria-label="Tabs" data-md-component="tabs">
+  <div class="md-grid">
+    <ul class="md-tabs__list">
+      
+        
+  
+  
+  
+    <li class="md-tabs__item">
+      <a href=".." class="md-tabs__link">
+        
+  
+    
+  
+  Home
+
+      </a>
+    </li>
+  
+
+      
+        
+  
+  
+    
+  
+  
+    
+    
+      <li class="md-tabs__item md-tabs__item--active">
+        <a href="../SnipeSig/" class="md-tabs__link">
+          
+  
+  API
+
+        </a>
+      </li>
+    
+  
+
+      
+        
+  
+  
+  
+    <li class="md-tabs__item">
+      <a href="../cli/" class="md-tabs__link">
+        
+  
+    
+  
+  CLI
+
+      </a>
+    </li>
+  
+
+      
+    </ul>
+  </div>
+</nav>
+    
+  
+</header>
+    
+    <div class="md-container" data-md-component="container">
+      
+      
+        
+      
+      <main class="md-main" data-md-component="main">
+        <div class="md-main__inner md-grid">
+          
+            
+              
+              <div class="md-sidebar md-sidebar--primary" data-md-component="sidebar" data-md-type="navigation" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+
+  
+
+
+<nav class="md-nav md-nav--primary md-nav--lifted" aria-label="Navigation" data-md-level="0">
+  <label class="md-nav__title" for="__drawer">
+    <a href=".." title="Snipe Documentation" class="md-nav__button md-logo" aria-label="Snipe Documentation" data-md-component="logo">
+      
+  
+  <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M12 8a3 3 0 0 0 3-3 3 3 0 0 0-3-3 3 3 0 0 0-3 3 3 3 0 0 0 3 3m0 3.54C9.64 9.35 6.5 8 3 8v11c3.5 0 6.64 1.35 9 3.54 2.36-2.19 5.5-3.54 9-3.54V8c-3.5 0-6.64 1.35-9 3.54"/></svg>
+
+    </a>
+    Snipe Documentation
+  </label>
+  
+  <ul class="md-nav__list" data-md-scrollfix>
+    
+      
+      
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href=".." class="md-nav__link">
+        
+  
+  <span class="md-ellipsis">
+    Home
+  </span>
+  
+
+      </a>
+    </li>
+  
+
+    
+      
+      
+  
+  
+    
+  
+  
+  
+    
+    
+    
+      
+        
+        
+      
+      
+    
+    
+    <li class="md-nav__item md-nav__item--active md-nav__item--section md-nav__item--nested">
+      
+        
+        
+        <input class="md-nav__toggle md-toggle " type="checkbox" id="__nav_2" checked>
+        
+          
+          <label class="md-nav__link" for="__nav_2" id="__nav_2_label" tabindex="">
+            
+  
+  <span class="md-ellipsis">
+    API
+  </span>
+  
+
+            <span class="md-nav__icon md-icon"></span>
+          </label>
+        
+        <nav class="md-nav" data-md-level="1" aria-labelledby="__nav_2_label" aria-expanded="true">
+          <label class="md-nav__title" for="__nav_2">
+            <span class="md-nav__icon md-icon"></span>
+            API
+          </label>
+          <ul class="md-nav__list" data-md-scrollfix>
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../SnipeSig/" class="md-nav__link">
+        
+  
+  <span class="md-ellipsis">
+    SnipeSig
+  </span>
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../ReferenceQC/" class="md-nav__link">
+        
+  
+  <span class="md-ellipsis">
+    ReferenceQC
+  </span>
+  
+
+      </a>
+    </li>
+  
+
+              
+            
+              
+                
+  
+  
+    
+  
+  
+  
+    <li class="md-nav__item md-nav__item--active">
+      
+      <input class="md-nav__toggle md-toggle" type="checkbox" id="__toc">
+      
+      
+        
+      
+      
+        <label class="md-nav__link md-nav__link--active" for="__toc">
+          
+  
+  <span class="md-ellipsis">
+    Sketch
+  </span>
+  
+
+          <span class="md-nav__icon md-icon"></span>
+        </label>
+      
+      <a href="./" class="md-nav__link md-nav__link--active">
+        
+  
+  <span class="md-ellipsis">
+    Sketch
+  </span>
+  
+
+      </a>
+      
+        
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#snipe.api.sketch" class="md-nav__link">
+    <span class="md-ellipsis">
+      sketch
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch" class="md-nav__link">
+    <span class="md-ellipsis">
+      SnipeSketch
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="SnipeSketch">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.__init__" class="md-nav__link">
+    <span class="md-ellipsis">
+      __init__
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.amplicon_sketching" class="md-nav__link">
+    <span class="md-ellipsis">
+      amplicon_sketching
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.export_sigs_to_zip" class="md-nav__link">
+    <span class="md-ellipsis">
+      export_sigs_to_zip
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.parallel_genome_sketching" class="md-nav__link">
+    <span class="md-ellipsis">
+      parallel_genome_sketching
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.parse_fasta_header" class="md-nav__link">
+    <span class="md-ellipsis">
+      parse_fasta_header
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.process_sequences" class="md-nav__link">
+    <span class="md-ellipsis">
+      process_sequences
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.progress_monitor" class="md-nav__link">
+    <span class="md-ellipsis">
+      progress_monitor
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.sample_sketch" class="md-nav__link">
+    <span class="md-ellipsis">
+      sample_sketch
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+      
+    </li>
+  
+
+              
+            
+          </ul>
+        </nav>
+      
+    </li>
+  
+
+    
+      
+      
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../cli/" class="md-nav__link">
+        
+  
+  <span class="md-ellipsis">
+    CLI
+  </span>
+  
+
+      </a>
+    </li>
+  
+
+    
+  </ul>
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+            
+              
+              <div class="md-sidebar md-sidebar--secondary" data-md-component="sidebar" data-md-type="toc" >
+                <div class="md-sidebar__scrollwrap">
+                  <div class="md-sidebar__inner">
+                    
+
+<nav class="md-nav md-nav--secondary" aria-label="Table of contents">
+  
+  
+  
+    
+  
+  
+    <label class="md-nav__title" for="__toc">
+      <span class="md-nav__icon md-icon"></span>
+      Table of contents
+    </label>
+    <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
+      
+        <li class="md-nav__item">
+  <a href="#snipe.api.sketch" class="md-nav__link">
+    <span class="md-ellipsis">
+      sketch
+    </span>
+  </a>
+  
+</li>
+      
+        <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch" class="md-nav__link">
+    <span class="md-ellipsis">
+      SnipeSketch
+    </span>
+  </a>
+  
+    <nav class="md-nav" aria-label="SnipeSketch">
+      <ul class="md-nav__list">
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.__init__" class="md-nav__link">
+    <span class="md-ellipsis">
+      __init__
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.amplicon_sketching" class="md-nav__link">
+    <span class="md-ellipsis">
+      amplicon_sketching
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.export_sigs_to_zip" class="md-nav__link">
+    <span class="md-ellipsis">
+      export_sigs_to_zip
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.parallel_genome_sketching" class="md-nav__link">
+    <span class="md-ellipsis">
+      parallel_genome_sketching
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.parse_fasta_header" class="md-nav__link">
+    <span class="md-ellipsis">
+      parse_fasta_header
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.process_sequences" class="md-nav__link">
+    <span class="md-ellipsis">
+      process_sequences
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.progress_monitor" class="md-nav__link">
+    <span class="md-ellipsis">
+      progress_monitor
+    </span>
+  </a>
+  
+</li>
+        
+          <li class="md-nav__item">
+  <a href="#snipe.api.sketch.SnipeSketch.sample_sketch" class="md-nav__link">
+    <span class="md-ellipsis">
+      sample_sketch
+    </span>
+  </a>
+  
+</li>
+        
+      </ul>
+    </nav>
+  
+</li>
+      
+    </ul>
+  
+</nav>
+                  </div>
+                </div>
+              </div>
+            
+          
+          
+            <div class="md-content" data-md-component="content">
+              <article class="md-content__inner md-typeset">
+                
+                  
+
+
+<h1 id="python-api-documentation">Python API Documentation<a class="headerlink" href="#python-api-documentation" title="Permanent link">&para;</a></h1>
+
+
+<div class="doc doc-object doc-module">
+
+
+
+<a id="snipe.api.sketch"></a>
+    <div class="doc doc-contents first">
+
+
+
+
+
+
+
+
+  <div class="doc doc-children">
+
+
+
+
+
+
+
+
+<div class="doc doc-object doc-class">
+
+
+
+<h2 id="snipe.api.sketch.SnipeSketch" class="doc doc-heading">
+            <code>SnipeSketch</code>
+
+
+<a href="#snipe.api.sketch.SnipeSketch" class="headerlink" title="Permanent link">&para;</a></h2>
+
+
+    <div class="doc doc-contents ">
+
+
+        <p>SnipeSketch is responsible for creating FracMinHash sketches from genomic data.
+It supports parallel processing, progress monitoring, and different sketching modes
+including sample, genome, and amplicon sketching.</p>
+
+
+
+
+
+
+              <details class="quote">
+                <summary>Source code in <code>src/snipe/api/sketch.py</code></summary>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-18"> 18</a></span>
+<span class="normal"><a href="#__codelineno-0-19"> 19</a></span>
+<span class="normal"><a href="#__codelineno-0-20"> 20</a></span>
+<span class="normal"><a href="#__codelineno-0-21"> 21</a></span>
+<span class="normal"><a href="#__codelineno-0-22"> 22</a></span>
+<span class="normal"><a href="#__codelineno-0-23"> 23</a></span>
+<span class="normal"><a href="#__codelineno-0-24"> 24</a></span>
+<span class="normal"><a href="#__codelineno-0-25"> 25</a></span>
+<span class="normal"><a href="#__codelineno-0-26"> 26</a></span>
+<span class="normal"><a href="#__codelineno-0-27"> 27</a></span>
+<span class="normal"><a href="#__codelineno-0-28"> 28</a></span>
+<span class="normal"><a href="#__codelineno-0-29"> 29</a></span>
+<span class="normal"><a href="#__codelineno-0-30"> 30</a></span>
+<span class="normal"><a href="#__codelineno-0-31"> 31</a></span>
+<span class="normal"><a href="#__codelineno-0-32"> 32</a></span>
+<span class="normal"><a href="#__codelineno-0-33"> 33</a></span>
+<span class="normal"><a href="#__codelineno-0-34"> 34</a></span>
+<span class="normal"><a href="#__codelineno-0-35"> 35</a></span>
+<span class="normal"><a href="#__codelineno-0-36"> 36</a></span>
+<span class="normal"><a href="#__codelineno-0-37"> 37</a></span>
+<span class="normal"><a href="#__codelineno-0-38"> 38</a></span>
+<span class="normal"><a href="#__codelineno-0-39"> 39</a></span>
+<span class="normal"><a href="#__codelineno-0-40"> 40</a></span>
+<span class="normal"><a href="#__codelineno-0-41"> 41</a></span>
+<span class="normal"><a href="#__codelineno-0-42"> 42</a></span>
+<span class="normal"><a href="#__codelineno-0-43"> 43</a></span>
+<span class="normal"><a href="#__codelineno-0-44"> 44</a></span>
+<span class="normal"><a href="#__codelineno-0-45"> 45</a></span>
+<span class="normal"><a href="#__codelineno-0-46"> 46</a></span>
+<span class="normal"><a href="#__codelineno-0-47"> 47</a></span>
+<span class="normal"><a href="#__codelineno-0-48"> 48</a></span>
+<span class="normal"><a href="#__codelineno-0-49"> 49</a></span>
+<span class="normal"><a href="#__codelineno-0-50"> 50</a></span>
+<span class="normal"><a href="#__codelineno-0-51"> 51</a></span>
+<span class="normal"><a href="#__codelineno-0-52"> 52</a></span>
+<span class="normal"><a href="#__codelineno-0-53"> 53</a></span>
+<span class="normal"><a href="#__codelineno-0-54"> 54</a></span>
+<span class="normal"><a href="#__codelineno-0-55"> 55</a></span>
+<span class="normal"><a href="#__codelineno-0-56"> 56</a></span>
+<span class="normal"><a href="#__codelineno-0-57"> 57</a></span>
+<span class="normal"><a href="#__codelineno-0-58"> 58</a></span>
+<span class="normal"><a href="#__codelineno-0-59"> 59</a></span>
+<span class="normal"><a href="#__codelineno-0-60"> 60</a></span>
+<span class="normal"><a href="#__codelineno-0-61"> 61</a></span>
+<span class="normal"><a href="#__codelineno-0-62"> 62</a></span>
+<span class="normal"><a href="#__codelineno-0-63"> 63</a></span>
+<span class="normal"><a href="#__codelineno-0-64"> 64</a></span>
+<span class="normal"><a href="#__codelineno-0-65"> 65</a></span>
+<span class="normal"><a href="#__codelineno-0-66"> 66</a></span>
+<span class="normal"><a href="#__codelineno-0-67"> 67</a></span>
+<span class="normal"><a href="#__codelineno-0-68"> 68</a></span>
+<span class="normal"><a href="#__codelineno-0-69"> 69</a></span>
+<span class="normal"><a href="#__codelineno-0-70"> 70</a></span>
+<span class="normal"><a href="#__codelineno-0-71"> 71</a></span>
+<span class="normal"><a href="#__codelineno-0-72"> 72</a></span>
+<span class="normal"><a href="#__codelineno-0-73"> 73</a></span>
+<span class="normal"><a href="#__codelineno-0-74"> 74</a></span>
+<span class="normal"><a href="#__codelineno-0-75"> 75</a></span>
+<span class="normal"><a href="#__codelineno-0-76"> 76</a></span>
+<span class="normal"><a href="#__codelineno-0-77"> 77</a></span>
+<span class="normal"><a href="#__codelineno-0-78"> 78</a></span>
+<span class="normal"><a href="#__codelineno-0-79"> 79</a></span>
+<span class="normal"><a href="#__codelineno-0-80"> 80</a></span>
+<span class="normal"><a href="#__codelineno-0-81"> 81</a></span>
+<span class="normal"><a href="#__codelineno-0-82"> 82</a></span>
+<span class="normal"><a href="#__codelineno-0-83"> 83</a></span>
+<span class="normal"><a href="#__codelineno-0-84"> 84</a></span>
+<span class="normal"><a href="#__codelineno-0-85"> 85</a></span>
+<span class="normal"><a href="#__codelineno-0-86"> 86</a></span>
+<span class="normal"><a href="#__codelineno-0-87"> 87</a></span>
+<span class="normal"><a href="#__codelineno-0-88"> 88</a></span>
+<span class="normal"><a href="#__codelineno-0-89"> 89</a></span>
+<span class="normal"><a href="#__codelineno-0-90"> 90</a></span>
+<span class="normal"><a href="#__codelineno-0-91"> 91</a></span>
+<span class="normal"><a href="#__codelineno-0-92"> 92</a></span>
+<span class="normal"><a href="#__codelineno-0-93"> 93</a></span>
+<span class="normal"><a href="#__codelineno-0-94"> 94</a></span>
+<span class="normal"><a href="#__codelineno-0-95"> 95</a></span>
+<span class="normal"><a href="#__codelineno-0-96"> 96</a></span>
+<span class="normal"><a href="#__codelineno-0-97"> 97</a></span>
+<span class="normal"><a href="#__codelineno-0-98"> 98</a></span>
+<span class="normal"><a href="#__codelineno-0-99"> 99</a></span>
+<span class="normal"><a href="#__codelineno-0-100">100</a></span>
+<span class="normal"><a href="#__codelineno-0-101">101</a></span>
+<span class="normal"><a href="#__codelineno-0-102">102</a></span>
+<span class="normal"><a href="#__codelineno-0-103">103</a></span>
+<span class="normal"><a href="#__codelineno-0-104">104</a></span>
+<span class="normal"><a href="#__codelineno-0-105">105</a></span>
+<span class="normal"><a href="#__codelineno-0-106">106</a></span>
+<span class="normal"><a href="#__codelineno-0-107">107</a></span>
+<span class="normal"><a href="#__codelineno-0-108">108</a></span>
+<span class="normal"><a href="#__codelineno-0-109">109</a></span>
+<span class="normal"><a href="#__codelineno-0-110">110</a></span>
+<span class="normal"><a href="#__codelineno-0-111">111</a></span>
+<span class="normal"><a href="#__codelineno-0-112">112</a></span>
+<span class="normal"><a href="#__codelineno-0-113">113</a></span>
+<span class="normal"><a href="#__codelineno-0-114">114</a></span>
+<span class="normal"><a href="#__codelineno-0-115">115</a></span>
+<span class="normal"><a href="#__codelineno-0-116">116</a></span>
+<span class="normal"><a href="#__codelineno-0-117">117</a></span>
+<span class="normal"><a href="#__codelineno-0-118">118</a></span>
+<span class="normal"><a href="#__codelineno-0-119">119</a></span>
+<span class="normal"><a href="#__codelineno-0-120">120</a></span>
+<span class="normal"><a href="#__codelineno-0-121">121</a></span>
+<span class="normal"><a href="#__codelineno-0-122">122</a></span>
+<span class="normal"><a href="#__codelineno-0-123">123</a></span>
+<span class="normal"><a href="#__codelineno-0-124">124</a></span>
+<span class="normal"><a href="#__codelineno-0-125">125</a></span>
+<span class="normal"><a href="#__codelineno-0-126">126</a></span>
+<span class="normal"><a href="#__codelineno-0-127">127</a></span>
+<span class="normal"><a href="#__codelineno-0-128">128</a></span>
+<span class="normal"><a href="#__codelineno-0-129">129</a></span>
+<span class="normal"><a href="#__codelineno-0-130">130</a></span>
+<span class="normal"><a href="#__codelineno-0-131">131</a></span>
+<span class="normal"><a href="#__codelineno-0-132">132</a></span>
+<span class="normal"><a href="#__codelineno-0-133">133</a></span>
+<span class="normal"><a href="#__codelineno-0-134">134</a></span>
+<span class="normal"><a href="#__codelineno-0-135">135</a></span>
+<span class="normal"><a href="#__codelineno-0-136">136</a></span>
+<span class="normal"><a href="#__codelineno-0-137">137</a></span>
+<span class="normal"><a href="#__codelineno-0-138">138</a></span>
+<span class="normal"><a href="#__codelineno-0-139">139</a></span>
+<span class="normal"><a href="#__codelineno-0-140">140</a></span>
+<span class="normal"><a href="#__codelineno-0-141">141</a></span>
+<span class="normal"><a href="#__codelineno-0-142">142</a></span>
+<span class="normal"><a href="#__codelineno-0-143">143</a></span>
+<span class="normal"><a href="#__codelineno-0-144">144</a></span>
+<span class="normal"><a href="#__codelineno-0-145">145</a></span>
+<span class="normal"><a href="#__codelineno-0-146">146</a></span>
+<span class="normal"><a href="#__codelineno-0-147">147</a></span>
+<span class="normal"><a href="#__codelineno-0-148">148</a></span>
+<span class="normal"><a href="#__codelineno-0-149">149</a></span>
+<span class="normal"><a href="#__codelineno-0-150">150</a></span>
+<span class="normal"><a href="#__codelineno-0-151">151</a></span>
+<span class="normal"><a href="#__codelineno-0-152">152</a></span>
+<span class="normal"><a href="#__codelineno-0-153">153</a></span>
+<span class="normal"><a href="#__codelineno-0-154">154</a></span>
+<span class="normal"><a href="#__codelineno-0-155">155</a></span>
+<span class="normal"><a href="#__codelineno-0-156">156</a></span>
+<span class="normal"><a href="#__codelineno-0-157">157</a></span>
+<span class="normal"><a href="#__codelineno-0-158">158</a></span>
+<span class="normal"><a href="#__codelineno-0-159">159</a></span>
+<span class="normal"><a href="#__codelineno-0-160">160</a></span>
+<span class="normal"><a href="#__codelineno-0-161">161</a></span>
+<span class="normal"><a href="#__codelineno-0-162">162</a></span>
+<span class="normal"><a href="#__codelineno-0-163">163</a></span>
+<span class="normal"><a href="#__codelineno-0-164">164</a></span>
+<span class="normal"><a href="#__codelineno-0-165">165</a></span>
+<span class="normal"><a href="#__codelineno-0-166">166</a></span>
+<span class="normal"><a href="#__codelineno-0-167">167</a></span>
+<span class="normal"><a href="#__codelineno-0-168">168</a></span>
+<span class="normal"><a href="#__codelineno-0-169">169</a></span>
+<span class="normal"><a href="#__codelineno-0-170">170</a></span>
+<span class="normal"><a href="#__codelineno-0-171">171</a></span>
+<span class="normal"><a href="#__codelineno-0-172">172</a></span>
+<span class="normal"><a href="#__codelineno-0-173">173</a></span>
+<span class="normal"><a href="#__codelineno-0-174">174</a></span>
+<span class="normal"><a href="#__codelineno-0-175">175</a></span>
+<span class="normal"><a href="#__codelineno-0-176">176</a></span>
+<span class="normal"><a href="#__codelineno-0-177">177</a></span>
+<span class="normal"><a href="#__codelineno-0-178">178</a></span>
+<span class="normal"><a href="#__codelineno-0-179">179</a></span>
+<span class="normal"><a href="#__codelineno-0-180">180</a></span>
+<span class="normal"><a href="#__codelineno-0-181">181</a></span>
+<span class="normal"><a href="#__codelineno-0-182">182</a></span>
+<span class="normal"><a href="#__codelineno-0-183">183</a></span>
+<span class="normal"><a href="#__codelineno-0-184">184</a></span>
+<span class="normal"><a href="#__codelineno-0-185">185</a></span>
+<span class="normal"><a href="#__codelineno-0-186">186</a></span>
+<span class="normal"><a href="#__codelineno-0-187">187</a></span>
+<span class="normal"><a href="#__codelineno-0-188">188</a></span>
+<span class="normal"><a href="#__codelineno-0-189">189</a></span>
+<span class="normal"><a href="#__codelineno-0-190">190</a></span>
+<span class="normal"><a href="#__codelineno-0-191">191</a></span>
+<span class="normal"><a href="#__codelineno-0-192">192</a></span>
+<span class="normal"><a href="#__codelineno-0-193">193</a></span>
+<span class="normal"><a href="#__codelineno-0-194">194</a></span>
+<span class="normal"><a href="#__codelineno-0-195">195</a></span>
+<span class="normal"><a href="#__codelineno-0-196">196</a></span>
+<span class="normal"><a href="#__codelineno-0-197">197</a></span>
+<span class="normal"><a href="#__codelineno-0-198">198</a></span>
+<span class="normal"><a href="#__codelineno-0-199">199</a></span>
+<span class="normal"><a href="#__codelineno-0-200">200</a></span>
+<span class="normal"><a href="#__codelineno-0-201">201</a></span>
+<span class="normal"><a href="#__codelineno-0-202">202</a></span>
+<span class="normal"><a href="#__codelineno-0-203">203</a></span>
+<span class="normal"><a href="#__codelineno-0-204">204</a></span>
+<span class="normal"><a href="#__codelineno-0-205">205</a></span>
+<span class="normal"><a href="#__codelineno-0-206">206</a></span>
+<span class="normal"><a href="#__codelineno-0-207">207</a></span>
+<span class="normal"><a href="#__codelineno-0-208">208</a></span>
+<span class="normal"><a href="#__codelineno-0-209">209</a></span>
+<span class="normal"><a href="#__codelineno-0-210">210</a></span>
+<span class="normal"><a href="#__codelineno-0-211">211</a></span>
+<span class="normal"><a href="#__codelineno-0-212">212</a></span>
+<span class="normal"><a href="#__codelineno-0-213">213</a></span>
+<span class="normal"><a href="#__codelineno-0-214">214</a></span>
+<span class="normal"><a href="#__codelineno-0-215">215</a></span>
+<span class="normal"><a href="#__codelineno-0-216">216</a></span>
+<span class="normal"><a href="#__codelineno-0-217">217</a></span>
+<span class="normal"><a href="#__codelineno-0-218">218</a></span>
+<span class="normal"><a href="#__codelineno-0-219">219</a></span>
+<span class="normal"><a href="#__codelineno-0-220">220</a></span>
+<span class="normal"><a href="#__codelineno-0-221">221</a></span>
+<span class="normal"><a href="#__codelineno-0-222">222</a></span>
+<span class="normal"><a href="#__codelineno-0-223">223</a></span>
+<span class="normal"><a href="#__codelineno-0-224">224</a></span>
+<span class="normal"><a href="#__codelineno-0-225">225</a></span>
+<span class="normal"><a href="#__codelineno-0-226">226</a></span>
+<span class="normal"><a href="#__codelineno-0-227">227</a></span>
+<span class="normal"><a href="#__codelineno-0-228">228</a></span>
+<span class="normal"><a href="#__codelineno-0-229">229</a></span>
+<span class="normal"><a href="#__codelineno-0-230">230</a></span>
+<span class="normal"><a href="#__codelineno-0-231">231</a></span>
+<span class="normal"><a href="#__codelineno-0-232">232</a></span>
+<span class="normal"><a href="#__codelineno-0-233">233</a></span>
+<span class="normal"><a href="#__codelineno-0-234">234</a></span>
+<span class="normal"><a href="#__codelineno-0-235">235</a></span>
+<span class="normal"><a href="#__codelineno-0-236">236</a></span>
+<span class="normal"><a href="#__codelineno-0-237">237</a></span>
+<span class="normal"><a href="#__codelineno-0-238">238</a></span>
+<span class="normal"><a href="#__codelineno-0-239">239</a></span>
+<span class="normal"><a href="#__codelineno-0-240">240</a></span>
+<span class="normal"><a href="#__codelineno-0-241">241</a></span>
+<span class="normal"><a href="#__codelineno-0-242">242</a></span>
+<span class="normal"><a href="#__codelineno-0-243">243</a></span>
+<span class="normal"><a href="#__codelineno-0-244">244</a></span>
+<span class="normal"><a href="#__codelineno-0-245">245</a></span>
+<span class="normal"><a href="#__codelineno-0-246">246</a></span>
+<span class="normal"><a href="#__codelineno-0-247">247</a></span>
+<span class="normal"><a href="#__codelineno-0-248">248</a></span>
+<span class="normal"><a href="#__codelineno-0-249">249</a></span>
+<span class="normal"><a href="#__codelineno-0-250">250</a></span>
+<span class="normal"><a href="#__codelineno-0-251">251</a></span>
+<span class="normal"><a href="#__codelineno-0-252">252</a></span>
+<span class="normal"><a href="#__codelineno-0-253">253</a></span>
+<span class="normal"><a href="#__codelineno-0-254">254</a></span>
+<span class="normal"><a href="#__codelineno-0-255">255</a></span>
+<span class="normal"><a href="#__codelineno-0-256">256</a></span>
+<span class="normal"><a href="#__codelineno-0-257">257</a></span>
+<span class="normal"><a href="#__codelineno-0-258">258</a></span>
+<span class="normal"><a href="#__codelineno-0-259">259</a></span>
+<span class="normal"><a href="#__codelineno-0-260">260</a></span>
+<span class="normal"><a href="#__codelineno-0-261">261</a></span>
+<span class="normal"><a href="#__codelineno-0-262">262</a></span>
+<span class="normal"><a href="#__codelineno-0-263">263</a></span>
+<span class="normal"><a href="#__codelineno-0-264">264</a></span>
+<span class="normal"><a href="#__codelineno-0-265">265</a></span>
+<span class="normal"><a href="#__codelineno-0-266">266</a></span>
+<span class="normal"><a href="#__codelineno-0-267">267</a></span>
+<span class="normal"><a href="#__codelineno-0-268">268</a></span>
+<span class="normal"><a href="#__codelineno-0-269">269</a></span>
+<span class="normal"><a href="#__codelineno-0-270">270</a></span>
+<span class="normal"><a href="#__codelineno-0-271">271</a></span>
+<span class="normal"><a href="#__codelineno-0-272">272</a></span>
+<span class="normal"><a href="#__codelineno-0-273">273</a></span>
+<span class="normal"><a href="#__codelineno-0-274">274</a></span>
+<span class="normal"><a href="#__codelineno-0-275">275</a></span>
+<span class="normal"><a href="#__codelineno-0-276">276</a></span>
+<span class="normal"><a href="#__codelineno-0-277">277</a></span>
+<span class="normal"><a href="#__codelineno-0-278">278</a></span>
+<span class="normal"><a href="#__codelineno-0-279">279</a></span>
+<span class="normal"><a href="#__codelineno-0-280">280</a></span>
+<span class="normal"><a href="#__codelineno-0-281">281</a></span>
+<span class="normal"><a href="#__codelineno-0-282">282</a></span>
+<span class="normal"><a href="#__codelineno-0-283">283</a></span>
+<span class="normal"><a href="#__codelineno-0-284">284</a></span>
+<span class="normal"><a href="#__codelineno-0-285">285</a></span>
+<span class="normal"><a href="#__codelineno-0-286">286</a></span>
+<span class="normal"><a href="#__codelineno-0-287">287</a></span>
+<span class="normal"><a href="#__codelineno-0-288">288</a></span>
+<span class="normal"><a href="#__codelineno-0-289">289</a></span>
+<span class="normal"><a href="#__codelineno-0-290">290</a></span>
+<span class="normal"><a href="#__codelineno-0-291">291</a></span>
+<span class="normal"><a href="#__codelineno-0-292">292</a></span>
+<span class="normal"><a href="#__codelineno-0-293">293</a></span>
+<span class="normal"><a href="#__codelineno-0-294">294</a></span>
+<span class="normal"><a href="#__codelineno-0-295">295</a></span>
+<span class="normal"><a href="#__codelineno-0-296">296</a></span>
+<span class="normal"><a href="#__codelineno-0-297">297</a></span>
+<span class="normal"><a href="#__codelineno-0-298">298</a></span>
+<span class="normal"><a href="#__codelineno-0-299">299</a></span>
+<span class="normal"><a href="#__codelineno-0-300">300</a></span>
+<span class="normal"><a href="#__codelineno-0-301">301</a></span>
+<span class="normal"><a href="#__codelineno-0-302">302</a></span>
+<span class="normal"><a href="#__codelineno-0-303">303</a></span>
+<span class="normal"><a href="#__codelineno-0-304">304</a></span>
+<span class="normal"><a href="#__codelineno-0-305">305</a></span>
+<span class="normal"><a href="#__codelineno-0-306">306</a></span>
+<span class="normal"><a href="#__codelineno-0-307">307</a></span>
+<span class="normal"><a href="#__codelineno-0-308">308</a></span>
+<span class="normal"><a href="#__codelineno-0-309">309</a></span>
+<span class="normal"><a href="#__codelineno-0-310">310</a></span>
+<span class="normal"><a href="#__codelineno-0-311">311</a></span>
+<span class="normal"><a href="#__codelineno-0-312">312</a></span>
+<span class="normal"><a href="#__codelineno-0-313">313</a></span>
+<span class="normal"><a href="#__codelineno-0-314">314</a></span>
+<span class="normal"><a href="#__codelineno-0-315">315</a></span>
+<span class="normal"><a href="#__codelineno-0-316">316</a></span>
+<span class="normal"><a href="#__codelineno-0-317">317</a></span>
+<span class="normal"><a href="#__codelineno-0-318">318</a></span>
+<span class="normal"><a href="#__codelineno-0-319">319</a></span>
+<span class="normal"><a href="#__codelineno-0-320">320</a></span>
+<span class="normal"><a href="#__codelineno-0-321">321</a></span>
+<span class="normal"><a href="#__codelineno-0-322">322</a></span>
+<span class="normal"><a href="#__codelineno-0-323">323</a></span>
+<span class="normal"><a href="#__codelineno-0-324">324</a></span>
+<span class="normal"><a href="#__codelineno-0-325">325</a></span>
+<span class="normal"><a href="#__codelineno-0-326">326</a></span>
+<span class="normal"><a href="#__codelineno-0-327">327</a></span>
+<span class="normal"><a href="#__codelineno-0-328">328</a></span>
+<span class="normal"><a href="#__codelineno-0-329">329</a></span>
+<span class="normal"><a href="#__codelineno-0-330">330</a></span>
+<span class="normal"><a href="#__codelineno-0-331">331</a></span>
+<span class="normal"><a href="#__codelineno-0-332">332</a></span>
+<span class="normal"><a href="#__codelineno-0-333">333</a></span>
+<span class="normal"><a href="#__codelineno-0-334">334</a></span>
+<span class="normal"><a href="#__codelineno-0-335">335</a></span>
+<span class="normal"><a href="#__codelineno-0-336">336</a></span>
+<span class="normal"><a href="#__codelineno-0-337">337</a></span>
+<span class="normal"><a href="#__codelineno-0-338">338</a></span>
+<span class="normal"><a href="#__codelineno-0-339">339</a></span>
+<span class="normal"><a href="#__codelineno-0-340">340</a></span>
+<span class="normal"><a href="#__codelineno-0-341">341</a></span>
+<span class="normal"><a href="#__codelineno-0-342">342</a></span>
+<span class="normal"><a href="#__codelineno-0-343">343</a></span>
+<span class="normal"><a href="#__codelineno-0-344">344</a></span>
+<span class="normal"><a href="#__codelineno-0-345">345</a></span>
+<span class="normal"><a href="#__codelineno-0-346">346</a></span>
+<span class="normal"><a href="#__codelineno-0-347">347</a></span>
+<span class="normal"><a href="#__codelineno-0-348">348</a></span>
+<span class="normal"><a href="#__codelineno-0-349">349</a></span>
+<span class="normal"><a href="#__codelineno-0-350">350</a></span>
+<span class="normal"><a href="#__codelineno-0-351">351</a></span>
+<span class="normal"><a href="#__codelineno-0-352">352</a></span>
+<span class="normal"><a href="#__codelineno-0-353">353</a></span>
+<span class="normal"><a href="#__codelineno-0-354">354</a></span>
+<span class="normal"><a href="#__codelineno-0-355">355</a></span>
+<span class="normal"><a href="#__codelineno-0-356">356</a></span>
+<span class="normal"><a href="#__codelineno-0-357">357</a></span>
+<span class="normal"><a href="#__codelineno-0-358">358</a></span>
+<span class="normal"><a href="#__codelineno-0-359">359</a></span>
+<span class="normal"><a href="#__codelineno-0-360">360</a></span>
+<span class="normal"><a href="#__codelineno-0-361">361</a></span>
+<span class="normal"><a href="#__codelineno-0-362">362</a></span>
+<span class="normal"><a href="#__codelineno-0-363">363</a></span>
+<span class="normal"><a href="#__codelineno-0-364">364</a></span>
+<span class="normal"><a href="#__codelineno-0-365">365</a></span>
+<span class="normal"><a href="#__codelineno-0-366">366</a></span>
+<span class="normal"><a href="#__codelineno-0-367">367</a></span>
+<span class="normal"><a href="#__codelineno-0-368">368</a></span>
+<span class="normal"><a href="#__codelineno-0-369">369</a></span>
+<span class="normal"><a href="#__codelineno-0-370">370</a></span>
+<span class="normal"><a href="#__codelineno-0-371">371</a></span>
+<span class="normal"><a href="#__codelineno-0-372">372</a></span>
+<span class="normal"><a href="#__codelineno-0-373">373</a></span>
+<span class="normal"><a href="#__codelineno-0-374">374</a></span>
+<span class="normal"><a href="#__codelineno-0-375">375</a></span>
+<span class="normal"><a href="#__codelineno-0-376">376</a></span>
+<span class="normal"><a href="#__codelineno-0-377">377</a></span>
+<span class="normal"><a href="#__codelineno-0-378">378</a></span>
+<span class="normal"><a href="#__codelineno-0-379">379</a></span>
+<span class="normal"><a href="#__codelineno-0-380">380</a></span>
+<span class="normal"><a href="#__codelineno-0-381">381</a></span>
+<span class="normal"><a href="#__codelineno-0-382">382</a></span>
+<span class="normal"><a href="#__codelineno-0-383">383</a></span>
+<span class="normal"><a href="#__codelineno-0-384">384</a></span>
+<span class="normal"><a href="#__codelineno-0-385">385</a></span>
+<span class="normal"><a href="#__codelineno-0-386">386</a></span>
+<span class="normal"><a href="#__codelineno-0-387">387</a></span>
+<span class="normal"><a href="#__codelineno-0-388">388</a></span>
+<span class="normal"><a href="#__codelineno-0-389">389</a></span>
+<span class="normal"><a href="#__codelineno-0-390">390</a></span>
+<span class="normal"><a href="#__codelineno-0-391">391</a></span>
+<span class="normal"><a href="#__codelineno-0-392">392</a></span>
+<span class="normal"><a href="#__codelineno-0-393">393</a></span>
+<span class="normal"><a href="#__codelineno-0-394">394</a></span>
+<span class="normal"><a href="#__codelineno-0-395">395</a></span>
+<span class="normal"><a href="#__codelineno-0-396">396</a></span>
+<span class="normal"><a href="#__codelineno-0-397">397</a></span>
+<span class="normal"><a href="#__codelineno-0-398">398</a></span>
+<span class="normal"><a href="#__codelineno-0-399">399</a></span>
+<span class="normal"><a href="#__codelineno-0-400">400</a></span>
+<span class="normal"><a href="#__codelineno-0-401">401</a></span>
+<span class="normal"><a href="#__codelineno-0-402">402</a></span>
+<span class="normal"><a href="#__codelineno-0-403">403</a></span>
+<span class="normal"><a href="#__codelineno-0-404">404</a></span>
+<span class="normal"><a href="#__codelineno-0-405">405</a></span>
+<span class="normal"><a href="#__codelineno-0-406">406</a></span>
+<span class="normal"><a href="#__codelineno-0-407">407</a></span>
+<span class="normal"><a href="#__codelineno-0-408">408</a></span>
+<span class="normal"><a href="#__codelineno-0-409">409</a></span>
+<span class="normal"><a href="#__codelineno-0-410">410</a></span>
+<span class="normal"><a href="#__codelineno-0-411">411</a></span>
+<span class="normal"><a href="#__codelineno-0-412">412</a></span>
+<span class="normal"><a href="#__codelineno-0-413">413</a></span>
+<span class="normal"><a href="#__codelineno-0-414">414</a></span>
+<span class="normal"><a href="#__codelineno-0-415">415</a></span>
+<span class="normal"><a href="#__codelineno-0-416">416</a></span>
+<span class="normal"><a href="#__codelineno-0-417">417</a></span>
+<span class="normal"><a href="#__codelineno-0-418">418</a></span>
+<span class="normal"><a href="#__codelineno-0-419">419</a></span>
+<span class="normal"><a href="#__codelineno-0-420">420</a></span>
+<span class="normal"><a href="#__codelineno-0-421">421</a></span>
+<span class="normal"><a href="#__codelineno-0-422">422</a></span>
+<span class="normal"><a href="#__codelineno-0-423">423</a></span>
+<span class="normal"><a href="#__codelineno-0-424">424</a></span>
+<span class="normal"><a href="#__codelineno-0-425">425</a></span>
+<span class="normal"><a href="#__codelineno-0-426">426</a></span>
+<span class="normal"><a href="#__codelineno-0-427">427</a></span>
+<span class="normal"><a href="#__codelineno-0-428">428</a></span>
+<span class="normal"><a href="#__codelineno-0-429">429</a></span>
+<span class="normal"><a href="#__codelineno-0-430">430</a></span>
+<span class="normal"><a href="#__codelineno-0-431">431</a></span>
+<span class="normal"><a href="#__codelineno-0-432">432</a></span>
+<span class="normal"><a href="#__codelineno-0-433">433</a></span>
+<span class="normal"><a href="#__codelineno-0-434">434</a></span>
+<span class="normal"><a href="#__codelineno-0-435">435</a></span>
+<span class="normal"><a href="#__codelineno-0-436">436</a></span>
+<span class="normal"><a href="#__codelineno-0-437">437</a></span>
+<span class="normal"><a href="#__codelineno-0-438">438</a></span>
+<span class="normal"><a href="#__codelineno-0-439">439</a></span>
+<span class="normal"><a href="#__codelineno-0-440">440</a></span>
+<span class="normal"><a href="#__codelineno-0-441">441</a></span>
+<span class="normal"><a href="#__codelineno-0-442">442</a></span>
+<span class="normal"><a href="#__codelineno-0-443">443</a></span>
+<span class="normal"><a href="#__codelineno-0-444">444</a></span>
+<span class="normal"><a href="#__codelineno-0-445">445</a></span>
+<span class="normal"><a href="#__codelineno-0-446">446</a></span>
+<span class="normal"><a href="#__codelineno-0-447">447</a></span>
+<span class="normal"><a href="#__codelineno-0-448">448</a></span>
+<span class="normal"><a href="#__codelineno-0-449">449</a></span>
+<span class="normal"><a href="#__codelineno-0-450">450</a></span>
+<span class="normal"><a href="#__codelineno-0-451">451</a></span>
+<span class="normal"><a href="#__codelineno-0-452">452</a></span>
+<span class="normal"><a href="#__codelineno-0-453">453</a></span>
+<span class="normal"><a href="#__codelineno-0-454">454</a></span>
+<span class="normal"><a href="#__codelineno-0-455">455</a></span>
+<span class="normal"><a href="#__codelineno-0-456">456</a></span>
+<span class="normal"><a href="#__codelineno-0-457">457</a></span>
+<span class="normal"><a href="#__codelineno-0-458">458</a></span>
+<span class="normal"><a href="#__codelineno-0-459">459</a></span>
+<span class="normal"><a href="#__codelineno-0-460">460</a></span>
+<span class="normal"><a href="#__codelineno-0-461">461</a></span>
+<span class="normal"><a href="#__codelineno-0-462">462</a></span>
+<span class="normal"><a href="#__codelineno-0-463">463</a></span>
+<span class="normal"><a href="#__codelineno-0-464">464</a></span>
+<span class="normal"><a href="#__codelineno-0-465">465</a></span>
+<span class="normal"><a href="#__codelineno-0-466">466</a></span>
+<span class="normal"><a href="#__codelineno-0-467">467</a></span>
+<span class="normal"><a href="#__codelineno-0-468">468</a></span>
+<span class="normal"><a href="#__codelineno-0-469">469</a></span>
+<span class="normal"><a href="#__codelineno-0-470">470</a></span>
+<span class="normal"><a href="#__codelineno-0-471">471</a></span>
+<span class="normal"><a href="#__codelineno-0-472">472</a></span>
+<span class="normal"><a href="#__codelineno-0-473">473</a></span>
+<span class="normal"><a href="#__codelineno-0-474">474</a></span>
+<span class="normal"><a href="#__codelineno-0-475">475</a></span>
+<span class="normal"><a href="#__codelineno-0-476">476</a></span>
+<span class="normal"><a href="#__codelineno-0-477">477</a></span>
+<span class="normal"><a href="#__codelineno-0-478">478</a></span>
+<span class="normal"><a href="#__codelineno-0-479">479</a></span>
+<span class="normal"><a href="#__codelineno-0-480">480</a></span>
+<span class="normal"><a href="#__codelineno-0-481">481</a></span>
+<span class="normal"><a href="#__codelineno-0-482">482</a></span>
+<span class="normal"><a href="#__codelineno-0-483">483</a></span>
+<span class="normal"><a href="#__codelineno-0-484">484</a></span>
+<span class="normal"><a href="#__codelineno-0-485">485</a></span>
+<span class="normal"><a href="#__codelineno-0-486">486</a></span>
+<span class="normal"><a href="#__codelineno-0-487">487</a></span>
+<span class="normal"><a href="#__codelineno-0-488">488</a></span>
+<span class="normal"><a href="#__codelineno-0-489">489</a></span>
+<span class="normal"><a href="#__codelineno-0-490">490</a></span>
+<span class="normal"><a href="#__codelineno-0-491">491</a></span>
+<span class="normal"><a href="#__codelineno-0-492">492</a></span>
+<span class="normal"><a href="#__codelineno-0-493">493</a></span>
+<span class="normal"><a href="#__codelineno-0-494">494</a></span>
+<span class="normal"><a href="#__codelineno-0-495">495</a></span>
+<span class="normal"><a href="#__codelineno-0-496">496</a></span>
+<span class="normal"><a href="#__codelineno-0-497">497</a></span>
+<span class="normal"><a href="#__codelineno-0-498">498</a></span>
+<span class="normal"><a href="#__codelineno-0-499">499</a></span>
+<span class="normal"><a href="#__codelineno-0-500">500</a></span>
+<span class="normal"><a href="#__codelineno-0-501">501</a></span>
+<span class="normal"><a href="#__codelineno-0-502">502</a></span>
+<span class="normal"><a href="#__codelineno-0-503">503</a></span>
+<span class="normal"><a href="#__codelineno-0-504">504</a></span>
+<span class="normal"><a href="#__codelineno-0-505">505</a></span>
+<span class="normal"><a href="#__codelineno-0-506">506</a></span>
+<span class="normal"><a href="#__codelineno-0-507">507</a></span>
+<span class="normal"><a href="#__codelineno-0-508">508</a></span>
+<span class="normal"><a href="#__codelineno-0-509">509</a></span>
+<span class="normal"><a href="#__codelineno-0-510">510</a></span>
+<span class="normal"><a href="#__codelineno-0-511">511</a></span>
+<span class="normal"><a href="#__codelineno-0-512">512</a></span>
+<span class="normal"><a href="#__codelineno-0-513">513</a></span>
+<span class="normal"><a href="#__codelineno-0-514">514</a></span>
+<span class="normal"><a href="#__codelineno-0-515">515</a></span>
+<span class="normal"><a href="#__codelineno-0-516">516</a></span>
+<span class="normal"><a href="#__codelineno-0-517">517</a></span>
+<span class="normal"><a href="#__codelineno-0-518">518</a></span>
+<span class="normal"><a href="#__codelineno-0-519">519</a></span>
+<span class="normal"><a href="#__codelineno-0-520">520</a></span>
+<span class="normal"><a href="#__codelineno-0-521">521</a></span>
+<span class="normal"><a href="#__codelineno-0-522">522</a></span>
+<span class="normal"><a href="#__codelineno-0-523">523</a></span>
+<span class="normal"><a href="#__codelineno-0-524">524</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a><span class="k">class</span> <span class="nc">SnipeSketch</span><span class="p">:</span>
+</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a><span class="sd">    SnipeSketch is responsible for creating FracMinHash sketches from genomic data.</span>
+</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a><span class="sd">    It supports parallel processing, progress monitoring, and different sketching modes</span>
+</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="sd">    including sample, genome, and amplicon sketching.</span>
+</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a>
+</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">        Initialize the SnipeSketch instance.</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a><span class="sd">            enable_logging (bool): Flag to enable or disable logging.</span>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_configure_logging</span><span class="p">(</span><span class="n">enable_logging</span><span class="p">)</span>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>
+</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a>    <span class="k">def</span> <span class="nf">_configure_logging</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a><span class="sd">        Configure the logging for the class.</span>
+</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>
+</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">            enable_logging (bool): Flag to enable or disable logging.</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>        <span class="k">if</span> <span class="n">enable_logging</span><span class="p">:</span>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">hasHandlers</span><span class="p">():</span>
+</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>                <span class="n">handler</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">StreamHandler</span><span class="p">()</span>
+</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>                <span class="n">handler</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>                <span class="n">formatter</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">Formatter</span><span class="p">(</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>                    <span class="s2">&quot;</span><span class="si">%(asctime)s</span><span class="s2"> - </span><span class="si">%(name)s</span><span class="s2"> - </span><span class="si">%(levelname)s</span><span class="s2"> - </span><span class="si">%(message)s</span><span class="s2">&quot;</span>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>                <span class="p">)</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>                <span class="n">handler</span><span class="o">.</span><span class="n">setFormatter</span><span class="p">(</span><span class="n">formatter</span><span class="p">)</span>
+</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">addHandler</span><span class="p">(</span><span class="n">handler</span><span class="p">)</span>
+</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Logging is enabled for SnipeSketch.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">CRITICAL</span><span class="p">)</span>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>    <span class="c1"># *******************************</span>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>    <span class="c1"># *        Sketching            *</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>    <span class="c1"># *******************************</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>    <span class="k">def</span> <span class="nf">process_sequences</span><span class="p">(</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>        <span class="n">fasta_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>        <span class="n">thread_id</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>        <span class="n">total_threads</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>        <span class="n">progress_queue</span><span class="p">:</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">Queue</span><span class="p">,</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>        <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100_000</span><span class="p">,</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a>        <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>        <span class="n">scaled</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10_000</span><span class="p">,</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">:</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        Process a subset of sequences to create a FracMinHash sketch.</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">        Each process creates its own MinHash instance and processes sequences</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">        assigned based on the thread ID. Progress is reported via a shared queue.</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">            fasta_file (str): Path to the FASTA file.</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">            thread_id (int): Identifier for the current thread.</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">            total_threads (int): Total number of threads.</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a><span class="sd">            progress_queue (multiprocessing.Queue): Queue for reporting progress.</span>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">            batch_size (int, optional): Number of sequences per progress update. Defaults to 100_000.</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a><span class="sd">            ksize (int, optional): K-mer size. Defaults to 51.</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a><span class="sd">            scaled (int, optional): Scaling factor for MinHash. Defaults to 10_000.</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a><span class="sd">            sourmash.MinHash: The resulting FracMinHash sketch.</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_register_signal_handler</span><span class="p">()</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>            <span class="n">fa_reader</span> <span class="o">=</span> <span class="n">SequenceReader</span><span class="p">(</span><span class="n">fasta_file</span><span class="p">)</span>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>            <span class="n">mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>                <span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scaled</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="kc">True</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>            <span class="p">)</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>            <span class="n">local_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>            <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">_</span><span class="p">,</span> <span class="n">seq</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">fa_reader</span><span class="p">):</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>                <span class="k">if</span> <span class="n">idx</span> <span class="o">%</span> <span class="n">total_threads</span> <span class="o">==</span> <span class="n">thread_id</span><span class="p">:</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>                    <span class="n">mh</span><span class="o">.</span><span class="n">add_sequence</span><span class="p">(</span><span class="n">seq</span><span class="p">,</span> <span class="n">force</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>                    <span class="n">local_count</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>                    <span class="k">if</span> <span class="n">local_count</span> <span class="o">&gt;=</span> <span class="n">batch_size</span><span class="p">:</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>                        <span class="n">progress_queue</span><span class="o">.</span><span class="n">put</span><span class="p">(</span><span class="n">batch_size</span><span class="p">)</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>                        <span class="n">local_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>            <span class="k">if</span> <span class="n">local_count</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>                <span class="n">progress_queue</span><span class="o">.</span><span class="n">put</span><span class="p">(</span><span class="n">local_count</span><span class="p">)</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>                <span class="s2">&quot;Thread </span><span class="si">%d</span><span class="s2"> processed </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="n">thread_id</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">mh</span><span class="p">)</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>            <span class="p">)</span>
+</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>            <span class="k">return</span> <span class="n">mh</span>
+</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>        <span class="k">except</span> <span class="ne">KeyboardInterrupt</span><span class="p">:</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;KeyboardInterrupt detected in process_sequences.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>            <span class="n">sys</span><span class="o">.</span><span class="n">exit</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error in process_sequences: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>            <span class="k">raise</span>
+</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>
+</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>    <span class="k">def</span> <span class="nf">_register_signal_handler</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a><span class="sd">        Register the signal handler for graceful shutdown.</span>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>        <span class="n">signal</span><span class="o">.</span><span class="n">signal</span><span class="p">(</span><span class="n">signal</span><span class="o">.</span><span class="n">SIGINT</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_worker_signal_handler</span><span class="p">)</span>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>    <span class="k">def</span> <span class="nf">progress_monitor</span><span class="p">(</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>        <span class="n">progress_queue</span><span class="p">:</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">Queue</span><span class="p">,</span>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>        <span class="n">progress_interval</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>        <span class="n">total_threads</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>        <span class="n">stop_event</span><span class="p">:</span> <span class="n">threading</span><span class="o">.</span><span class="n">Event</span><span class="p">,</span>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a><span class="sd">        Monitor and display the progress of sequence processing.</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a><span class="sd">            progress_queue (multiprocessing.Queue): Queue for receiving progress updates.</span>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a><span class="sd">            progress_interval (int): Interval for progress updates.</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a><span class="sd">            total_threads (int): Number of processing threads.</span>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a><span class="sd">            stop_event (threading.Event): Event to signal the monitor to stop.</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>        <span class="n">total</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>        <span class="n">next_update</span> <span class="o">=</span> <span class="n">progress_interval</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>            <span class="k">while</span> <span class="ow">not</span> <span class="n">stop_event</span><span class="o">.</span><span class="n">is_set</span><span class="p">()</span> <span class="ow">or</span> <span class="ow">not</span> <span class="n">progress_queue</span><span class="o">.</span><span class="n">empty</span><span class="p">():</span>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>                <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>                    <span class="n">count</span> <span class="o">=</span> <span class="n">progress_queue</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">timeout</span><span class="o">=</span><span class="mf">0.5</span><span class="p">)</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>                    <span class="n">total</span> <span class="o">+=</span> <span class="n">count</span>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>                    <span class="k">if</span> <span class="n">total</span> <span class="o">&gt;=</span> <span class="n">next_update</span><span class="p">:</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>                        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="se">\r</span><span class="s2">Processed </span><span class="si">{</span><span class="n">next_update</span><span class="si">:</span><span class="s2">,</span><span class="si">}</span><span class="s2"> sequences.&quot;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">flush</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>                        <span class="n">next_update</span> <span class="o">+=</span> <span class="n">progress_interval</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>                <span class="k">except</span> <span class="n">queue</span><span class="o">.</span><span class="n">Empty</span><span class="p">:</span>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>                    <span class="k">continue</span>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error in progress_monitor: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>        <span class="k">finally</span><span class="p">:</span>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>            <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="se">\r</span><span class="s2">Processed </span><span class="si">{</span><span class="n">total</span><span class="si">:</span><span class="s2">,</span><span class="si">}</span><span class="s2"> sequences in total.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>
+</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>    <span class="k">def</span> <span class="nf">_worker_signal_handler</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">signum</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">frame</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a><span class="sd">        Handle signals in worker processes to exit gracefully.</span>
+</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a><span class="sd">            signum (int): Signal number.</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a><span class="sd">            frame (Any): Current stack frame.</span>
+</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Received signal </span><span class="si">%d</span><span class="s2">. Exiting worker.&quot;</span><span class="p">,</span> <span class="n">signum</span><span class="p">)</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>        <span class="n">sys</span><span class="o">.</span><span class="n">exit</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>    <span class="k">def</span> <span class="nf">_sketch_sample</span><span class="p">(</span>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>        <span class="n">sample_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>        <span class="n">fasta_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>        <span class="n">num_processes</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">4</span><span class="p">,</span>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>        <span class="n">progress_interval</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1_000_000</span><span class="p">,</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>        <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100_000</span><span class="p">,</span>
+</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>        <span class="n">k_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span>
+</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>        <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10_000</span><span class="p">,</span>
+</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>        <span class="o">**</span><span class="n">kwargs</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">:</span>
+</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a><span class="sd">        Create a FracMinHash sketch for a sample using parallel processing.</span>
+</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>
+</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a><span class="sd">            sample_name (str): Name of the sample.</span>
+</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a><span class="sd">            fasta_file (str): Path to the FASTA file.</span>
+</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a><span class="sd">            num_processes (int, optional): Number of parallel processes. Defaults to 4.</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a><span class="sd">            progress_interval (int, optional): Interval for progress updates. Defaults to 1_000_000.</span>
+</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a><span class="sd">            batch_size (int, optional): Number of sequences per progress update. Defaults to 100_000.</span>
+</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a><span class="sd">            k_size (int, optional): K-mer size. Defaults to 51.</span>
+</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a><span class="sd">            scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a><span class="sd">            **kwargs (Any): Additional keyword arguments.</span>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a><span class="sd">            sourmash.SourmashSignature: The resulting Sourmash signature.</span>
+</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Starting sketching with </span><span class="si">%d</span><span class="s2"> processes...&quot;</span><span class="p">,</span> <span class="n">num_processes</span><span class="p">)</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>
+</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>        <span class="n">manager</span> <span class="o">=</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">Manager</span><span class="p">()</span>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>        <span class="n">progress_queue</span> <span class="o">=</span> <span class="n">manager</span><span class="o">.</span><span class="n">Queue</span><span class="p">()</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>        <span class="n">stop_event</span> <span class="o">=</span> <span class="n">threading</span><span class="o">.</span><span class="n">Event</span><span class="p">()</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>
+</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>        <span class="n">monitor_thread</span> <span class="o">=</span> <span class="n">threading</span><span class="o">.</span><span class="n">Thread</span><span class="p">(</span>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>            <span class="n">target</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">progress_monitor</span><span class="p">,</span>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>            <span class="n">args</span><span class="o">=</span><span class="p">(</span><span class="n">progress_queue</span><span class="p">,</span> <span class="n">progress_interval</span><span class="p">,</span> <span class="n">num_processes</span><span class="p">,</span> <span class="n">stop_event</span><span class="p">),</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>            <span class="n">daemon</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>        <span class="p">)</span>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>        <span class="n">monitor_thread</span><span class="o">.</span><span class="n">start</span><span class="p">()</span>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>        <span class="n">pool</span> <span class="o">=</span> <span class="n">Pool</span><span class="p">(</span><span class="n">nodes</span><span class="o">=</span><span class="n">num_processes</span><span class="p">)</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>        <span class="n">results</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="n">Any</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>            <span class="k">for</span> <span class="n">thread_id</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">num_processes</span><span class="p">):</span>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>                <span class="n">result</span> <span class="o">=</span> <span class="n">pool</span><span class="o">.</span><span class="n">apipe</span><span class="p">(</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">process_sequences</span><span class="p">,</span>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>                    <span class="n">fasta_file</span><span class="p">,</span>
+</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>                    <span class="n">thread_id</span><span class="p">,</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>                    <span class="n">num_processes</span><span class="p">,</span>
+</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>                    <span class="n">progress_queue</span><span class="p">,</span>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>                    <span class="n">batch_size</span><span class="p">,</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>                    <span class="n">k_size</span><span class="p">,</span>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>                    <span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>                <span class="p">)</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>                <span class="n">results</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">result</span><span class="p">)</span>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>            <span class="n">pool</span><span class="o">.</span><span class="n">close</span><span class="p">()</span>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>            <span class="n">pool</span><span class="o">.</span><span class="n">join</span><span class="p">()</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>        <span class="k">except</span> <span class="ne">KeyboardInterrupt</span><span class="p">:</span>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;Interrupt received. Terminating processes...&quot;</span><span class="p">)</span>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>            <span class="n">pool</span><span class="o">.</span><span class="n">terminate</span><span class="p">()</span>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>            <span class="n">pool</span><span class="o">.</span><span class="n">join</span><span class="p">()</span>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>            <span class="n">stop_event</span><span class="o">.</span><span class="n">set</span><span class="p">()</span>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>            <span class="n">monitor_thread</span><span class="o">.</span><span class="n">join</span><span class="p">()</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>            <span class="n">sys</span><span class="o">.</span><span class="n">exit</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error during sketching: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>            <span class="n">pool</span><span class="o">.</span><span class="n">terminate</span><span class="p">()</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>            <span class="n">pool</span><span class="o">.</span><span class="n">join</span><span class="p">()</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>            <span class="n">stop_event</span><span class="o">.</span><span class="n">set</span><span class="p">()</span>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>            <span class="n">monitor_thread</span><span class="o">.</span><span class="n">join</span><span class="p">()</span>
+</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>            <span class="k">raise</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>        <span class="k">finally</span><span class="p">:</span>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>            <span class="n">stop_event</span><span class="o">.</span><span class="n">set</span><span class="p">()</span>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>            <span class="n">monitor_thread</span><span class="o">.</span><span class="n">join</span><span class="p">()</span>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>        <span class="n">minhashes</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="n">result</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">results</span><span class="p">):</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>                <span class="n">mh</span> <span class="o">=</span> <span class="n">result</span><span class="o">.</span><span class="n">get</span><span class="p">()</span>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>                <span class="k">if</span> <span class="n">mh</span><span class="p">:</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>                    <span class="n">minhashes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">mh</span><span class="p">)</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;MinHash from thread </span><span class="si">%d</span><span class="s2"> collected.&quot;</span><span class="p">,</span> <span class="n">idx</span><span class="p">)</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>            <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error retrieving MinHash from thread </span><span class="si">%d</span><span class="s2">: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">idx</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">minhashes</span><span class="p">:</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No MinHashes were generated.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>        <span class="c1"># Merge all MinHashes into one</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>        <span class="n">mh_full</span> <span class="o">=</span> <span class="n">minhashes</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a>        <span class="k">for</span> <span class="n">mh</span> <span class="ow">in</span> <span class="n">minhashes</span><span class="p">[</span><span class="mi">1</span><span class="p">:]:</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>            <span class="n">mh_full</span><span class="o">.</span><span class="n">merge</span><span class="p">(</span><span class="n">mh</span><span class="p">)</span>
+</span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>        <span class="n">signature</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh_full</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">sample_name</span><span class="p">)</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Sketching completed for sample: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sample_name</span><span class="p">)</span>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>        <span class="k">return</span> <span class="n">signature</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a>    <span class="k">def</span> <span class="nf">sample_sketch</span><span class="p">(</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>        <span class="n">sample_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>        <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>        <span class="n">num_processes</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>        <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>        <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>        <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>        <span class="o">**</span><span class="n">kwargs</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">:</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a><span class="sd">        Generate a sketch for a sample and return its signature.</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a><span class="sd">            sample_name (str): Name of the sample.</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a><span class="sd">            filename (str): Path to the input FASTA file.</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a><span class="sd">            num_processes (int): Number of processes to use.</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a><span class="sd">            batch_size (int): Batch size for processing.</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a><span class="sd">            ksize (int): K-mer size.</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="sd">            scale (int): Scaling factor.</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a><span class="sd">            **kwargs (Any): Additional keyword arguments.</span>
+</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="sd">            sourmash.SourmashSignature: The generated signature.</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a><span class="sd">            RuntimeError: If an error occurs during sketching.</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Starting sample sketch for: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sample_name</span><span class="p">)</span>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>            <span class="n">signature</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sketch_sample</span><span class="p">(</span>
+</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>                <span class="n">sample_name</span><span class="o">=</span><span class="n">sample_name</span><span class="p">,</span>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>                <span class="n">fasta_file</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>                <span class="n">num_processes</span><span class="o">=</span><span class="n">num_processes</span><span class="p">,</span>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>                <span class="n">batch_size</span><span class="o">=</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>                <span class="n">k_size</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>                <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>                <span class="o">**</span><span class="n">kwargs</span><span class="p">,</span>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>            <span class="p">)</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Sample sketch completed for: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sample_name</span><span class="p">)</span>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>            <span class="k">return</span> <span class="n">signature</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>                <span class="s2">&quot;Error occurred during sample sketching: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">str</span><span class="p">(</span><span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>            <span class="p">)</span>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>            <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Error occurred during sample sketching.&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">e</span>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>    <span class="c1"># *******************************</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>    <span class="c1"># *      Genome Sketching       *</span>
+</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>    <span class="c1"># *******************************</span>
+</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>
+</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>    <span class="k">def</span> <span class="nf">parse_fasta_header</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">header</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a><span class="sd">        Parse a FASTA header and categorize the sequence type.</span>
+</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>
+</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a><span class="sd">            header (str): The FASTA header string.</span>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">            Tuple[str, str]: A tuple containing the sequence type and name.</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>        <span class="n">full_header</span> <span class="o">=</span> <span class="n">header</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>        <span class="n">header_lower</span> <span class="o">=</span> <span class="n">full_header</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>        <span class="k">if</span> <span class="n">header_lower</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;&gt;&quot;</span><span class="p">):</span>
+</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>            <span class="n">header_lower</span> <span class="o">=</span> <span class="n">header_lower</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>            <span class="n">full_header</span> <span class="o">=</span> <span class="n">full_header</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>        <span class="n">seq_type</span> <span class="o">=</span> <span class="s2">&quot;unknown&quot;</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>        <span class="n">name</span> <span class="o">=</span> <span class="s2">&quot;unknown&quot;</span>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>        <span class="n">patterns</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>            <span class="s2">&quot;scaffold&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\b(scaffold|unplaced|unlocalized)\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>            <span class="s2">&quot;contig&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\bcontig\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>            <span class="s2">&quot;mitochondrial DNA&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\b(mt|mitochondrion|mitochondrial|mitochondria|mito|mtdna)\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>            <span class="s2">&quot;chloroplast DNA&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\b(chloroplast|cpdna|plastid)\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>            <span class="s2">&quot;plasmid&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\bplasmid\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>            <span class="s2">&quot;chromosome&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\bchromosome\b|\bchr\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>            <span class="s2">&quot;reference chromosome&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;NC_\d</span><span class="si">{6}</span><span class="s2">\.\d+&quot;</span><span class="p">),</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>        <span class="p">}</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>        <span class="k">for</span> <span class="n">stype</span><span class="p">,</span> <span class="n">pattern</span> <span class="ow">in</span> <span class="n">patterns</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>            <span class="k">if</span> <span class="n">pattern</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="n">header_lower</span><span class="p">):</span>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>                <span class="k">if</span> <span class="n">stype</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;scaffold&quot;</span><span class="p">,</span> <span class="s2">&quot;contig&quot;</span><span class="p">,</span> <span class="s2">&quot;plasmid&quot;</span><span class="p">}:</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>                    <span class="n">match</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">match</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;(\S+)&quot;</span><span class="p">,</span> <span class="n">full_header</span><span class="p">)</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>                    <span class="n">name</span> <span class="o">=</span> <span class="n">match</span><span class="o">.</span><span class="n">group</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span> <span class="k">if</span> <span class="n">match</span> <span class="k">else</span> <span class="s2">&quot;unknown&quot;</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>                <span class="k">elif</span> <span class="n">stype</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;mitochondrial DNA&quot;</span><span class="p">,</span> <span class="s2">&quot;chloroplast DNA&quot;</span><span class="p">}:</span>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>                    <span class="n">name</span> <span class="o">=</span> <span class="n">stype</span><span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>                <span class="k">elif</span> <span class="n">stype</span> <span class="o">==</span> <span class="s2">&quot;chromosome&quot;</span><span class="p">:</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>                    <span class="n">match</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;(?:chromosome|chr)[_\s]*([^\s,]+)&quot;</span><span class="p">,</span> <span class="n">header_lower</span><span class="p">)</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>                    <span class="k">if</span> <span class="n">match</span><span class="p">:</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>                        <span class="n">name</span> <span class="o">=</span> <span class="n">match</span><span class="o">.</span><span class="n">group</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">rstrip</span><span class="p">(</span><span class="s2">&quot;.,&quot;</span><span class="p">)</span>
+</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>                        <span class="k">if</span> <span class="n">name</span><span class="o">.</span><span class="n">upper</span><span class="p">()</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;X&quot;</span><span class="p">,</span> <span class="s2">&quot;Y&quot;</span><span class="p">,</span> <span class="s2">&quot;W&quot;</span><span class="p">,</span> <span class="s2">&quot;Z&quot;</span><span class="p">}:</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>                            <span class="n">stype</span> <span class="o">=</span> <span class="s2">&quot;sex&quot;</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>                        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>                            <span class="n">stype</span> <span class="o">=</span> <span class="s2">&quot;autosome&quot;</span>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>                <span class="k">elif</span> <span class="n">stype</span> <span class="o">==</span> <span class="s2">&quot;reference chromosome&quot;</span><span class="p">:</span>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>                    <span class="n">match</span> <span class="o">=</span> <span class="n">pattern</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="n">full_header</span><span class="p">)</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>                    <span class="k">if</span> <span class="n">match</span> <span class="ow">and</span> <span class="ow">not</span> <span class="p">(</span><span class="n">patterns</span><span class="p">[</span><span class="s2">&quot;scaffold&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="n">header_lower</span><span class="p">)</span> <span class="ow">or</span> <span class="n">patterns</span><span class="p">[</span><span class="s2">&quot;contig&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="n">header_lower</span><span class="p">)):</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>                        <span class="n">name</span> <span class="o">=</span> <span class="n">match</span><span class="o">.</span><span class="n">group</span><span class="p">()</span>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>                <span class="k">return</span> <span class="n">stype</span><span class="p">,</span> <span class="n">name</span>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>        <span class="k">return</span> <span class="n">seq_type</span><span class="p">,</span> <span class="n">name</span>
+</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>
+</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>    <span class="k">def</span> <span class="nf">parallel_genome_sketching</span><span class="p">(</span>
+</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>        <span class="n">fasta_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>        <span class="n">cores</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>        <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span>
+</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>        <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10_000</span><span class="p">,</span>
+</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>        <span class="n">assigned_genome_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;full_genome&quot;</span><span class="p">,</span>
+</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>        <span class="o">**</span><span class="n">kwargs</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">]]:</span>
+</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a><span class="sd">        Perform parallel genome sketching from a FASTA file.</span>
+</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>
+</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a><span class="sd">            fasta_file (str): Path to the FASTA file.</span>
+</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a><span class="sd">            cores (int, optional): Number of parallel cores. Defaults to 1.</span>
+</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a><span class="sd">            ksize (int, optional): K-mer size. Defaults to 51.</span>
+</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a><span class="sd">            scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.</span>
+</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a><span class="sd">            assigned_genome_name (str, optional): Name for the genome signature. Defaults to &quot;full_genome&quot;.</span>
+</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a><span class="sd">            **kwargs (Any): Additional keyword arguments.</span>
+</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>
+</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a><span class="sd">            Tuple[sourmash.SourmashSignature, Dict[str, sourmash.SourmashSignature]]:</span>
+</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a><span class="sd">                The full genome signature and a dictionary of chromosome signatures.</span>
+</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Starting parallel genome sketching with </span><span class="si">%d</span><span class="s2"> cores.&quot;</span><span class="p">,</span> <span class="n">cores</span><span class="p">)</span>
+</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>        <span class="n">fa_reader</span> <span class="o">=</span> <span class="n">SequenceReader</span><span class="p">(</span><span class="n">fasta_file</span><span class="p">,</span> <span class="n">comment</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>        <span class="n">mh_full</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">)</span>
+</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>        <span class="n">chr_to_mh</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>
+</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>        <span class="n">mh_lock</span> <span class="o">=</span> <span class="n">threading</span><span class="o">.</span><span class="n">Lock</span><span class="p">()</span>
+</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>        <span class="n">chr_lock</span> <span class="o">=</span> <span class="n">threading</span><span class="o">.</span><span class="n">Lock</span><span class="p">()</span>
+</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>
+</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>        <span class="k">def</span> <span class="nf">process_sequence</span><span class="p">(</span>
+</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a>            <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">seq</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">comment</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>
+</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>        <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>            <span class="n">header</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> </span><span class="si">{</span><span class="n">comment</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">comment</span> <span class="k">else</span> <span class="n">name</span>
+</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>            <span class="n">seq_type</span><span class="p">,</span> <span class="n">seq_name</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">parse_fasta_header</span><span class="p">(</span><span class="n">header</span><span class="p">)</span>
+</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a>            <span class="n">current_mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>            <span class="n">current_mh</span><span class="o">.</span><span class="n">add_sequence</span><span class="p">(</span><span class="n">seq</span><span class="p">,</span> <span class="n">force</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a>
+</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a>            <span class="k">with</span> <span class="n">mh_lock</span><span class="p">:</span>
+</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>                <span class="n">mh_full</span><span class="o">.</span><span class="n">merge</span><span class="p">(</span><span class="n">current_mh</span><span class="p">)</span>
+</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>
+</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a>            <span class="k">if</span> <span class="n">seq_type</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;sex&quot;</span><span class="p">,</span> <span class="s2">&quot;autosome&quot;</span><span class="p">}:</span>
+</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a>                <span class="k">with</span> <span class="n">chr_lock</span><span class="p">:</span>
+</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a>                    <span class="n">key</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">seq_type</span><span class="si">}</span><span class="s2">-</span><span class="si">{</span><span class="n">seq_name</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>                    <span class="k">if</span> <span class="n">key</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">chr_to_mh</span><span class="p">:</span>
+</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>                        <span class="n">chr_to_mh</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">=</span> <span class="n">current_mh</span>
+</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>                        <span class="n">chr_to_mh</span><span class="p">[</span><span class="n">key</span><span class="p">]</span><span class="o">.</span><span class="n">merge</span><span class="p">(</span><span class="n">current_mh</span><span class="p">)</span>
+</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>
+</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>            <span class="k">with</span> <span class="n">concurrent</span><span class="o">.</span><span class="n">futures</span><span class="o">.</span><span class="n">ThreadPoolExecutor</span><span class="p">(</span><span class="n">max_workers</span><span class="o">=</span><span class="n">cores</span><span class="p">)</span> <span class="k">as</span> <span class="n">executor</span><span class="p">:</span>
+</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>                <span class="n">futures</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>                    <span class="n">executor</span><span class="o">.</span><span class="n">submit</span><span class="p">(</span>
+</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>                        <span class="n">process_sequence</span><span class="p">,</span>
+</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>                        <span class="n">name</span><span class="p">,</span>
+</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>                        <span class="n">seq</span><span class="p">,</span>
+</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>                        <span class="n">comment</span>
+</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>                    <span class="p">)</span>
+</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>                    <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">seq</span><span class="p">,</span> <span class="n">comment</span> <span class="ow">in</span> <span class="n">fa_reader</span>
+</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>                <span class="p">]</span>
+</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>
+</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>                <span class="k">for</span> <span class="n">future</span> <span class="ow">in</span> <span class="n">concurrent</span><span class="o">.</span><span class="n">futures</span><span class="o">.</span><span class="n">as_completed</span><span class="p">(</span><span class="n">futures</span><span class="p">):</span>
+</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>                    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>                        <span class="n">future</span><span class="o">.</span><span class="n">result</span><span class="p">()</span>
+</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>                    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error processing sequence: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>
+</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error during parallel genome sketching: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>            <span class="k">raise</span>
+</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>
+</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>        <span class="n">mh_full_signature</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh_full</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">assigned_genome_name</span><span class="p">)</span>
+</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>        <span class="n">chr_signatures</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>            <span class="n">name</span><span class="p">:</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">)</span>
+</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>            <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">mh</span> <span class="ow">in</span> <span class="n">chr_to_mh</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>        <span class="p">}</span>
+</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>
+</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Parallel genome sketching completed.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>        <span class="k">return</span> <span class="n">mh_full_signature</span><span class="p">,</span> <span class="n">chr_signatures</span>
+</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>
+</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>    <span class="k">def</span> <span class="nf">amplicon_sketching</span><span class="p">(</span>
+</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>        <span class="n">fasta_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>        <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span>
+</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>        <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10_000</span><span class="p">,</span>
+</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>        <span class="n">amplicon_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;amplicon&quot;</span><span class="p">,</span>
+</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">:</span>
+</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a><span class="sd">        Create a FracMinHash sketch for an amplicon.</span>
+</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>
+</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a><span class="sd">            fasta_file (str): Path to the FASTA file.</span>
+</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a><span class="sd">            ksize (int, optional): K-mer size. Defaults to 51.</span>
+</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a><span class="sd">            scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.</span>
+</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a><span class="sd">            amplicon_name (str, optional): Name of the amplicon. Defaults to &quot;amplicon&quot;.</span>
+</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>
+</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a><span class="sd">            sourmash.SourmashSignature: The resulting amplicon signature.</span>
+</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Starting amplicon sketching for: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">amplicon_name</span><span class="p">)</span>
+</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>            <span class="n">fa_reader</span> <span class="o">=</span> <span class="n">SequenceReader</span><span class="p">(</span><span class="n">fasta_file</span><span class="p">)</span>
+</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a>            <span class="n">mh_full</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">)</span>
+</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>            <span class="k">for</span> <span class="n">_</span><span class="p">,</span> <span class="n">seq</span> <span class="ow">in</span> <span class="n">fa_reader</span><span class="p">:</span>
+</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>                <span class="n">mh_full</span><span class="o">.</span><span class="n">add_sequence</span><span class="p">(</span><span class="n">seq</span><span class="p">,</span> <span class="n">force</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>
+</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>            <span class="n">amplicon_sig</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh_full</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">amplicon_name</span><span class="p">)</span>
+</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Amplicon sketching completed for: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">amplicon_name</span><span class="p">)</span>
+</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>            <span class="k">return</span> <span class="n">amplicon_sig</span>
+</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>
+</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error during amplicon sketching: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>            <span class="k">raise</span>
+</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a>
+</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a>    <span class="c1"># *******************************</span>
+</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>    <span class="c1"># *        Exporting            *</span>
+</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>    <span class="c1"># *******************************</span>
+</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>
+</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>    <span class="k">def</span> <span class="nf">export_sigs_to_zip</span><span class="p">(</span>
+</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>        <span class="n">sigs</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">],</span> <span class="n">output_file</span><span class="p">:</span> <span class="nb">str</span>
+</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a><span class="sd">        Export a list of signatures to a ZIP file.</span>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a><span class="sd">        Args:</span>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a><span class="sd">            sigs (List[sourmash.SourmashSignature]): List of Sourmash signatures.</span>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a><span class="sd">            output_file (str): Path to the output ZIP file.</span>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>
+</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a><span class="sd">            ValueError: If the output file does not have a .zip extension.</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a><span class="sd">            FileExistsError: If the output file already exists.</span>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">output_file</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s2">&quot;.zip&quot;</span><span class="p">):</span>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Output file must have a .zip extension.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>        <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">output_file</span><span class="p">):</span> 
+</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>            <span class="k">raise</span> <span class="ne">FileExistsError</span><span class="p">(</span><span class="s2">&quot;Output file already exists.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>            <span class="k">with</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">save_load</span><span class="o">.</span><span class="n">SaveSignatures_ZipFile</span><span class="p">(</span><span class="n">output_file</span><span class="p">)</span> <span class="k">as</span> <span class="n">save_sigs</span><span class="p">:</span>
+</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>                <span class="k">for</span> <span class="n">signature</span> <span class="ow">in</span> <span class="n">sigs</span><span class="p">:</span>
+</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>                    <span class="n">save_sigs</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">signature</span><span class="p">)</span>
+</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a>            <span class="n">logging</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Failed to export signatures to zip: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>            <span class="k">raise</span>
+</span></code></pre></div></td></tr></table></div>
+              </details>
+
+
+
+  <div class="doc doc-children">
+
+
+
+
+
+
+
+
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.sketch.SnipeSketch.__init__" class="doc doc-heading">
+            <code class="highlight language-python"><span class="fm">__init__</span><span class="p">(</span><span class="n">enable_logging</span><span class="p">)</span></code>
+
+<a href="#snipe.api.sketch.SnipeSketch.__init__" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Initialize the SnipeSketch instance.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                <code>enable_logging</code>
+            </td>
+            <td>
+                  <code>bool</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Flag to enable or disable logging.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/sketch.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-25">25</a></span>
+<span class="normal"><a href="#__codelineno-0-26">26</a></span>
+<span class="normal"><a href="#__codelineno-0-27">27</a></span>
+<span class="normal"><a href="#__codelineno-0-28">28</a></span>
+<span class="normal"><a href="#__codelineno-0-29">29</a></span>
+<span class="normal"><a href="#__codelineno-0-30">30</a></span>
+<span class="normal"><a href="#__codelineno-0-31">31</a></span>
+<span class="normal"><a href="#__codelineno-0-32">32</a></span>
+<span class="normal"><a href="#__codelineno-0-33">33</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">    Initialize the SnipeSketch instance.</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">    Args:</span>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a><span class="sd">        enable_logging (bool): Flag to enable or disable logging.</span>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_configure_logging</span><span class="p">(</span><span class="n">enable_logging</span><span class="p">)</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.sketch.SnipeSketch.amplicon_sketching" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">amplicon_sketching</span><span class="p">(</span><span class="n">fasta_file</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="mi">51</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">10000</span><span class="p">,</span> <span class="n">amplicon_name</span><span class="o">=</span><span class="s1">&#39;amplicon&#39;</span><span class="p">)</span></code>
+
+<a href="#snipe.api.sketch.SnipeSketch.amplicon_sketching" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Create a FracMinHash sketch for an amplicon.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                <code>fasta_file</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Path to the FASTA file.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>ksize</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>K-mer size. Defaults to 51.</p>
+              </div>
+            </td>
+            <td>
+                  <code>51</code>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>scale</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Scaling factor for MinHash. Defaults to 10_000.</p>
+              </div>
+            </td>
+            <td>
+                  <code>10000</code>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>amplicon_name</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Name of the amplicon. Defaults to "amplicon".</p>
+              </div>
+            </td>
+            <td>
+                  <code>&#39;amplicon&#39;</code>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+
+    <p><span class="doc-section-title">Returns:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Type</th>
+          <th>Description</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                  <code>SourmashSignature</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>sourmash.SourmashSignature: The resulting amplicon signature.</p>
+              </div>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/sketch.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-459">459</a></span>
+<span class="normal"><a href="#__codelineno-0-460">460</a></span>
+<span class="normal"><a href="#__codelineno-0-461">461</a></span>
+<span class="normal"><a href="#__codelineno-0-462">462</a></span>
+<span class="normal"><a href="#__codelineno-0-463">463</a></span>
+<span class="normal"><a href="#__codelineno-0-464">464</a></span>
+<span class="normal"><a href="#__codelineno-0-465">465</a></span>
+<span class="normal"><a href="#__codelineno-0-466">466</a></span>
+<span class="normal"><a href="#__codelineno-0-467">467</a></span>
+<span class="normal"><a href="#__codelineno-0-468">468</a></span>
+<span class="normal"><a href="#__codelineno-0-469">469</a></span>
+<span class="normal"><a href="#__codelineno-0-470">470</a></span>
+<span class="normal"><a href="#__codelineno-0-471">471</a></span>
+<span class="normal"><a href="#__codelineno-0-472">472</a></span>
+<span class="normal"><a href="#__codelineno-0-473">473</a></span>
+<span class="normal"><a href="#__codelineno-0-474">474</a></span>
+<span class="normal"><a href="#__codelineno-0-475">475</a></span>
+<span class="normal"><a href="#__codelineno-0-476">476</a></span>
+<span class="normal"><a href="#__codelineno-0-477">477</a></span>
+<span class="normal"><a href="#__codelineno-0-478">478</a></span>
+<span class="normal"><a href="#__codelineno-0-479">479</a></span>
+<span class="normal"><a href="#__codelineno-0-480">480</a></span>
+<span class="normal"><a href="#__codelineno-0-481">481</a></span>
+<span class="normal"><a href="#__codelineno-0-482">482</a></span>
+<span class="normal"><a href="#__codelineno-0-483">483</a></span>
+<span class="normal"><a href="#__codelineno-0-484">484</a></span>
+<span class="normal"><a href="#__codelineno-0-485">485</a></span>
+<span class="normal"><a href="#__codelineno-0-486">486</a></span>
+<span class="normal"><a href="#__codelineno-0-487">487</a></span>
+<span class="normal"><a href="#__codelineno-0-488">488</a></span>
+<span class="normal"><a href="#__codelineno-0-489">489</a></span>
+<span class="normal"><a href="#__codelineno-0-490">490</a></span>
+<span class="normal"><a href="#__codelineno-0-491">491</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a><span class="k">def</span> <span class="nf">amplicon_sketching</span><span class="p">(</span>
+</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>    <span class="n">fasta_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>    <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span>
+</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>    <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10_000</span><span class="p">,</span>
+</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>    <span class="n">amplicon_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;amplicon&quot;</span><span class="p">,</span>
+</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">:</span>
+</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a><span class="sd">    Create a FracMinHash sketch for an amplicon.</span>
+</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>
+</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a><span class="sd">    Args:</span>
+</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a><span class="sd">        fasta_file (str): Path to the FASTA file.</span>
+</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a><span class="sd">        ksize (int, optional): K-mer size. Defaults to 51.</span>
+</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a><span class="sd">        scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.</span>
+</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a><span class="sd">        amplicon_name (str, optional): Name of the amplicon. Defaults to &quot;amplicon&quot;.</span>
+</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>
+</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a><span class="sd">        sourmash.SourmashSignature: The resulting amplicon signature.</span>
+</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Starting amplicon sketching for: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">amplicon_name</span><span class="p">)</span>
+</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>        <span class="n">fa_reader</span> <span class="o">=</span> <span class="n">SequenceReader</span><span class="p">(</span><span class="n">fasta_file</span><span class="p">)</span>
+</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a>        <span class="n">mh_full</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">)</span>
+</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>        <span class="k">for</span> <span class="n">_</span><span class="p">,</span> <span class="n">seq</span> <span class="ow">in</span> <span class="n">fa_reader</span><span class="p">:</span>
+</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>            <span class="n">mh_full</span><span class="o">.</span><span class="n">add_sequence</span><span class="p">(</span><span class="n">seq</span><span class="p">,</span> <span class="n">force</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>
+</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>        <span class="n">amplicon_sig</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh_full</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">amplicon_name</span><span class="p">)</span>
+</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Amplicon sketching completed for: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">amplicon_name</span><span class="p">)</span>
+</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>        <span class="k">return</span> <span class="n">amplicon_sig</span>
+</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>
+</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error during amplicon sketching: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>        <span class="k">raise</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.sketch.SnipeSketch.export_sigs_to_zip" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">export_sigs_to_zip</span><span class="p">(</span><span class="n">sigs</span><span class="p">,</span> <span class="n">output_file</span><span class="p">)</span></code>
+
+  <span class="doc doc-labels">
+      <small class="doc doc-label doc-label-staticmethod"><code>staticmethod</code></small>
+  </span>
+
+<a href="#snipe.api.sketch.SnipeSketch.export_sigs_to_zip" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Export a list of signatures to a ZIP file.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                <code>sigs</code>
+            </td>
+            <td>
+                  <code>List[SourmashSignature]</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>List of Sourmash signatures.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>output_file</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Path to the output ZIP file.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+
+<p><span class="doc-section-title">Raises:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Type</th>
+          <th>Description</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                  <code>ValueError</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>If the output file does not have a .zip extension.</p>
+              </div>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                  <code>FileExistsError</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>If the output file already exists.</p>
+              </div>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/sketch.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-497">497</a></span>
+<span class="normal"><a href="#__codelineno-0-498">498</a></span>
+<span class="normal"><a href="#__codelineno-0-499">499</a></span>
+<span class="normal"><a href="#__codelineno-0-500">500</a></span>
+<span class="normal"><a href="#__codelineno-0-501">501</a></span>
+<span class="normal"><a href="#__codelineno-0-502">502</a></span>
+<span class="normal"><a href="#__codelineno-0-503">503</a></span>
+<span class="normal"><a href="#__codelineno-0-504">504</a></span>
+<span class="normal"><a href="#__codelineno-0-505">505</a></span>
+<span class="normal"><a href="#__codelineno-0-506">506</a></span>
+<span class="normal"><a href="#__codelineno-0-507">507</a></span>
+<span class="normal"><a href="#__codelineno-0-508">508</a></span>
+<span class="normal"><a href="#__codelineno-0-509">509</a></span>
+<span class="normal"><a href="#__codelineno-0-510">510</a></span>
+<span class="normal"><a href="#__codelineno-0-511">511</a></span>
+<span class="normal"><a href="#__codelineno-0-512">512</a></span>
+<span class="normal"><a href="#__codelineno-0-513">513</a></span>
+<span class="normal"><a href="#__codelineno-0-514">514</a></span>
+<span class="normal"><a href="#__codelineno-0-515">515</a></span>
+<span class="normal"><a href="#__codelineno-0-516">516</a></span>
+<span class="normal"><a href="#__codelineno-0-517">517</a></span>
+<span class="normal"><a href="#__codelineno-0-518">518</a></span>
+<span class="normal"><a href="#__codelineno-0-519">519</a></span>
+<span class="normal"><a href="#__codelineno-0-520">520</a></span>
+<span class="normal"><a href="#__codelineno-0-521">521</a></span>
+<span class="normal"><a href="#__codelineno-0-522">522</a></span>
+<span class="normal"><a href="#__codelineno-0-523">523</a></span>
+<span class="normal"><a href="#__codelineno-0-524">524</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a><span class="k">def</span> <span class="nf">export_sigs_to_zip</span><span class="p">(</span>
+</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>    <span class="n">sigs</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">],</span> <span class="n">output_file</span><span class="p">:</span> <span class="nb">str</span>
+</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a><span class="sd">    Export a list of signatures to a ZIP file.</span>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a><span class="sd">    Args:</span>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a><span class="sd">        sigs (List[sourmash.SourmashSignature]): List of Sourmash signatures.</span>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a><span class="sd">        output_file (str): Path to the output ZIP file.</span>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>
+</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a><span class="sd">        ValueError: If the output file does not have a .zip extension.</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a><span class="sd">        FileExistsError: If the output file already exists.</span>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">output_file</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s2">&quot;.zip&quot;</span><span class="p">):</span>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Output file must have a .zip extension.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a>    <span class="k">if</span> <span class="n">os</span><span class="o">.</span><span class="n">path</span><span class="o">.</span><span class="n">exists</span><span class="p">(</span><span class="n">output_file</span><span class="p">):</span> 
+</span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>        <span class="k">raise</span> <span class="ne">FileExistsError</span><span class="p">(</span><span class="s2">&quot;Output file already exists.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>        <span class="k">with</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">save_load</span><span class="o">.</span><span class="n">SaveSignatures_ZipFile</span><span class="p">(</span><span class="n">output_file</span><span class="p">)</span> <span class="k">as</span> <span class="n">save_sigs</span><span class="p">:</span>
+</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a>            <span class="k">for</span> <span class="n">signature</span> <span class="ow">in</span> <span class="n">sigs</span><span class="p">:</span>
+</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>                <span class="n">save_sigs</span><span class="o">.</span><span class="n">add</span><span class="p">(</span><span class="n">signature</span><span class="p">)</span>
+</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a>        <span class="n">logging</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Failed to export signatures to zip: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>        <span class="k">raise</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.sketch.SnipeSketch.parallel_genome_sketching" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">parallel_genome_sketching</span><span class="p">(</span><span class="n">fasta_file</span><span class="p">,</span> <span class="n">cores</span><span class="o">=</span><span class="mi">1</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="mi">51</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">10000</span><span class="p">,</span> <span class="n">assigned_genome_name</span><span class="o">=</span><span class="s1">&#39;full_genome&#39;</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></code>
+
+<a href="#snipe.api.sketch.SnipeSketch.parallel_genome_sketching" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Perform parallel genome sketching from a FASTA file.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                <code>fasta_file</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Path to the FASTA file.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>cores</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Number of parallel cores. Defaults to 1.</p>
+              </div>
+            </td>
+            <td>
+                  <code>1</code>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>ksize</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>K-mer size. Defaults to 51.</p>
+              </div>
+            </td>
+            <td>
+                  <code>51</code>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>scale</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Scaling factor for MinHash. Defaults to 10_000.</p>
+              </div>
+            </td>
+            <td>
+                  <code>10000</code>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>assigned_genome_name</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Name for the genome signature. Defaults to "full_genome".</p>
+              </div>
+            </td>
+            <td>
+                  <code>&#39;full_genome&#39;</code>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>**kwargs</code>
+            </td>
+            <td>
+                  <code>Any</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Additional keyword arguments.</p>
+              </div>
+            </td>
+            <td>
+                  <code>{}</code>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+
+    <p><span class="doc-section-title">Returns:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Type</th>
+          <th>Description</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                  <code>Tuple[SourmashSignature, Dict[str, SourmashSignature]]</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Tuple[sourmash.SourmashSignature, Dict[str, sourmash.SourmashSignature]]:
+The full genome signature and a dictionary of chromosome signatures.</p>
+              </div>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/sketch.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-377">377</a></span>
+<span class="normal"><a href="#__codelineno-0-378">378</a></span>
+<span class="normal"><a href="#__codelineno-0-379">379</a></span>
+<span class="normal"><a href="#__codelineno-0-380">380</a></span>
+<span class="normal"><a href="#__codelineno-0-381">381</a></span>
+<span class="normal"><a href="#__codelineno-0-382">382</a></span>
+<span class="normal"><a href="#__codelineno-0-383">383</a></span>
+<span class="normal"><a href="#__codelineno-0-384">384</a></span>
+<span class="normal"><a href="#__codelineno-0-385">385</a></span>
+<span class="normal"><a href="#__codelineno-0-386">386</a></span>
+<span class="normal"><a href="#__codelineno-0-387">387</a></span>
+<span class="normal"><a href="#__codelineno-0-388">388</a></span>
+<span class="normal"><a href="#__codelineno-0-389">389</a></span>
+<span class="normal"><a href="#__codelineno-0-390">390</a></span>
+<span class="normal"><a href="#__codelineno-0-391">391</a></span>
+<span class="normal"><a href="#__codelineno-0-392">392</a></span>
+<span class="normal"><a href="#__codelineno-0-393">393</a></span>
+<span class="normal"><a href="#__codelineno-0-394">394</a></span>
+<span class="normal"><a href="#__codelineno-0-395">395</a></span>
+<span class="normal"><a href="#__codelineno-0-396">396</a></span>
+<span class="normal"><a href="#__codelineno-0-397">397</a></span>
+<span class="normal"><a href="#__codelineno-0-398">398</a></span>
+<span class="normal"><a href="#__codelineno-0-399">399</a></span>
+<span class="normal"><a href="#__codelineno-0-400">400</a></span>
+<span class="normal"><a href="#__codelineno-0-401">401</a></span>
+<span class="normal"><a href="#__codelineno-0-402">402</a></span>
+<span class="normal"><a href="#__codelineno-0-403">403</a></span>
+<span class="normal"><a href="#__codelineno-0-404">404</a></span>
+<span class="normal"><a href="#__codelineno-0-405">405</a></span>
+<span class="normal"><a href="#__codelineno-0-406">406</a></span>
+<span class="normal"><a href="#__codelineno-0-407">407</a></span>
+<span class="normal"><a href="#__codelineno-0-408">408</a></span>
+<span class="normal"><a href="#__codelineno-0-409">409</a></span>
+<span class="normal"><a href="#__codelineno-0-410">410</a></span>
+<span class="normal"><a href="#__codelineno-0-411">411</a></span>
+<span class="normal"><a href="#__codelineno-0-412">412</a></span>
+<span class="normal"><a href="#__codelineno-0-413">413</a></span>
+<span class="normal"><a href="#__codelineno-0-414">414</a></span>
+<span class="normal"><a href="#__codelineno-0-415">415</a></span>
+<span class="normal"><a href="#__codelineno-0-416">416</a></span>
+<span class="normal"><a href="#__codelineno-0-417">417</a></span>
+<span class="normal"><a href="#__codelineno-0-418">418</a></span>
+<span class="normal"><a href="#__codelineno-0-419">419</a></span>
+<span class="normal"><a href="#__codelineno-0-420">420</a></span>
+<span class="normal"><a href="#__codelineno-0-421">421</a></span>
+<span class="normal"><a href="#__codelineno-0-422">422</a></span>
+<span class="normal"><a href="#__codelineno-0-423">423</a></span>
+<span class="normal"><a href="#__codelineno-0-424">424</a></span>
+<span class="normal"><a href="#__codelineno-0-425">425</a></span>
+<span class="normal"><a href="#__codelineno-0-426">426</a></span>
+<span class="normal"><a href="#__codelineno-0-427">427</a></span>
+<span class="normal"><a href="#__codelineno-0-428">428</a></span>
+<span class="normal"><a href="#__codelineno-0-429">429</a></span>
+<span class="normal"><a href="#__codelineno-0-430">430</a></span>
+<span class="normal"><a href="#__codelineno-0-431">431</a></span>
+<span class="normal"><a href="#__codelineno-0-432">432</a></span>
+<span class="normal"><a href="#__codelineno-0-433">433</a></span>
+<span class="normal"><a href="#__codelineno-0-434">434</a></span>
+<span class="normal"><a href="#__codelineno-0-435">435</a></span>
+<span class="normal"><a href="#__codelineno-0-436">436</a></span>
+<span class="normal"><a href="#__codelineno-0-437">437</a></span>
+<span class="normal"><a href="#__codelineno-0-438">438</a></span>
+<span class="normal"><a href="#__codelineno-0-439">439</a></span>
+<span class="normal"><a href="#__codelineno-0-440">440</a></span>
+<span class="normal"><a href="#__codelineno-0-441">441</a></span>
+<span class="normal"><a href="#__codelineno-0-442">442</a></span>
+<span class="normal"><a href="#__codelineno-0-443">443</a></span>
+<span class="normal"><a href="#__codelineno-0-444">444</a></span>
+<span class="normal"><a href="#__codelineno-0-445">445</a></span>
+<span class="normal"><a href="#__codelineno-0-446">446</a></span>
+<span class="normal"><a href="#__codelineno-0-447">447</a></span>
+<span class="normal"><a href="#__codelineno-0-448">448</a></span>
+<span class="normal"><a href="#__codelineno-0-449">449</a></span>
+<span class="normal"><a href="#__codelineno-0-450">450</a></span>
+<span class="normal"><a href="#__codelineno-0-451">451</a></span>
+<span class="normal"><a href="#__codelineno-0-452">452</a></span>
+<span class="normal"><a href="#__codelineno-0-453">453</a></span>
+<span class="normal"><a href="#__codelineno-0-454">454</a></span>
+<span class="normal"><a href="#__codelineno-0-455">455</a></span>
+<span class="normal"><a href="#__codelineno-0-456">456</a></span>
+<span class="normal"><a href="#__codelineno-0-457">457</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a><span class="k">def</span> <span class="nf">parallel_genome_sketching</span><span class="p">(</span>
+</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>    <span class="n">fasta_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>    <span class="n">cores</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>    <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span>
+</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>    <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10_000</span><span class="p">,</span>
+</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>    <span class="n">assigned_genome_name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;full_genome&quot;</span><span class="p">,</span>
+</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>    <span class="o">**</span><span class="n">kwargs</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">]]:</span>
+</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a><span class="sd">    Perform parallel genome sketching from a FASTA file.</span>
+</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>
+</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a><span class="sd">    Args:</span>
+</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a><span class="sd">        fasta_file (str): Path to the FASTA file.</span>
+</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a><span class="sd">        cores (int, optional): Number of parallel cores. Defaults to 1.</span>
+</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a><span class="sd">        ksize (int, optional): K-mer size. Defaults to 51.</span>
+</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a><span class="sd">        scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.</span>
+</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a><span class="sd">        assigned_genome_name (str, optional): Name for the genome signature. Defaults to &quot;full_genome&quot;.</span>
+</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a><span class="sd">        **kwargs (Any): Additional keyword arguments.</span>
+</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>
+</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a><span class="sd">        Tuple[sourmash.SourmashSignature, Dict[str, sourmash.SourmashSignature]]:</span>
+</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a><span class="sd">            The full genome signature and a dictionary of chromosome signatures.</span>
+</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Starting parallel genome sketching with </span><span class="si">%d</span><span class="s2"> cores.&quot;</span><span class="p">,</span> <span class="n">cores</span><span class="p">)</span>
+</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>    <span class="n">fa_reader</span> <span class="o">=</span> <span class="n">SequenceReader</span><span class="p">(</span><span class="n">fasta_file</span><span class="p">,</span> <span class="n">comment</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>    <span class="n">mh_full</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">)</span>
+</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>    <span class="n">chr_to_mh</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>
+</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>    <span class="n">mh_lock</span> <span class="o">=</span> <span class="n">threading</span><span class="o">.</span><span class="n">Lock</span><span class="p">()</span>
+</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>    <span class="n">chr_lock</span> <span class="o">=</span> <span class="n">threading</span><span class="o">.</span><span class="n">Lock</span><span class="p">()</span>
+</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a>
+</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>    <span class="k">def</span> <span class="nf">process_sequence</span><span class="p">(</span>
+</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a>        <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">seq</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">comment</span><span class="p">:</span> <span class="n">Optional</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span>
+</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a>        <span class="n">header</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2"> </span><span class="si">{</span><span class="n">comment</span><span class="si">}</span><span class="s2">&quot;</span> <span class="k">if</span> <span class="n">comment</span> <span class="k">else</span> <span class="n">name</span>
+</span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>        <span class="n">seq_type</span><span class="p">,</span> <span class="n">seq_name</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">parse_fasta_header</span><span class="p">(</span><span class="n">header</span><span class="p">)</span>
+</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a>        <span class="n">current_mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>        <span class="n">current_mh</span><span class="o">.</span><span class="n">add_sequence</span><span class="p">(</span><span class="n">seq</span><span class="p">,</span> <span class="n">force</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a>
+</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a>        <span class="k">with</span> <span class="n">mh_lock</span><span class="p">:</span>
+</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a>            <span class="n">mh_full</span><span class="o">.</span><span class="n">merge</span><span class="p">(</span><span class="n">current_mh</span><span class="p">)</span>
+</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>
+</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a>        <span class="k">if</span> <span class="n">seq_type</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;sex&quot;</span><span class="p">,</span> <span class="s2">&quot;autosome&quot;</span><span class="p">}:</span>
+</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a>            <span class="k">with</span> <span class="n">chr_lock</span><span class="p">:</span>
+</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a>                <span class="n">key</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">seq_type</span><span class="si">}</span><span class="s2">-</span><span class="si">{</span><span class="n">seq_name</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>                <span class="k">if</span> <span class="n">key</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">chr_to_mh</span><span class="p">:</span>
+</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>                    <span class="n">chr_to_mh</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">=</span> <span class="n">current_mh</span>
+</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>                    <span class="n">chr_to_mh</span><span class="p">[</span><span class="n">key</span><span class="p">]</span><span class="o">.</span><span class="n">merge</span><span class="p">(</span><span class="n">current_mh</span><span class="p">)</span>
+</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>
+</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>        <span class="k">with</span> <span class="n">concurrent</span><span class="o">.</span><span class="n">futures</span><span class="o">.</span><span class="n">ThreadPoolExecutor</span><span class="p">(</span><span class="n">max_workers</span><span class="o">=</span><span class="n">cores</span><span class="p">)</span> <span class="k">as</span> <span class="n">executor</span><span class="p">:</span>
+</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>            <span class="n">futures</span> <span class="o">=</span> <span class="p">[</span>
+</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>                <span class="n">executor</span><span class="o">.</span><span class="n">submit</span><span class="p">(</span>
+</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>                    <span class="n">process_sequence</span><span class="p">,</span>
+</span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>                    <span class="n">name</span><span class="p">,</span>
+</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>                    <span class="n">seq</span><span class="p">,</span>
+</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>                    <span class="n">comment</span>
+</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>                <span class="p">)</span>
+</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">seq</span><span class="p">,</span> <span class="n">comment</span> <span class="ow">in</span> <span class="n">fa_reader</span>
+</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>            <span class="p">]</span>
+</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>
+</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>            <span class="k">for</span> <span class="n">future</span> <span class="ow">in</span> <span class="n">concurrent</span><span class="o">.</span><span class="n">futures</span><span class="o">.</span><span class="n">as_completed</span><span class="p">(</span><span class="n">futures</span><span class="p">):</span>
+</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>                <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>                    <span class="n">future</span><span class="o">.</span><span class="n">result</span><span class="p">()</span>
+</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>                <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error processing sequence: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>
+</span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error during parallel genome sketching: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>        <span class="k">raise</span>
+</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>
+</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>    <span class="n">mh_full_signature</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh_full</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">assigned_genome_name</span><span class="p">)</span>
+</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>    <span class="n">chr_signatures</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>        <span class="n">name</span><span class="p">:</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">)</span>
+</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">mh</span> <span class="ow">in</span> <span class="n">chr_to_mh</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>    <span class="p">}</span>
+</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>
+</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Parallel genome sketching completed.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>    <span class="k">return</span> <span class="n">mh_full_signature</span><span class="p">,</span> <span class="n">chr_signatures</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.sketch.SnipeSketch.parse_fasta_header" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">parse_fasta_header</span><span class="p">(</span><span class="n">header</span><span class="p">)</span></code>
+
+<a href="#snipe.api.sketch.SnipeSketch.parse_fasta_header" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Parse a FASTA header and categorize the sequence type.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                <code>header</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>The FASTA header string.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+
+    <p><span class="doc-section-title">Returns:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Type</th>
+          <th>Description</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                  <code>Tuple[str, str]</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Tuple[str, str]: A tuple containing the sequence type and name.</p>
+              </div>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/sketch.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-324">324</a></span>
+<span class="normal"><a href="#__codelineno-0-325">325</a></span>
+<span class="normal"><a href="#__codelineno-0-326">326</a></span>
+<span class="normal"><a href="#__codelineno-0-327">327</a></span>
+<span class="normal"><a href="#__codelineno-0-328">328</a></span>
+<span class="normal"><a href="#__codelineno-0-329">329</a></span>
+<span class="normal"><a href="#__codelineno-0-330">330</a></span>
+<span class="normal"><a href="#__codelineno-0-331">331</a></span>
+<span class="normal"><a href="#__codelineno-0-332">332</a></span>
+<span class="normal"><a href="#__codelineno-0-333">333</a></span>
+<span class="normal"><a href="#__codelineno-0-334">334</a></span>
+<span class="normal"><a href="#__codelineno-0-335">335</a></span>
+<span class="normal"><a href="#__codelineno-0-336">336</a></span>
+<span class="normal"><a href="#__codelineno-0-337">337</a></span>
+<span class="normal"><a href="#__codelineno-0-338">338</a></span>
+<span class="normal"><a href="#__codelineno-0-339">339</a></span>
+<span class="normal"><a href="#__codelineno-0-340">340</a></span>
+<span class="normal"><a href="#__codelineno-0-341">341</a></span>
+<span class="normal"><a href="#__codelineno-0-342">342</a></span>
+<span class="normal"><a href="#__codelineno-0-343">343</a></span>
+<span class="normal"><a href="#__codelineno-0-344">344</a></span>
+<span class="normal"><a href="#__codelineno-0-345">345</a></span>
+<span class="normal"><a href="#__codelineno-0-346">346</a></span>
+<span class="normal"><a href="#__codelineno-0-347">347</a></span>
+<span class="normal"><a href="#__codelineno-0-348">348</a></span>
+<span class="normal"><a href="#__codelineno-0-349">349</a></span>
+<span class="normal"><a href="#__codelineno-0-350">350</a></span>
+<span class="normal"><a href="#__codelineno-0-351">351</a></span>
+<span class="normal"><a href="#__codelineno-0-352">352</a></span>
+<span class="normal"><a href="#__codelineno-0-353">353</a></span>
+<span class="normal"><a href="#__codelineno-0-354">354</a></span>
+<span class="normal"><a href="#__codelineno-0-355">355</a></span>
+<span class="normal"><a href="#__codelineno-0-356">356</a></span>
+<span class="normal"><a href="#__codelineno-0-357">357</a></span>
+<span class="normal"><a href="#__codelineno-0-358">358</a></span>
+<span class="normal"><a href="#__codelineno-0-359">359</a></span>
+<span class="normal"><a href="#__codelineno-0-360">360</a></span>
+<span class="normal"><a href="#__codelineno-0-361">361</a></span>
+<span class="normal"><a href="#__codelineno-0-362">362</a></span>
+<span class="normal"><a href="#__codelineno-0-363">363</a></span>
+<span class="normal"><a href="#__codelineno-0-364">364</a></span>
+<span class="normal"><a href="#__codelineno-0-365">365</a></span>
+<span class="normal"><a href="#__codelineno-0-366">366</a></span>
+<span class="normal"><a href="#__codelineno-0-367">367</a></span>
+<span class="normal"><a href="#__codelineno-0-368">368</a></span>
+<span class="normal"><a href="#__codelineno-0-369">369</a></span>
+<span class="normal"><a href="#__codelineno-0-370">370</a></span>
+<span class="normal"><a href="#__codelineno-0-371">371</a></span>
+<span class="normal"><a href="#__codelineno-0-372">372</a></span>
+<span class="normal"><a href="#__codelineno-0-373">373</a></span>
+<span class="normal"><a href="#__codelineno-0-374">374</a></span>
+<span class="normal"><a href="#__codelineno-0-375">375</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a><span class="k">def</span> <span class="nf">parse_fasta_header</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">header</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">]:</span>
+</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a><span class="sd">    Parse a FASTA header and categorize the sequence type.</span>
+</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>
+</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a><span class="sd">    Args:</span>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a><span class="sd">        header (str): The FASTA header string.</span>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">        Tuple[str, str]: A tuple containing the sequence type and name.</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>    <span class="n">full_header</span> <span class="o">=</span> <span class="n">header</span><span class="o">.</span><span class="n">strip</span><span class="p">()</span>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>    <span class="n">header_lower</span> <span class="o">=</span> <span class="n">full_header</span><span class="o">.</span><span class="n">lower</span><span class="p">()</span>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>    <span class="k">if</span> <span class="n">header_lower</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;&gt;&quot;</span><span class="p">):</span>
+</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>        <span class="n">header_lower</span> <span class="o">=</span> <span class="n">header_lower</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>        <span class="n">full_header</span> <span class="o">=</span> <span class="n">full_header</span><span class="p">[</span><span class="mi">1</span><span class="p">:]</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a>    <span class="n">seq_type</span> <span class="o">=</span> <span class="s2">&quot;unknown&quot;</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>    <span class="n">name</span> <span class="o">=</span> <span class="s2">&quot;unknown&quot;</span>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>    <span class="n">patterns</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>        <span class="s2">&quot;scaffold&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\b(scaffold|unplaced|unlocalized)\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>        <span class="s2">&quot;contig&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\bcontig\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>        <span class="s2">&quot;mitochondrial DNA&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\b(mt|mitochondrion|mitochondrial|mitochondria|mito|mtdna)\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a>        <span class="s2">&quot;chloroplast DNA&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\b(chloroplast|cpdna|plastid)\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>        <span class="s2">&quot;plasmid&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\bplasmid\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>        <span class="s2">&quot;chromosome&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;\bchromosome\b|\bchr\b&quot;</span><span class="p">),</span>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>        <span class="s2">&quot;reference chromosome&quot;</span><span class="p">:</span> <span class="n">re</span><span class="o">.</span><span class="n">compile</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;NC_\d</span><span class="si">{6}</span><span class="s2">\.\d+&quot;</span><span class="p">),</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>    <span class="p">}</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>    <span class="k">for</span> <span class="n">stype</span><span class="p">,</span> <span class="n">pattern</span> <span class="ow">in</span> <span class="n">patterns</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>        <span class="k">if</span> <span class="n">pattern</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="n">header_lower</span><span class="p">):</span>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>            <span class="k">if</span> <span class="n">stype</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;scaffold&quot;</span><span class="p">,</span> <span class="s2">&quot;contig&quot;</span><span class="p">,</span> <span class="s2">&quot;plasmid&quot;</span><span class="p">}:</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>                <span class="n">match</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">match</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;(\S+)&quot;</span><span class="p">,</span> <span class="n">full_header</span><span class="p">)</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>                <span class="n">name</span> <span class="o">=</span> <span class="n">match</span><span class="o">.</span><span class="n">group</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span> <span class="k">if</span> <span class="n">match</span> <span class="k">else</span> <span class="s2">&quot;unknown&quot;</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>            <span class="k">elif</span> <span class="n">stype</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;mitochondrial DNA&quot;</span><span class="p">,</span> <span class="s2">&quot;chloroplast DNA&quot;</span><span class="p">}:</span>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>                <span class="n">name</span> <span class="o">=</span> <span class="n">stype</span><span class="o">.</span><span class="n">split</span><span class="p">()[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>            <span class="k">elif</span> <span class="n">stype</span> <span class="o">==</span> <span class="s2">&quot;chromosome&quot;</span><span class="p">:</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>                <span class="n">match</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="sa">r</span><span class="s2">&quot;(?:chromosome|chr)[_\s]*([^\s,]+)&quot;</span><span class="p">,</span> <span class="n">header_lower</span><span class="p">)</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>                <span class="k">if</span> <span class="n">match</span><span class="p">:</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>                    <span class="n">name</span> <span class="o">=</span> <span class="n">match</span><span class="o">.</span><span class="n">group</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span><span class="o">.</span><span class="n">rstrip</span><span class="p">(</span><span class="s2">&quot;.,&quot;</span><span class="p">)</span>
+</span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>                    <span class="k">if</span> <span class="n">name</span><span class="o">.</span><span class="n">upper</span><span class="p">()</span> <span class="ow">in</span> <span class="p">{</span><span class="s2">&quot;X&quot;</span><span class="p">,</span> <span class="s2">&quot;Y&quot;</span><span class="p">,</span> <span class="s2">&quot;W&quot;</span><span class="p">,</span> <span class="s2">&quot;Z&quot;</span><span class="p">}:</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>                        <span class="n">stype</span> <span class="o">=</span> <span class="s2">&quot;sex&quot;</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a>                        <span class="n">stype</span> <span class="o">=</span> <span class="s2">&quot;autosome&quot;</span>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>            <span class="k">elif</span> <span class="n">stype</span> <span class="o">==</span> <span class="s2">&quot;reference chromosome&quot;</span><span class="p">:</span>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>                <span class="n">match</span> <span class="o">=</span> <span class="n">pattern</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="n">full_header</span><span class="p">)</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>                <span class="k">if</span> <span class="n">match</span> <span class="ow">and</span> <span class="ow">not</span> <span class="p">(</span><span class="n">patterns</span><span class="p">[</span><span class="s2">&quot;scaffold&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="n">header_lower</span><span class="p">)</span> <span class="ow">or</span> <span class="n">patterns</span><span class="p">[</span><span class="s2">&quot;contig&quot;</span><span class="p">]</span><span class="o">.</span><span class="n">search</span><span class="p">(</span><span class="n">header_lower</span><span class="p">)):</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>                    <span class="n">name</span> <span class="o">=</span> <span class="n">match</span><span class="o">.</span><span class="n">group</span><span class="p">()</span>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>            <span class="k">return</span> <span class="n">stype</span><span class="p">,</span> <span class="n">name</span>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>    <span class="k">return</span> <span class="n">seq_type</span><span class="p">,</span> <span class="n">name</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.sketch.SnipeSketch.process_sequences" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">process_sequences</span><span class="p">(</span><span class="n">fasta_file</span><span class="p">,</span> <span class="n">thread_id</span><span class="p">,</span> <span class="n">total_threads</span><span class="p">,</span> <span class="n">progress_queue</span><span class="p">,</span> <span class="n">batch_size</span><span class="o">=</span><span class="mi">100000</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="mi">51</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="mi">10000</span><span class="p">)</span></code>
+
+<a href="#snipe.api.sketch.SnipeSketch.process_sequences" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Process a subset of sequences to create a FracMinHash sketch.</p>
+<p>Each process creates its own MinHash instance and processes sequences
+assigned based on the thread ID. Progress is reported via a shared queue.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                <code>fasta_file</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Path to the FASTA file.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>thread_id</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Identifier for the current thread.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>total_threads</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Total number of threads.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>progress_queue</code>
+            </td>
+            <td>
+                  <code>Queue</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Queue for reporting progress.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>batch_size</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Number of sequences per progress update. Defaults to 100_000.</p>
+              </div>
+            </td>
+            <td>
+                  <code>100000</code>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>ksize</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>K-mer size. Defaults to 51.</p>
+              </div>
+            </td>
+            <td>
+                  <code>51</code>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>scaled</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Scaling factor for MinHash. Defaults to 10_000.</p>
+              </div>
+            </td>
+            <td>
+                  <code>10000</code>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+
+    <p><span class="doc-section-title">Returns:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Type</th>
+          <th>Description</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                  <code>MinHash</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>sourmash.MinHash: The resulting FracMinHash sketch.</p>
+              </div>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/sketch.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-60"> 60</a></span>
+<span class="normal"><a href="#__codelineno-0-61"> 61</a></span>
+<span class="normal"><a href="#__codelineno-0-62"> 62</a></span>
+<span class="normal"><a href="#__codelineno-0-63"> 63</a></span>
+<span class="normal"><a href="#__codelineno-0-64"> 64</a></span>
+<span class="normal"><a href="#__codelineno-0-65"> 65</a></span>
+<span class="normal"><a href="#__codelineno-0-66"> 66</a></span>
+<span class="normal"><a href="#__codelineno-0-67"> 67</a></span>
+<span class="normal"><a href="#__codelineno-0-68"> 68</a></span>
+<span class="normal"><a href="#__codelineno-0-69"> 69</a></span>
+<span class="normal"><a href="#__codelineno-0-70"> 70</a></span>
+<span class="normal"><a href="#__codelineno-0-71"> 71</a></span>
+<span class="normal"><a href="#__codelineno-0-72"> 72</a></span>
+<span class="normal"><a href="#__codelineno-0-73"> 73</a></span>
+<span class="normal"><a href="#__codelineno-0-74"> 74</a></span>
+<span class="normal"><a href="#__codelineno-0-75"> 75</a></span>
+<span class="normal"><a href="#__codelineno-0-76"> 76</a></span>
+<span class="normal"><a href="#__codelineno-0-77"> 77</a></span>
+<span class="normal"><a href="#__codelineno-0-78"> 78</a></span>
+<span class="normal"><a href="#__codelineno-0-79"> 79</a></span>
+<span class="normal"><a href="#__codelineno-0-80"> 80</a></span>
+<span class="normal"><a href="#__codelineno-0-81"> 81</a></span>
+<span class="normal"><a href="#__codelineno-0-82"> 82</a></span>
+<span class="normal"><a href="#__codelineno-0-83"> 83</a></span>
+<span class="normal"><a href="#__codelineno-0-84"> 84</a></span>
+<span class="normal"><a href="#__codelineno-0-85"> 85</a></span>
+<span class="normal"><a href="#__codelineno-0-86"> 86</a></span>
+<span class="normal"><a href="#__codelineno-0-87"> 87</a></span>
+<span class="normal"><a href="#__codelineno-0-88"> 88</a></span>
+<span class="normal"><a href="#__codelineno-0-89"> 89</a></span>
+<span class="normal"><a href="#__codelineno-0-90"> 90</a></span>
+<span class="normal"><a href="#__codelineno-0-91"> 91</a></span>
+<span class="normal"><a href="#__codelineno-0-92"> 92</a></span>
+<span class="normal"><a href="#__codelineno-0-93"> 93</a></span>
+<span class="normal"><a href="#__codelineno-0-94"> 94</a></span>
+<span class="normal"><a href="#__codelineno-0-95"> 95</a></span>
+<span class="normal"><a href="#__codelineno-0-96"> 96</a></span>
+<span class="normal"><a href="#__codelineno-0-97"> 97</a></span>
+<span class="normal"><a href="#__codelineno-0-98"> 98</a></span>
+<span class="normal"><a href="#__codelineno-0-99"> 99</a></span>
+<span class="normal"><a href="#__codelineno-0-100">100</a></span>
+<span class="normal"><a href="#__codelineno-0-101">101</a></span>
+<span class="normal"><a href="#__codelineno-0-102">102</a></span>
+<span class="normal"><a href="#__codelineno-0-103">103</a></span>
+<span class="normal"><a href="#__codelineno-0-104">104</a></span>
+<span class="normal"><a href="#__codelineno-0-105">105</a></span>
+<span class="normal"><a href="#__codelineno-0-106">106</a></span>
+<span class="normal"><a href="#__codelineno-0-107">107</a></span>
+<span class="normal"><a href="#__codelineno-0-108">108</a></span>
+<span class="normal"><a href="#__codelineno-0-109">109</a></span>
+<span class="normal"><a href="#__codelineno-0-110">110</a></span>
+<span class="normal"><a href="#__codelineno-0-111">111</a></span>
+<span class="normal"><a href="#__codelineno-0-112">112</a></span>
+<span class="normal"><a href="#__codelineno-0-113">113</a></span>
+<span class="normal"><a href="#__codelineno-0-114">114</a></span>
+<span class="normal"><a href="#__codelineno-0-115">115</a></span>
+<span class="normal"><a href="#__codelineno-0-116">116</a></span>
+<span class="normal"><a href="#__codelineno-0-117">117</a></span>
+<span class="normal"><a href="#__codelineno-0-118">118</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a><span class="k">def</span> <span class="nf">process_sequences</span><span class="p">(</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>    <span class="n">fasta_file</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>    <span class="n">thread_id</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>    <span class="n">total_threads</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>    <span class="n">progress_queue</span><span class="p">:</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">Queue</span><span class="p">,</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">100_000</span><span class="p">,</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a>    <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>    <span class="n">scaled</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10_000</span><span class="p">,</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">:</span>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">    Process a subset of sequences to create a FracMinHash sketch.</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a><span class="sd">    Each process creates its own MinHash instance and processes sequences</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a><span class="sd">    assigned based on the thread ID. Progress is reported via a shared queue.</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a><span class="sd">    Args:</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a><span class="sd">        fasta_file (str): Path to the FASTA file.</span>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a><span class="sd">        thread_id (int): Identifier for the current thread.</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a><span class="sd">        total_threads (int): Total number of threads.</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a><span class="sd">        progress_queue (multiprocessing.Queue): Queue for reporting progress.</span>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a><span class="sd">        batch_size (int, optional): Number of sequences per progress update. Defaults to 100_000.</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a><span class="sd">        ksize (int, optional): K-mer size. Defaults to 51.</span>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a><span class="sd">        scaled (int, optional): Scaling factor for MinHash. Defaults to 10_000.</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a><span class="sd">        sourmash.MinHash: The resulting FracMinHash sketch.</span>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_register_signal_handler</span><span class="p">()</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>        <span class="n">fa_reader</span> <span class="o">=</span> <span class="n">SequenceReader</span><span class="p">(</span><span class="n">fasta_file</span><span class="p">)</span>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>        <span class="n">mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>            <span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scaled</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="kc">True</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>        <span class="p">)</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>        <span class="n">local_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>        <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">_</span><span class="p">,</span> <span class="n">seq</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">fa_reader</span><span class="p">):</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>            <span class="k">if</span> <span class="n">idx</span> <span class="o">%</span> <span class="n">total_threads</span> <span class="o">==</span> <span class="n">thread_id</span><span class="p">:</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>                <span class="n">mh</span><span class="o">.</span><span class="n">add_sequence</span><span class="p">(</span><span class="n">seq</span><span class="p">,</span> <span class="n">force</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>                <span class="n">local_count</span> <span class="o">+=</span> <span class="mi">1</span>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>                <span class="k">if</span> <span class="n">local_count</span> <span class="o">&gt;=</span> <span class="n">batch_size</span><span class="p">:</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>                    <span class="n">progress_queue</span><span class="o">.</span><span class="n">put</span><span class="p">(</span><span class="n">batch_size</span><span class="p">)</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>                    <span class="n">local_count</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>        <span class="k">if</span> <span class="n">local_count</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>            <span class="n">progress_queue</span><span class="o">.</span><span class="n">put</span><span class="p">(</span><span class="n">local_count</span><span class="p">)</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>            <span class="s2">&quot;Thread </span><span class="si">%d</span><span class="s2"> processed </span><span class="si">%d</span><span class="s2"> hashes.&quot;</span><span class="p">,</span> <span class="n">thread_id</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">mh</span><span class="p">)</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>        <span class="p">)</span>
+</span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>        <span class="k">return</span> <span class="n">mh</span>
+</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>    <span class="k">except</span> <span class="ne">KeyboardInterrupt</span><span class="p">:</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="s2">&quot;KeyboardInterrupt detected in process_sequences.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>        <span class="n">sys</span><span class="o">.</span><span class="n">exit</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error in process_sequences: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>        <span class="k">raise</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.sketch.SnipeSketch.progress_monitor" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">progress_monitor</span><span class="p">(</span><span class="n">progress_queue</span><span class="p">,</span> <span class="n">progress_interval</span><span class="p">,</span> <span class="n">total_threads</span><span class="p">,</span> <span class="n">stop_event</span><span class="p">)</span></code>
+
+<a href="#snipe.api.sketch.SnipeSketch.progress_monitor" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Monitor and display the progress of sequence processing.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                <code>progress_queue</code>
+            </td>
+            <td>
+                  <code>Queue</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Queue for receiving progress updates.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>progress_interval</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Interval for progress updates.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>total_threads</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Number of processing threads.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>stop_event</code>
+            </td>
+            <td>
+                  <code>Event</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Event to signal the monitor to stop.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/sketch.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-126">126</a></span>
+<span class="normal"><a href="#__codelineno-0-127">127</a></span>
+<span class="normal"><a href="#__codelineno-0-128">128</a></span>
+<span class="normal"><a href="#__codelineno-0-129">129</a></span>
+<span class="normal"><a href="#__codelineno-0-130">130</a></span>
+<span class="normal"><a href="#__codelineno-0-131">131</a></span>
+<span class="normal"><a href="#__codelineno-0-132">132</a></span>
+<span class="normal"><a href="#__codelineno-0-133">133</a></span>
+<span class="normal"><a href="#__codelineno-0-134">134</a></span>
+<span class="normal"><a href="#__codelineno-0-135">135</a></span>
+<span class="normal"><a href="#__codelineno-0-136">136</a></span>
+<span class="normal"><a href="#__codelineno-0-137">137</a></span>
+<span class="normal"><a href="#__codelineno-0-138">138</a></span>
+<span class="normal"><a href="#__codelineno-0-139">139</a></span>
+<span class="normal"><a href="#__codelineno-0-140">140</a></span>
+<span class="normal"><a href="#__codelineno-0-141">141</a></span>
+<span class="normal"><a href="#__codelineno-0-142">142</a></span>
+<span class="normal"><a href="#__codelineno-0-143">143</a></span>
+<span class="normal"><a href="#__codelineno-0-144">144</a></span>
+<span class="normal"><a href="#__codelineno-0-145">145</a></span>
+<span class="normal"><a href="#__codelineno-0-146">146</a></span>
+<span class="normal"><a href="#__codelineno-0-147">147</a></span>
+<span class="normal"><a href="#__codelineno-0-148">148</a></span>
+<span class="normal"><a href="#__codelineno-0-149">149</a></span>
+<span class="normal"><a href="#__codelineno-0-150">150</a></span>
+<span class="normal"><a href="#__codelineno-0-151">151</a></span>
+<span class="normal"><a href="#__codelineno-0-152">152</a></span>
+<span class="normal"><a href="#__codelineno-0-153">153</a></span>
+<span class="normal"><a href="#__codelineno-0-154">154</a></span>
+<span class="normal"><a href="#__codelineno-0-155">155</a></span>
+<span class="normal"><a href="#__codelineno-0-156">156</a></span>
+<span class="normal"><a href="#__codelineno-0-157">157</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a><span class="k">def</span> <span class="nf">progress_monitor</span><span class="p">(</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>    <span class="n">progress_queue</span><span class="p">:</span> <span class="n">multiprocessing</span><span class="o">.</span><span class="n">Queue</span><span class="p">,</span>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>    <span class="n">progress_interval</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>    <span class="n">total_threads</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>    <span class="n">stop_event</span><span class="p">:</span> <span class="n">threading</span><span class="o">.</span><span class="n">Event</span><span class="p">,</span>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a><span class="sd">    Monitor and display the progress of sequence processing.</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a><span class="sd">    Args:</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a><span class="sd">        progress_queue (multiprocessing.Queue): Queue for receiving progress updates.</span>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a><span class="sd">        progress_interval (int): Interval for progress updates.</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a><span class="sd">        total_threads (int): Number of processing threads.</span>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a><span class="sd">        stop_event (threading.Event): Event to signal the monitor to stop.</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>    <span class="n">total</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>    <span class="n">next_update</span> <span class="o">=</span> <span class="n">progress_interval</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>        <span class="k">while</span> <span class="ow">not</span> <span class="n">stop_event</span><span class="o">.</span><span class="n">is_set</span><span class="p">()</span> <span class="ow">or</span> <span class="ow">not</span> <span class="n">progress_queue</span><span class="o">.</span><span class="n">empty</span><span class="p">():</span>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>                <span class="n">count</span> <span class="o">=</span> <span class="n">progress_queue</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">timeout</span><span class="o">=</span><span class="mf">0.5</span><span class="p">)</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>                <span class="n">total</span> <span class="o">+=</span> <span class="n">count</span>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>                <span class="k">if</span> <span class="n">total</span> <span class="o">&gt;=</span> <span class="n">next_update</span><span class="p">:</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>                    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="se">\r</span><span class="s2">Processed </span><span class="si">{</span><span class="n">next_update</span><span class="si">:</span><span class="s2">,</span><span class="si">}</span><span class="s2"> sequences.&quot;</span><span class="p">,</span> <span class="n">end</span><span class="o">=</span><span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">flush</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>                    <span class="n">next_update</span> <span class="o">+=</span> <span class="n">progress_interval</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>            <span class="k">except</span> <span class="n">queue</span><span class="o">.</span><span class="n">Empty</span><span class="p">:</span>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>                <span class="k">continue</span>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Error in progress_monitor: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>    <span class="k">finally</span><span class="p">:</span>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>        <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="se">\r</span><span class="s2">Processed </span><span class="si">{</span><span class="n">total</span><span class="si">:</span><span class="s2">,</span><span class="si">}</span><span class="s2"> sequences in total.&quot;</span><span class="p">)</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+<div class="doc doc-object doc-function">
+
+
+<h3 id="snipe.api.sketch.SnipeSketch.sample_sketch" class="doc doc-heading">
+            <code class="highlight language-python"><span class="n">sample_sketch</span><span class="p">(</span><span class="n">sample_name</span><span class="p">,</span> <span class="n">filename</span><span class="p">,</span> <span class="n">num_processes</span><span class="p">,</span> <span class="n">batch_size</span><span class="p">,</span> <span class="n">ksize</span><span class="p">,</span> <span class="n">scale</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></code>
+
+<a href="#snipe.api.sketch.SnipeSketch.sample_sketch" class="headerlink" title="Permanent link">&para;</a></h3>
+
+
+    <div class="doc doc-contents ">
+
+        <p>Generate a sketch for a sample and return its signature.</p>
+
+
+<p><span class="doc-section-title">Parameters:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Name</th>
+          <th>Type</th>
+          <th>Description</th>
+          <th>Default</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                <code>sample_name</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Name of the sample.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>filename</code>
+            </td>
+            <td>
+                  <code>str</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Path to the input FASTA file.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>num_processes</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Number of processes to use.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>batch_size</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Batch size for processing.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>ksize</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>K-mer size.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>scale</code>
+            </td>
+            <td>
+                  <code>int</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Scaling factor.</p>
+              </div>
+            </td>
+            <td>
+                <em>required</em>
+            </td>
+          </tr>
+          <tr class="doc-section-item">
+            <td>
+                <code>**kwargs</code>
+            </td>
+            <td>
+                  <code>Any</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>Additional keyword arguments.</p>
+              </div>
+            </td>
+            <td>
+                  <code>{}</code>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+
+    <p><span class="doc-section-title">Returns:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Type</th>
+          <th>Description</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                  <code>SourmashSignature</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>sourmash.SourmashSignature: The generated signature.</p>
+              </div>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+
+<p><span class="doc-section-title">Raises:</span></p>
+    <table>
+      <thead>
+        <tr>
+          <th>Type</th>
+          <th>Description</th>
+        </tr>
+      </thead>
+      <tbody>
+          <tr class="doc-section-item">
+            <td>
+                  <code>RuntimeError</code>
+            </td>
+            <td>
+              <div class="doc-md-description">
+                <p>If an error occurs during sketching.</p>
+              </div>
+            </td>
+          </tr>
+      </tbody>
+    </table>
+
+            <details class="quote">
+              <summary>Source code in <code>src/snipe/api/sketch.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-273">273</a></span>
+<span class="normal"><a href="#__codelineno-0-274">274</a></span>
+<span class="normal"><a href="#__codelineno-0-275">275</a></span>
+<span class="normal"><a href="#__codelineno-0-276">276</a></span>
+<span class="normal"><a href="#__codelineno-0-277">277</a></span>
+<span class="normal"><a href="#__codelineno-0-278">278</a></span>
+<span class="normal"><a href="#__codelineno-0-279">279</a></span>
+<span class="normal"><a href="#__codelineno-0-280">280</a></span>
+<span class="normal"><a href="#__codelineno-0-281">281</a></span>
+<span class="normal"><a href="#__codelineno-0-282">282</a></span>
+<span class="normal"><a href="#__codelineno-0-283">283</a></span>
+<span class="normal"><a href="#__codelineno-0-284">284</a></span>
+<span class="normal"><a href="#__codelineno-0-285">285</a></span>
+<span class="normal"><a href="#__codelineno-0-286">286</a></span>
+<span class="normal"><a href="#__codelineno-0-287">287</a></span>
+<span class="normal"><a href="#__codelineno-0-288">288</a></span>
+<span class="normal"><a href="#__codelineno-0-289">289</a></span>
+<span class="normal"><a href="#__codelineno-0-290">290</a></span>
+<span class="normal"><a href="#__codelineno-0-291">291</a></span>
+<span class="normal"><a href="#__codelineno-0-292">292</a></span>
+<span class="normal"><a href="#__codelineno-0-293">293</a></span>
+<span class="normal"><a href="#__codelineno-0-294">294</a></span>
+<span class="normal"><a href="#__codelineno-0-295">295</a></span>
+<span class="normal"><a href="#__codelineno-0-296">296</a></span>
+<span class="normal"><a href="#__codelineno-0-297">297</a></span>
+<span class="normal"><a href="#__codelineno-0-298">298</a></span>
+<span class="normal"><a href="#__codelineno-0-299">299</a></span>
+<span class="normal"><a href="#__codelineno-0-300">300</a></span>
+<span class="normal"><a href="#__codelineno-0-301">301</a></span>
+<span class="normal"><a href="#__codelineno-0-302">302</a></span>
+<span class="normal"><a href="#__codelineno-0-303">303</a></span>
+<span class="normal"><a href="#__codelineno-0-304">304</a></span>
+<span class="normal"><a href="#__codelineno-0-305">305</a></span>
+<span class="normal"><a href="#__codelineno-0-306">306</a></span>
+<span class="normal"><a href="#__codelineno-0-307">307</a></span>
+<span class="normal"><a href="#__codelineno-0-308">308</a></span>
+<span class="normal"><a href="#__codelineno-0-309">309</a></span>
+<span class="normal"><a href="#__codelineno-0-310">310</a></span>
+<span class="normal"><a href="#__codelineno-0-311">311</a></span>
+<span class="normal"><a href="#__codelineno-0-312">312</a></span>
+<span class="normal"><a href="#__codelineno-0-313">313</a></span>
+<span class="normal"><a href="#__codelineno-0-314">314</a></span>
+<span class="normal"><a href="#__codelineno-0-315">315</a></span>
+<span class="normal"><a href="#__codelineno-0-316">316</a></span>
+<span class="normal"><a href="#__codelineno-0-317">317</a></span>
+<span class="normal"><a href="#__codelineno-0-318">318</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a><span class="k">def</span> <span class="nf">sample_sketch</span><span class="p">(</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>    <span class="bp">self</span><span class="p">,</span>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>    <span class="n">sample_name</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>    <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>    <span class="n">num_processes</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>    <span class="n">batch_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>    <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>    <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>    <span class="o">**</span><span class="n">kwargs</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">:</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a><span class="sd">    Generate a sketch for a sample and return its signature.</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a><span class="sd">    Args:</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a><span class="sd">        sample_name (str): Name of the sample.</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a><span class="sd">        filename (str): Path to the input FASTA file.</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a><span class="sd">        num_processes (int): Number of processes to use.</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a><span class="sd">        batch_size (int): Batch size for processing.</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a><span class="sd">        ksize (int): K-mer size.</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="sd">        scale (int): Scaling factor.</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a><span class="sd">        **kwargs (Any): Additional keyword arguments.</span>
+</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="sd">        sourmash.SourmashSignature: The generated signature.</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a><span class="sd">        RuntimeError: If an error occurs during sketching.</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Starting sample sketch for: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sample_name</span><span class="p">)</span>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>    <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a>        <span class="n">signature</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_sketch_sample</span><span class="p">(</span>
+</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>            <span class="n">sample_name</span><span class="o">=</span><span class="n">sample_name</span><span class="p">,</span>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a>            <span class="n">fasta_file</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>            <span class="n">num_processes</span><span class="o">=</span><span class="n">num_processes</span><span class="p">,</span>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>            <span class="n">batch_size</span><span class="o">=</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>            <span class="n">k_size</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>            <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a>            <span class="o">**</span><span class="n">kwargs</span><span class="p">,</span>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>        <span class="p">)</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">info</span><span class="p">(</span><span class="s2">&quot;Sample sketch completed for: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sample_name</span><span class="p">)</span>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>        <span class="k">return</span> <span class="n">signature</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>    <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>            <span class="s2">&quot;Error occurred during sample sketching: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">str</span><span class="p">(</span><span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>        <span class="p">)</span>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Error occurred during sample sketching.&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">e</span>
+</span></code></pre></div></td></tr></table></div>
+            </details>
+    </div>
+
+</div>
+
+
+
+  </div>
+
+    </div>
+
+</div>
+
+
+
+
+  </div>
+
+    </div>
+
+</div>
+
+
+
+
+
+
+
+  
+    
+  
+  
+    
+  
+
+
+  <aside class="md-source-file">
+    
+      
+  <span class="md-source-file__fact">
+    <span class="md-icon" title="Last update">
+      <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M21 13.1c-.1 0-.3.1-.4.2l-1 1 2.1 2.1 1-1c.2-.2.2-.6 0-.8l-1.3-1.3c-.1-.1-.2-.2-.4-.2m-1.9 1.8-6.1 6V23h2.1l6.1-6.1zM12.5 7v5.2l4 2.4-1 1L11 13V7zM11 21.9c-5.1-.5-9-4.8-9-9.9C2 6.5 6.5 2 12 2c5.3 0 9.6 4.1 10 9.3-.3-.1-.6-.2-1-.2s-.7.1-1 .2C19.6 7.2 16.2 4 12 4c-4.4 0-8 3.6-8 8 0 4.1 3.1 7.5 7.1 7.9l-.1.2z"/></svg>
+    </span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
+  </span>
+
+    
+    
+      
+  <span class="md-source-file__fact">
+    <span class="md-icon" title="Created">
+      <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M14.47 15.08 11 13V7h1.5v5.25l3.08 1.83c-.41.28-.79.62-1.11 1m-1.39 4.84c-.36.05-.71.08-1.08.08-4.42 0-8-3.58-8-8s3.58-8 8-8 8 3.58 8 8c0 .37-.03.72-.08 1.08.69.1 1.33.32 1.92.64.1-.56.16-1.13.16-1.72 0-5.5-4.5-10-10-10S2 6.5 2 12s4.47 10 10 10c.59 0 1.16-.06 1.72-.16-.32-.59-.54-1.23-.64-1.92M18 15v3h-3v2h3v3h2v-3h3v-2h-3v-3z"/></svg>
+    </span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
+  </span>
+
+    
+    
+    
+  </aside>
+
+
+  
+
+
+
+
+                
+              </article>
+            </div>
+          
+          
+<script>var target=document.getElementById(location.hash.slice(1));target&&target.name&&(target.checked=target.name.startsWith("__tabbed_"))</script>
+        </div>
+        
+      </main>
+      
+        <footer class="md-footer">
+  
+  <div class="md-footer-meta md-typeset">
+    <div class="md-footer-meta__inner md-grid">
+      <div class="md-copyright">
+  
+    <div class="md-copyright__highlight">
+      Copyright &copy; 2024 <a href='https://www.mr-eyes.com/'>Mohamed Abuelanin</a>, Tamer Mansour
+    </div>
+  
+  
+    Made with
+    <a href="https://squidfunk.github.io/mkdocs-material/" target="_blank" rel="noopener">
+      Material for MkDocs
+    </a>
+  
+</div>
+      
+    </div>
+  </div>
+</footer>
+      
+    </div>
+    <div class="md-dialog" data-md-component="dialog">
+      <div class="md-dialog__inner md-typeset"></div>
+    </div>
+    
+    
+    <script id="__config" type="application/json">{"base": "..", "features": ["content.code.copy", "navigation.tabs", "navigation.tabs.sticky", "math", "mathjax"], "search": "../assets/javascripts/workers/search.6ce7567c.min.js", "translations": {"clipboard.copied": "Copied to clipboard", "clipboard.copy": "Copy to clipboard", "search.result.more.one": "1 more on this page", "search.result.more.other": "# more on this page", "search.result.none": "No matching documents", "search.result.one": "1 matching document", "search.result.other": "# matching documents", "search.result.placeholder": "Type to start searching", "search.result.term.missing": "Missing", "select.version": "Select version"}}</script>
+    
+    
+      <script src="../assets/javascripts/bundle.525ec568.min.js"></script>
+      
+        <script src="../javascripts/mathjax.js"></script>
+      
+        <script src="https://unpkg.com/mathjax@3/es5/tex-mml-chtml.js"></script>
+      
+    
+  </body>
+</html>
\ No newline at end of file
diff --git a/SnipeSig/index.html b/SnipeSig/index.html
index 0dcfb28..ea55ff8 100644
--- a/SnipeSig/index.html
+++ b/SnipeSig/index.html
@@ -421,16 +421,16 @@
     <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
       
         <li class="md-nav__item">
-  <a href="#snipe.api" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig" class="md-nav__link">
     <span class="md-ellipsis">
-      api
+      snipe_sig
     </span>
   </a>
   
 </li>
       
         <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig" class="md-nav__link">
     <span class="md-ellipsis">
       SnipeSig
     </span>
@@ -440,7 +440,7 @@
       <ul class="md-nav__list">
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.abundances" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.abundances" class="md-nav__link">
     <span class="md-ellipsis">
       abundances
     </span>
@@ -449,7 +449,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.filename" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.filename" class="md-nav__link">
     <span class="md-ellipsis">
       filename
     </span>
@@ -458,7 +458,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.get_sample_stats" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.get_sample_stats" class="md-nav__link">
     <span class="md-ellipsis">
       get_sample_stats
     </span>
@@ -467,7 +467,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.hashes" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.hashes" class="md-nav__link">
     <span class="md-ellipsis">
       hashes
     </span>
@@ -476,7 +476,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.ksize" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.ksize" class="md-nav__link">
     <span class="md-ellipsis">
       ksize
     </span>
@@ -485,7 +485,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.md5sum" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.md5sum" class="md-nav__link">
     <span class="md-ellipsis">
       md5sum
     </span>
@@ -494,7 +494,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.mean_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.mean_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       mean_abundance
     </span>
@@ -503,7 +503,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.median_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.median_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       median_abundance
     </span>
@@ -512,7 +512,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.name" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.name" class="md-nav__link">
     <span class="md-ellipsis">
       name
     </span>
@@ -521,7 +521,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.scale" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.scale" class="md-nav__link">
     <span class="md-ellipsis">
       scale
     </span>
@@ -530,7 +530,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.sigtype" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.sigtype" class="md-nav__link">
     <span class="md-ellipsis">
       sigtype
     </span>
@@ -539,7 +539,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.total_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.total_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       total_abundance
     </span>
@@ -548,7 +548,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.track_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.track_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       track_abundance
     </span>
@@ -557,7 +557,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__add__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__add__" class="md-nav__link">
     <span class="md-ellipsis">
       __add__
     </span>
@@ -566,7 +566,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__and__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__and__" class="md-nav__link">
     <span class="md-ellipsis">
       __and__
     </span>
@@ -575,7 +575,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__contains__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__contains__" class="md-nav__link">
     <span class="md-ellipsis">
       __contains__
     </span>
@@ -584,7 +584,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__iadd__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__iadd__" class="md-nav__link">
     <span class="md-ellipsis">
       __iadd__
     </span>
@@ -593,7 +593,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__init__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__init__" class="md-nav__link">
     <span class="md-ellipsis">
       __init__
     </span>
@@ -602,7 +602,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__ior__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__ior__" class="md-nav__link">
     <span class="md-ellipsis">
       __ior__
     </span>
@@ -611,7 +611,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__isub__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__isub__" class="md-nav__link">
     <span class="md-ellipsis">
       __isub__
     </span>
@@ -620,7 +620,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__iter__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__iter__" class="md-nav__link">
     <span class="md-ellipsis">
       __iter__
     </span>
@@ -629,7 +629,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__ixor__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__ixor__" class="md-nav__link">
     <span class="md-ellipsis">
       __ixor__
     </span>
@@ -638,7 +638,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__len__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__len__" class="md-nav__link">
     <span class="md-ellipsis">
       __len__
     </span>
@@ -647,7 +647,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__or__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__or__" class="md-nav__link">
     <span class="md-ellipsis">
       __or__
     </span>
@@ -656,7 +656,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__radd__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__radd__" class="md-nav__link">
     <span class="md-ellipsis">
       __radd__
     </span>
@@ -665,7 +665,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__radd_sum__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__radd_sum__" class="md-nav__link">
     <span class="md-ellipsis">
       __radd_sum__
     </span>
@@ -674,7 +674,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__sub__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__sub__" class="md-nav__link">
     <span class="md-ellipsis">
       __sub__
     </span>
@@ -683,7 +683,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__verify_matching_ksize_scale" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__verify_matching_ksize_scale" class="md-nav__link">
     <span class="md-ellipsis">
       __verify_matching_ksize_scale
     </span>
@@ -692,7 +692,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__verify_snipe_signature" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__verify_snipe_signature" class="md-nav__link">
     <span class="md-ellipsis">
       __verify_snipe_signature
     </span>
@@ -701,7 +701,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__xor__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__xor__" class="md-nav__link">
     <span class="md-ellipsis">
       __xor__
     </span>
@@ -710,7 +710,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.common_hashes" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.common_hashes" class="md-nav__link">
     <span class="md-ellipsis">
       common_hashes
     </span>
@@ -719,7 +719,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.copy" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.copy" class="md-nav__link">
     <span class="md-ellipsis">
       copy
     </span>
@@ -728,7 +728,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.count_singletons" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.count_singletons" class="md-nav__link">
     <span class="md-ellipsis">
       count_singletons
     </span>
@@ -737,7 +737,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.create_from_hashes_abundances" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.create_from_hashes_abundances" class="md-nav__link">
     <span class="md-ellipsis">
       create_from_hashes_abundances
     </span>
@@ -746,7 +746,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.difference_sigs" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.difference_sigs" class="md-nav__link">
     <span class="md-ellipsis">
       difference_sigs
     </span>
@@ -755,7 +755,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.export" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.export" class="md-nav__link">
     <span class="md-ellipsis">
       export
     </span>
@@ -764,7 +764,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.export_to_string" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.export_to_string" class="md-nav__link">
     <span class="md-ellipsis">
       export_to_string
     </span>
@@ -773,7 +773,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.get_info" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.get_info" class="md-nav__link">
     <span class="md-ellipsis">
       get_info
     </span>
@@ -782,7 +782,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.get_name" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.get_name" class="md-nav__link">
     <span class="md-ellipsis">
       get_name
     </span>
@@ -791,7 +791,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.get_unique_signatures" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.get_unique_signatures" class="md-nav__link">
     <span class="md-ellipsis">
       get_unique_signatures
     </span>
@@ -800,7 +800,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.intersection_sigs" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.intersection_sigs" class="md-nav__link">
     <span class="md-ellipsis">
       intersection_sigs
     </span>
@@ -809,7 +809,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.keep_max_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.keep_max_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       keep_max_abundance
     </span>
@@ -818,7 +818,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.keep_min_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.keep_min_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       keep_min_abundance
     </span>
@@ -827,7 +827,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.reset_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.reset_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       reset_abundance
     </span>
@@ -836,7 +836,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.sum_signatures" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.sum_signatures" class="md-nav__link">
     <span class="md-ellipsis">
       sum_signatures
     </span>
@@ -845,7 +845,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.symmetric_difference_sigs" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.symmetric_difference_sigs" class="md-nav__link">
     <span class="md-ellipsis">
       symmetric_difference_sigs
     </span>
@@ -854,7 +854,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.trim_below_median" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.trim_below_median" class="md-nav__link">
     <span class="md-ellipsis">
       trim_below_median
     </span>
@@ -863,7 +863,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.trim_singletons" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.trim_singletons" class="md-nav__link">
     <span class="md-ellipsis">
       trim_singletons
     </span>
@@ -872,7 +872,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.union_sigs" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.union_sigs" class="md-nav__link">
     <span class="md-ellipsis">
       union_sigs
     </span>
@@ -915,6 +915,27 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../Sketch/" class="md-nav__link">
+        
+  
+  <span class="md-ellipsis">
+    Sketch
+  </span>
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -969,16 +990,16 @@
     <ul class="md-nav__list" data-md-component="toc" data-md-scrollfix>
       
         <li class="md-nav__item">
-  <a href="#snipe.api" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig" class="md-nav__link">
     <span class="md-ellipsis">
-      api
+      snipe_sig
     </span>
   </a>
   
 </li>
       
         <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig" class="md-nav__link">
     <span class="md-ellipsis">
       SnipeSig
     </span>
@@ -988,7 +1009,7 @@
       <ul class="md-nav__list">
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.abundances" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.abundances" class="md-nav__link">
     <span class="md-ellipsis">
       abundances
     </span>
@@ -997,7 +1018,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.filename" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.filename" class="md-nav__link">
     <span class="md-ellipsis">
       filename
     </span>
@@ -1006,7 +1027,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.get_sample_stats" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.get_sample_stats" class="md-nav__link">
     <span class="md-ellipsis">
       get_sample_stats
     </span>
@@ -1015,7 +1036,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.hashes" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.hashes" class="md-nav__link">
     <span class="md-ellipsis">
       hashes
     </span>
@@ -1024,7 +1045,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.ksize" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.ksize" class="md-nav__link">
     <span class="md-ellipsis">
       ksize
     </span>
@@ -1033,7 +1054,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.md5sum" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.md5sum" class="md-nav__link">
     <span class="md-ellipsis">
       md5sum
     </span>
@@ -1042,7 +1063,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.mean_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.mean_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       mean_abundance
     </span>
@@ -1051,7 +1072,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.median_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.median_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       median_abundance
     </span>
@@ -1060,7 +1081,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.name" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.name" class="md-nav__link">
     <span class="md-ellipsis">
       name
     </span>
@@ -1069,7 +1090,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.scale" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.scale" class="md-nav__link">
     <span class="md-ellipsis">
       scale
     </span>
@@ -1078,7 +1099,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.sigtype" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.sigtype" class="md-nav__link">
     <span class="md-ellipsis">
       sigtype
     </span>
@@ -1087,7 +1108,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.total_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.total_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       total_abundance
     </span>
@@ -1096,7 +1117,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.track_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.track_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       track_abundance
     </span>
@@ -1105,7 +1126,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__add__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__add__" class="md-nav__link">
     <span class="md-ellipsis">
       __add__
     </span>
@@ -1114,7 +1135,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__and__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__and__" class="md-nav__link">
     <span class="md-ellipsis">
       __and__
     </span>
@@ -1123,7 +1144,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__contains__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__contains__" class="md-nav__link">
     <span class="md-ellipsis">
       __contains__
     </span>
@@ -1132,7 +1153,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__iadd__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__iadd__" class="md-nav__link">
     <span class="md-ellipsis">
       __iadd__
     </span>
@@ -1141,7 +1162,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__init__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__init__" class="md-nav__link">
     <span class="md-ellipsis">
       __init__
     </span>
@@ -1150,7 +1171,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__ior__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__ior__" class="md-nav__link">
     <span class="md-ellipsis">
       __ior__
     </span>
@@ -1159,7 +1180,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__isub__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__isub__" class="md-nav__link">
     <span class="md-ellipsis">
       __isub__
     </span>
@@ -1168,7 +1189,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__iter__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__iter__" class="md-nav__link">
     <span class="md-ellipsis">
       __iter__
     </span>
@@ -1177,7 +1198,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__ixor__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__ixor__" class="md-nav__link">
     <span class="md-ellipsis">
       __ixor__
     </span>
@@ -1186,7 +1207,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__len__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__len__" class="md-nav__link">
     <span class="md-ellipsis">
       __len__
     </span>
@@ -1195,7 +1216,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__or__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__or__" class="md-nav__link">
     <span class="md-ellipsis">
       __or__
     </span>
@@ -1204,7 +1225,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__radd__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__radd__" class="md-nav__link">
     <span class="md-ellipsis">
       __radd__
     </span>
@@ -1213,7 +1234,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__radd_sum__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__radd_sum__" class="md-nav__link">
     <span class="md-ellipsis">
       __radd_sum__
     </span>
@@ -1222,7 +1243,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__sub__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__sub__" class="md-nav__link">
     <span class="md-ellipsis">
       __sub__
     </span>
@@ -1231,7 +1252,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__verify_matching_ksize_scale" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__verify_matching_ksize_scale" class="md-nav__link">
     <span class="md-ellipsis">
       __verify_matching_ksize_scale
     </span>
@@ -1240,7 +1261,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__verify_snipe_signature" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__verify_snipe_signature" class="md-nav__link">
     <span class="md-ellipsis">
       __verify_snipe_signature
     </span>
@@ -1249,7 +1270,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.__xor__" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.__xor__" class="md-nav__link">
     <span class="md-ellipsis">
       __xor__
     </span>
@@ -1258,7 +1279,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.common_hashes" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.common_hashes" class="md-nav__link">
     <span class="md-ellipsis">
       common_hashes
     </span>
@@ -1267,7 +1288,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.copy" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.copy" class="md-nav__link">
     <span class="md-ellipsis">
       copy
     </span>
@@ -1276,7 +1297,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.count_singletons" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.count_singletons" class="md-nav__link">
     <span class="md-ellipsis">
       count_singletons
     </span>
@@ -1285,7 +1306,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.create_from_hashes_abundances" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.create_from_hashes_abundances" class="md-nav__link">
     <span class="md-ellipsis">
       create_from_hashes_abundances
     </span>
@@ -1294,7 +1315,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.difference_sigs" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.difference_sigs" class="md-nav__link">
     <span class="md-ellipsis">
       difference_sigs
     </span>
@@ -1303,7 +1324,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.export" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.export" class="md-nav__link">
     <span class="md-ellipsis">
       export
     </span>
@@ -1312,7 +1333,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.export_to_string" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.export_to_string" class="md-nav__link">
     <span class="md-ellipsis">
       export_to_string
     </span>
@@ -1321,7 +1342,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.get_info" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.get_info" class="md-nav__link">
     <span class="md-ellipsis">
       get_info
     </span>
@@ -1330,7 +1351,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.get_name" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.get_name" class="md-nav__link">
     <span class="md-ellipsis">
       get_name
     </span>
@@ -1339,7 +1360,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.get_unique_signatures" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.get_unique_signatures" class="md-nav__link">
     <span class="md-ellipsis">
       get_unique_signatures
     </span>
@@ -1348,7 +1369,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.intersection_sigs" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.intersection_sigs" class="md-nav__link">
     <span class="md-ellipsis">
       intersection_sigs
     </span>
@@ -1357,7 +1378,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.keep_max_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.keep_max_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       keep_max_abundance
     </span>
@@ -1366,7 +1387,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.keep_min_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.keep_min_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       keep_min_abundance
     </span>
@@ -1375,7 +1396,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.reset_abundance" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.reset_abundance" class="md-nav__link">
     <span class="md-ellipsis">
       reset_abundance
     </span>
@@ -1384,7 +1405,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.sum_signatures" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.sum_signatures" class="md-nav__link">
     <span class="md-ellipsis">
       sum_signatures
     </span>
@@ -1393,7 +1414,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.symmetric_difference_sigs" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.symmetric_difference_sigs" class="md-nav__link">
     <span class="md-ellipsis">
       symmetric_difference_sigs
     </span>
@@ -1402,7 +1423,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.trim_below_median" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.trim_below_median" class="md-nav__link">
     <span class="md-ellipsis">
       trim_below_median
     </span>
@@ -1411,7 +1432,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.trim_singletons" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.trim_singletons" class="md-nav__link">
     <span class="md-ellipsis">
       trim_singletons
     </span>
@@ -1420,7 +1441,7 @@
 </li>
         
           <li class="md-nav__item">
-  <a href="#snipe.api.SnipeSig.union_sigs" class="md-nav__link">
+  <a href="#snipe.api.snipe_sig.SnipeSig.union_sigs" class="md-nav__link">
     <span class="md-ellipsis">
       union_sigs
     </span>
@@ -1455,7 +1476,7 @@ <h1 id="python-api-documentation">Python API Documentation<a class="headerlink"
 
 
 
-<a id="snipe.api"></a>
+<a id="snipe.api.snipe_sig"></a>
     <div class="doc doc-contents first">
 
 
@@ -1478,11 +1499,11 @@ <h1 id="python-api-documentation">Python API Documentation<a class="headerlink"
 
 
 
-<h2 id="snipe.api.SnipeSig" class="doc doc-heading">
+<h2 id="snipe.api.snipe_sig.SnipeSig" class="doc doc-heading">
             <code>SnipeSig</code>
 
 
-<a href="#snipe.api.SnipeSig" class="headerlink" title="Permanent link">&para;</a></h2>
+<a href="#snipe.api.snipe_sig.SnipeSig" class="headerlink" title="Permanent link">&para;</a></h2>
 
 
     <div class="doc doc-contents ">
@@ -1497,8 +1518,9 @@ <h2 id="snipe.api.SnipeSig" class="doc doc-heading">
 
 
               <details class="quote">
-                <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-14">  14</a></span>
+                <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+                <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-13">  13</a></span>
+<span class="normal"><a href="#__codelineno-0-14">  14</a></span>
 <span class="normal"><a href="#__codelineno-0-15">  15</a></span>
 <span class="normal"><a href="#__codelineno-0-16">  16</a></span>
 <span class="normal"><a href="#__codelineno-0-17">  17</a></span>
@@ -2943,1452 +2965,1471 @@ <h2 id="snipe.api.SnipeSig" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1456">1456</a></span>
 <span class="normal"><a href="#__codelineno-0-1457">1457</a></span>
 <span class="normal"><a href="#__codelineno-0-1458">1458</a></span>
-<span class="normal"><a href="#__codelineno-0-1459">1459</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a><span class="k">class</span> <span class="nc">SnipeSig</span><span class="p">:</span>
-</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a><span class="sd">    A class to handle Sourmash signatures with additional functionalities</span>
-</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a><span class="sd">    such as customized set operations and abundance management.</span>
-</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a>
-</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a>    <span class="k">def</span> <span class="nf">_try_load_from_json</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Union</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">],</span> <span class="kc">None</span><span class="p">]:</span>
+<span class="normal"><a href="#__codelineno-0-1459">1459</a></span>
+<span class="normal"><a href="#__codelineno-0-1460">1460</a></span>
+<span class="normal"><a href="#__codelineno-0-1461">1461</a></span>
+<span class="normal"><a href="#__codelineno-0-1462">1462</a></span>
+<span class="normal"><a href="#__codelineno-0-1463">1463</a></span>
+<span class="normal"><a href="#__codelineno-0-1464">1464</a></span>
+<span class="normal"><a href="#__codelineno-0-1465">1465</a></span>
+<span class="normal"><a href="#__codelineno-0-1466">1466</a></span>
+<span class="normal"><a href="#__codelineno-0-1467">1467</a></span>
+<span class="normal"><a href="#__codelineno-0-1468">1468</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-13"><a id="__codelineno-0-13" name="__codelineno-0-13"></a><span class="k">class</span> <span class="nc">SnipeSig</span><span class="p">:</span>
+</span><span id="__span-0-14"><a id="__codelineno-0-14" name="__codelineno-0-14"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-15"><a id="__codelineno-0-15" name="__codelineno-0-15"></a><span class="sd">    A class to handle Sourmash signatures with additional functionalities</span>
+</span><span id="__span-0-16"><a id="__codelineno-0-16" name="__codelineno-0-16"></a><span class="sd">    such as customized set operations and abundance management.</span>
+</span><span id="__span-0-17"><a id="__codelineno-0-17" name="__codelineno-0-17"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-18"><a id="__codelineno-0-18" name="__codelineno-0-18"></a>
+</span><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">],</span>
+</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a>                 <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span> <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10000</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
 </span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="sd">        Attempt to load sourmash signature from JSON string.</span>
+</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="sd">        Initialize the SnipeSig with a sourmash signature object or a path to a signature.</span>
 </span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>
 </span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="sd">            sourmash_sig (str): JSON string representing a sourmash signature.</span>
-</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a>
-</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">            sourmash.signature.SourmashSignature or None if loading fails.</span>
-</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trying to load sourmash signature from JSON.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a>            <span class="n">list_of_sigs</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash</span><span class="o">.</span><span class="n">load_signatures_from_json</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">))</span>
-</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a>            <span class="k">return</span> <span class="p">{</span><span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">:</span> <span class="n">sig</span> <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">list_of_sigs</span><span class="p">}</span>
-</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loading from JSON failed. Proceeding to file loading.&quot;</span><span class="p">,</span> <span class="n">exc_info</span><span class="o">=</span><span class="n">e</span><span class="p">)</span>
-</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a>            <span class="k">return</span> <span class="kc">None</span>  <span class="c1"># Return None to indicate failure</span>
-</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a>
-</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>    <span class="k">def</span> <span class="nf">_try_load_from_file</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">sourmash_sig_path</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Union</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">],</span> <span class="kc">None</span><span class="p">]:</span>
-</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a><span class="sd">        Attempt to load sourmash signature(s) from a file.</span>
-</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a>
-</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a><span class="sd">            sourmash_sig_path (str): File path to a sourmash signature.</span>
-</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>
-</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a><span class="sd">            sourmash.signature.SourmashßSignature, list of sourmash.signature.SourmashSignature, or None if loading fails.</span>
-</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trying to load sourmash signature from file.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>            <span class="n">signatures</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash</span><span class="o">.</span><span class="n">load_file_as_signatures</span><span class="p">(</span><span class="n">sourmash_sig_path</span><span class="p">))</span>
-</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded </span><span class="si">%d</span><span class="s2"> sourmash signature(s) from file.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">signatures</span><span class="p">))</span>
-</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>            <span class="n">sigs_dict</span> <span class="o">=</span> <span class="p">{</span><span class="n">_sig</span><span class="o">.</span><span class="n">name</span><span class="p">:</span> <span class="n">_sig</span> <span class="k">for</span> <span class="n">_sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">}</span>
-</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signatures into sigs_dict: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sigs_dict</span><span class="p">)</span>
-</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>            <span class="k">return</span> <span class="n">sigs_dict</span>
-</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
-</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">exception</span><span class="p">(</span><span class="s2">&quot;Failed to load the sourmash signature from the file.&quot;</span><span class="p">,</span> <span class="n">exc_info</span><span class="o">=</span><span class="n">e</span><span class="p">)</span>
-</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;An unexpected error occurred while loading the sourmash signature.&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">e</span>
-</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>
-</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>
-</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">],</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>                 <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span> <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10000</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a><span class="sd">        Initialize the SnipeSig with a sourmash signature object or a path to a signature.</span>
+</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="sd">            sourmash_sig (str or sourmash.signature.SourmashSignature): A path to a signature file or a signature object.</span>
+</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="sd">            ksize (int): K-mer size.</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">            scale (int): Scale value.</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">            sig_type (SigType): Type of the signature.</span>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">            enable_logging (bool): Flag to enable detailed logging.</span>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a><span class="sd">            **kwargs: Additional keyword arguments.</span>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a>        <span class="c1"># Initialize logging based on the flag</span>
+</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>
+</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a>        <span class="c1"># Configure the logger</span>
+</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a>        <span class="k">if</span> <span class="n">enable_logging</span><span class="p">:</span>
+</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">hasHandlers</span><span class="p">():</span>
+</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>                <span class="c1"># Create console handler</span>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a>                <span class="n">ch</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">StreamHandler</span><span class="p">()</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a>                <span class="n">ch</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>                <span class="c1"># Create formatter</span>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>                <span class="n">formatter</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">Formatter</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">%(asctime)s</span><span class="s1"> - </span><span class="si">%(name)s</span><span class="s1"> - </span><span class="si">%(levelname)s</span><span class="s1"> - </span><span class="si">%(message)s</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>                <span class="c1"># Add formatter to handler</span>
+</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>                <span class="n">ch</span><span class="o">.</span><span class="n">setFormatter</span><span class="p">(</span><span class="n">formatter</span><span class="p">)</span>
+</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>                <span class="c1"># Add handler to logger</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">addHandler</span><span class="p">(</span><span class="n">ch</span><span class="p">)</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Logging is enabled for SnipeSig.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">CRITICAL</span><span class="p">)</span>
+</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>
+</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>        <span class="c1"># Initialize internal variables</span>
+</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Initializing SnipeSig with sourmash_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">)</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">=</span> <span class="n">scale</span>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">=</span> <span class="n">ksize</span>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_type</span> <span class="o">=</span> <span class="n">sig_type</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="kc">False</span>
 </span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a><span class="sd">            sourmash_sig (str or sourmash.signature.SourmashSignature): A path to a signature file or a signature object.</span>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="sd">            ksize (int): K-mer size.</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="sd">            scale (int): Scale value.</span>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">            sig_type (SigType): Type of the signature.</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">            enable_logging (bool): Flag to enable detailed logging.</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">            **kwargs: Additional keyword arguments.</span>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a>        <span class="c1"># Initialize logging based on the flag</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a>        <span class="c1"># Configure the logger</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a>        <span class="k">if</span> <span class="n">enable_logging</span><span class="p">:</span>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">hasHandlers</span><span class="p">():</span>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>                <span class="c1"># Create console handler</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>                <span class="n">ch</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">StreamHandler</span><span class="p">()</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>                <span class="n">ch</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>                <span class="c1"># Create formatter</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>                <span class="n">formatter</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">Formatter</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">%(asctime)s</span><span class="s1"> - </span><span class="si">%(name)s</span><span class="s1"> - </span><span class="si">%(levelname)s</span><span class="s1"> - </span><span class="si">%(message)s</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>                <span class="c1"># Add formatter to handler</span>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>                <span class="n">ch</span><span class="o">.</span><span class="n">setFormatter</span><span class="p">(</span><span class="n">formatter</span><span class="p">)</span>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>                <span class="c1"># Add handler to logger</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">addHandler</span><span class="p">(</span><span class="n">ch</span><span class="p">)</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Logging is enabled for SnipeSig.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">CRITICAL</span><span class="p">)</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>        <span class="c1"># Initialize internal variables</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Initializing SnipeSig with sourmash_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">)</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">=</span> <span class="n">scale</span>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">=</span> <span class="n">ksize</span>
-</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_type</span> <span class="o">=</span> <span class="n">sig_type</span>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>
-</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>        <span class="n">sourmash_sigs</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>        <span class="n">_sourmash_sig</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>
-</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>
-</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Proceeding with a sigtype of </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">)</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>        <span class="n">sourmash_sigs</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>        <span class="n">_sourmash_sig</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Proceeding with a sigtype of </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">)</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="p">(</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">)):</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a>            <span class="c1"># if the str is not a file path</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid type for sourmash_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">type</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a>            <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sourmash_sig must be a file path, sourmash.signature.SourmashSignature, or Frozensourmash_signature, got </span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a>        <span class="c1"># Case 1: If sourmash_sig is already a valid sourmash signature object</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="p">(</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">)):</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signature directly from object.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>            <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="p">{</span><span class="n">sourmash_sig</span><span class="o">.</span><span class="n">name</span><span class="p">:</span> <span class="n">sourmash_sig</span><span class="p">}</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>        <span class="c1"># Case 2: If sourmash_sig is a string, try to load as JSON or a file</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>        <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Attempting to load sourmash signature from string input.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>            <span class="c1"># First, try loading from JSON</span>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>            <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_try_load_from_json</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signature from JSON: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sourmash_sigs</span><span class="p">)</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>            <span class="c1"># If JSON loading fails, try loading from file</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>                <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_try_load_from_file</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>            <span class="c1"># If both attempts fail, raise an error</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Failed to load sourmash signature from the provided string.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;An unexpected error occurred while loading the sourmash signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>        <span class="k">if</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span> <span class="ow">or</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">:</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Multiple signatures found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>                <span class="c1"># not supported at this time</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Loading multiple sample signatures is not supported at this time.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>            <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a single signature in the sample sig input; Will use this signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>                <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">values</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No signature found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signature found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>
-</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>
-</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>
-</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>
-</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>
-</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>
-</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="p">(</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">)):</span>
-</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>            <span class="c1"># if the str is not a file path</span>
-</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid type for sourmash_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">type</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>            <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sourmash_sig must be a file path, sourmash.signature.SourmashSignature, or Frozensourmash_signature, got </span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>
-</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>        <span class="c1"># Case 1: If sourmash_sig is already a valid sourmash signature object</span>
-</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>        <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="p">(</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">)):</span>
-</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signature directly from object.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>            <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="p">{</span><span class="n">sourmash_sig</span><span class="o">.</span><span class="n">name</span><span class="p">:</span> <span class="n">sourmash_sig</span><span class="p">}</span>
-</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>
-</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>        <span class="c1"># Case 2: If sourmash_sig is a string, try to load as JSON or a file</span>
-</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>        <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
-</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Attempting to load sourmash signature from string input.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>
-</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>            <span class="c1"># First, try loading from JSON</span>
-</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>            <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_try_load_from_json</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span>
-</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signature from JSON: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sourmash_sigs</span><span class="p">)</span>
-</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>
-</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>            <span class="c1"># If JSON loading fails, try loading from file</span>
-</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
-</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>                <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_try_load_from_file</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span>
-</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>
-</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>            <span class="c1"># If both attempts fail, raise an error</span>
-</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
-</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Failed to load sourmash signature from the provided string.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;An unexpected error occurred while loading the sourmash signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>        <span class="k">elif</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">:</span>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>                <span class="k">for</span> <span class="n">signame</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Iterating over signature: </span><span class="si">{</span><span class="n">signame</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>                    <span class="k">if</span> <span class="n">signame</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">):</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>                        <span class="n">sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">to_mutable</span><span class="p">()</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>                        <span class="n">sig</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a genome signature with the snipe suffix `-snipegenome`. Restoring original name `</span><span class="si">%s</span><span class="s2">`.&quot;</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>                        <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="n">sig</span>
+</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>                    <span class="k">elif</span> <span class="n">signame</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;sex-&quot;</span><span class="p">):</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a sex chr signature </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">signame</span><span class="p">)</span>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>                        <span class="n">sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">to_mutable</span><span class="p">()</span>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>                        <span class="n">sig</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">signame</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;sex-&quot;</span><span class="p">,</span><span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">chr_to_sig</span><span class="p">[</span><span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">)</span>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>                    <span class="k">elif</span> <span class="n">signame</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;autosome-&quot;</span><span class="p">):</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found an autosome signature </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">signame</span><span class="p">)</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>                        <span class="n">sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">to_mutable</span><span class="p">()</span>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>                        <span class="n">sig</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">signame</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;autosome-&quot;</span><span class="p">,</span><span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">chr_to_sig</span><span class="p">[</span><span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">)</span>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>                    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>                        <span class="k">continue</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>                    <span class="k">if</span> <span class="ow">not</span> <span class="n">_sourmash_sig</span><span class="p">:</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found multiple signature per the genome file, but none with the snipe suffix `-snipegenome`.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>                        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Found multiple signature per the genome file, but none with the snipe suffix `-snipegenome`.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>            <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a single signature in the genome sig input; Will use this signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>                <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">values</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Unknown sigtype: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">)</span>
+</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unknown sigtype: </span><span class="si">{</span><span class="n">sig_type</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>
-</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>        <span class="k">if</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span> <span class="ow">or</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">:</span>
-</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Multiple signatures found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>                <span class="c1"># not supported at this time</span>
-</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Loading multiple sample signatures is not supported at this time.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>            <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a single signature in the sample sig input; Will use this signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>                <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">values</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No signature found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signature found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a>
-</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>        <span class="k">elif</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">:</span>
-</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>                <span class="k">for</span> <span class="n">signame</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>                    <span class="k">if</span> <span class="n">signame</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">):</span>
-</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>                        <span class="n">sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">to_mutable</span><span class="p">()</span>
-</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>                        <span class="n">sig</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>                        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a genome signature with a snipe modified name. Restoring original name `</span><span class="si">%s</span><span class="s2">`.&quot;</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
-</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>                        <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="n">sig</span>
-</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>                        <span class="k">break</span>
-</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>                <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found multiple signature per the genome file, but none with a snipe modified name.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>                    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Found multiple signature per the genome file, but none with a snipe modified name.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>            <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a single signature in the genome sig input; Will use this signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>                <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">values</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Unknown sigtype: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">)</span>
-</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unknown sigtype: </span><span class="si">{</span><span class="n">sig_type</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>
-</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Length of currently loaded signature: </span><span class="si">%d</span><span class="s2">, with name: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="p">),</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
-</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>
-</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>        <span class="c1"># Extract properties from the loaded signature</span>
-</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">ksize</span>
-</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">scaled</span>
-</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">md5sum</span><span class="p">()</span>
-</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">name</span>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">filename</span>
-</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">track_abundance</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Length of currently loaded signature: </span><span class="si">%d</span><span class="s2">, with name: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="p">),</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>        <span class="c1"># Extract properties from the loaded signature</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">ksize</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">scaled</span>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">md5sum</span><span class="p">()</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">name</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">filename</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">track_abundance</span>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a>        <span class="c1"># If the signature does not track abundance, assume abundance of 1 for all hashes</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">:</span>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Signature does not track abundance. Setting all abundances to 1.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>            <span class="c1"># self._track_abundance = True</span>
+</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>
+</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="o">.</span><span class="n">keys</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>        <span class="c1"># Sort the hashes and rearrange abundances accordingly</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>        <span class="n">sorted_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
+</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>            <span class="s2">&quot;Loaded sourmash signature from file: </span><span class="si">%s</span><span class="s2">, name: </span><span class="si">%s</span><span class="s2">, md5sum: </span><span class="si">%s</span><span class="s2">, ksize: </span><span class="si">%d</span><span class="s2">, scale: </span><span class="si">%d</span><span class="s2">, &quot;</span>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>            <span class="s2">&quot;track_abundance: </span><span class="si">%s</span><span class="s2">, type: </span><span class="si">%s</span><span class="s2">, length: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>        <span class="p">)</span>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Hashes sorted during initialization.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Sourmash signature loading completed successfully.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>
+</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>    <span class="k">def</span> <span class="nf">_try_load_from_json</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Union</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">],</span> <span class="kc">None</span><span class="p">]:</span>
+</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a><span class="sd">        Attempt to load sourmash signature from JSON string.</span>
+</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>
+</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a><span class="sd">            sourmash_sig (str): JSON string representing a sourmash signature.</span>
 </span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>
-</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>        <span class="c1"># If the signature does not track abundance, assume abundance of 1 for all hashes</span>
-</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">:</span>
-</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Signature does not track abundance. Setting all abundances to 1.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>            <span class="c1"># self._track_abundance = True</span>
-</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="o">.</span><span class="n">keys</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>        <span class="c1"># Sort the hashes and rearrange abundances accordingly</span>
-</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a>        <span class="n">sorted_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
+</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a><span class="sd">            sourmash.signature.SourmashSignature or None if loading fails.</span>
+</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trying to load sourmash signature from JSON.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>            <span class="n">list_of_sigs</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash</span><span class="o">.</span><span class="n">load_signatures_from_json</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">))</span>
+</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>            <span class="k">return</span> <span class="p">{</span><span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">:</span> <span class="n">sig</span> <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">list_of_sigs</span><span class="p">}</span>
+</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loading from JSON failed. Proceeding to file loading.&quot;</span><span class="p">,</span> <span class="n">exc_info</span><span class="o">=</span><span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a>            <span class="k">return</span> <span class="kc">None</span>  <span class="c1"># Return None to indicate failure</span>
+</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>
+</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a>    <span class="k">def</span> <span class="nf">_try_load_from_file</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">sourmash_sig_path</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Union</span><span class="p">[</span><span class="n">List</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">],</span> <span class="kc">None</span><span class="p">]:</span>
+</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a><span class="sd">        Attempt to load sourmash signature(s) from a file.</span>
 </span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>            <span class="s2">&quot;Loaded sourmash signature from file: </span><span class="si">%s</span><span class="s2">, name: </span><span class="si">%s</span><span class="s2">, md5sum: </span><span class="si">%s</span><span class="s2">, ksize: </span><span class="si">%d</span><span class="s2">, scale: </span><span class="si">%d</span><span class="s2">, &quot;</span>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>            <span class="s2">&quot;track_abundance: </span><span class="si">%s</span><span class="s2">, type: </span><span class="si">%s</span><span class="s2">, length: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>        <span class="p">)</span>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Hashes sorted during initialization.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Sourmash signature loading completed successfully.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>
-</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>    <span class="c1"># Setters and getters</span>
-</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>    <span class="k">def</span> <span class="nf">hashes</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return a copy of the hashes array.&quot;&quot;&quot;</span>
-</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="o">.</span><span class="n">view</span><span class="p">()</span>
-</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>
-</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>    <span class="k">def</span> <span class="nf">abundances</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
-</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return a copy of the abundances array.&quot;&quot;&quot;</span>
-</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="o">.</span><span class="n">view</span><span class="p">()</span>
-</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>
-</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>    <span class="k">def</span> <span class="nf">md5sum</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the MD5 checksum of the signature.&quot;&quot;&quot;</span>
-</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span>
-</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>
-</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>    <span class="k">def</span> <span class="nf">ksize</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
-</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the k-mer size.&quot;&quot;&quot;</span>
-</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span>
-</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>
-</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>    <span class="k">def</span> <span class="nf">scale</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
-</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the scale value.&quot;&quot;&quot;</span>
-</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span>
-</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>
-</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>    <span class="k">def</span> <span class="nf">name</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the name of the signature.&quot;&quot;&quot;</span>
-</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span>
-</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>
-</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>    <span class="k">def</span> <span class="nf">filename</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the filename of the signature.&quot;&quot;&quot;</span>
-</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span>
-</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>
-</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>    <span class="k">def</span> <span class="nf">sigtype</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">SigType</span><span class="p">:</span>
-</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the type of the signature.&quot;&quot;&quot;</span>
-</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span>
-</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>
-</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>    <span class="k">def</span> <span class="nf">track_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
-</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return whether the signature tracks abundance.&quot;&quot;&quot;</span>
-</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span>
-</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>
-</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a>    <span class="c1"># Basic class methods</span>
-</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>    <span class="k">def</span> <span class="nf">get_name</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Get the name of the signature.&quot;&quot;&quot;</span>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span>
-</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>
-</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a>    <span class="c1"># setter sigtype</span>
-</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>    <span class="nd">@sigtype</span><span class="o">.</span><span class="n">setter</span>
-</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>    <span class="k">def</span> <span class="nf">sigtype</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">sigtype</span><span class="p">:</span> <span class="n">SigType</span><span class="p">):</span>
-</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a><span class="sd">        Set the type of the signature.</span>
-</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_type</span> <span class="o">=</span> <span class="n">sigtype</span>
+</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a><span class="sd">            sourmash_sig_path (str): File path to a sourmash signature.</span>
+</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>
+</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a><span class="sd">            sourmash.signature.SourmashßSignature, list of sourmash.signature.SourmashSignature, or None if loading fails.</span>
+</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trying to load sourmash signature from file.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-208"><a id="__codelineno-0-208" name="__codelineno-0-208"></a>            <span class="n">signatures</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash</span><span class="o">.</span><span class="n">load_file_as_signatures</span><span class="p">(</span><span class="n">sourmash_sig_path</span><span class="p">))</span>
+</span><span id="__span-0-209"><a id="__codelineno-0-209" name="__codelineno-0-209"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded </span><span class="si">%d</span><span class="s2"> sourmash signature(s) from file.&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">signatures</span><span class="p">))</span>
+</span><span id="__span-0-210"><a id="__codelineno-0-210" name="__codelineno-0-210"></a>            <span class="n">sigs_dict</span> <span class="o">=</span> <span class="p">{</span><span class="n">_sig</span><span class="o">.</span><span class="n">name</span><span class="p">:</span> <span class="n">_sig</span> <span class="k">for</span> <span class="n">_sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">}</span>
+</span><span id="__span-0-211"><a id="__codelineno-0-211" name="__codelineno-0-211"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signatures into sigs_dict: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sigs_dict</span><span class="p">)</span>
+</span><span id="__span-0-212"><a id="__codelineno-0-212" name="__codelineno-0-212"></a>            <span class="k">return</span> <span class="n">sigs_dict</span>
+</span><span id="__span-0-213"><a id="__codelineno-0-213" name="__codelineno-0-213"></a>        <span class="k">except</span> <span class="ne">Exception</span> <span class="k">as</span> <span class="n">e</span><span class="p">:</span>
+</span><span id="__span-0-214"><a id="__codelineno-0-214" name="__codelineno-0-214"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">exception</span><span class="p">(</span><span class="s2">&quot;Failed to load the sourmash signature from the file.&quot;</span><span class="p">,</span> <span class="n">exc_info</span><span class="o">=</span><span class="n">e</span><span class="p">)</span>
+</span><span id="__span-0-215"><a id="__codelineno-0-215" name="__codelineno-0-215"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;An unexpected error occurred while loading the sourmash signature.&quot;</span><span class="p">)</span> <span class="kn">from</span> <span class="nn">e</span>
+</span><span id="__span-0-216"><a id="__codelineno-0-216" name="__codelineno-0-216"></a>
+</span><span id="__span-0-217"><a id="__codelineno-0-217" name="__codelineno-0-217"></a>    <span class="c1"># Setters and getters</span>
+</span><span id="__span-0-218"><a id="__codelineno-0-218" name="__codelineno-0-218"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-219"><a id="__codelineno-0-219" name="__codelineno-0-219"></a>    <span class="k">def</span> <span class="nf">hashes</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="__span-0-220"><a id="__codelineno-0-220" name="__codelineno-0-220"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return a copy of the hashes array.&quot;&quot;&quot;</span>
+</span><span id="__span-0-221"><a id="__codelineno-0-221" name="__codelineno-0-221"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="o">.</span><span class="n">view</span><span class="p">()</span>
+</span><span id="__span-0-222"><a id="__codelineno-0-222" name="__codelineno-0-222"></a>
+</span><span id="__span-0-223"><a id="__codelineno-0-223" name="__codelineno-0-223"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-224"><a id="__codelineno-0-224" name="__codelineno-0-224"></a>    <span class="k">def</span> <span class="nf">abundances</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">:</span>
+</span><span id="__span-0-225"><a id="__codelineno-0-225" name="__codelineno-0-225"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return a copy of the abundances array.&quot;&quot;&quot;</span>
+</span><span id="__span-0-226"><a id="__codelineno-0-226" name="__codelineno-0-226"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="o">.</span><span class="n">view</span><span class="p">()</span>
+</span><span id="__span-0-227"><a id="__codelineno-0-227" name="__codelineno-0-227"></a>
+</span><span id="__span-0-228"><a id="__codelineno-0-228" name="__codelineno-0-228"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-229"><a id="__codelineno-0-229" name="__codelineno-0-229"></a>    <span class="k">def</span> <span class="nf">md5sum</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-230"><a id="__codelineno-0-230" name="__codelineno-0-230"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the MD5 checksum of the signature.&quot;&quot;&quot;</span>
+</span><span id="__span-0-231"><a id="__codelineno-0-231" name="__codelineno-0-231"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span>
+</span><span id="__span-0-232"><a id="__codelineno-0-232" name="__codelineno-0-232"></a>
+</span><span id="__span-0-233"><a id="__codelineno-0-233" name="__codelineno-0-233"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-234"><a id="__codelineno-0-234" name="__codelineno-0-234"></a>    <span class="k">def</span> <span class="nf">ksize</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="__span-0-235"><a id="__codelineno-0-235" name="__codelineno-0-235"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the k-mer size.&quot;&quot;&quot;</span>
+</span><span id="__span-0-236"><a id="__codelineno-0-236" name="__codelineno-0-236"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span>
+</span><span id="__span-0-237"><a id="__codelineno-0-237" name="__codelineno-0-237"></a>
+</span><span id="__span-0-238"><a id="__codelineno-0-238" name="__codelineno-0-238"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-239"><a id="__codelineno-0-239" name="__codelineno-0-239"></a>    <span class="k">def</span> <span class="nf">scale</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="__span-0-240"><a id="__codelineno-0-240" name="__codelineno-0-240"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the scale value.&quot;&quot;&quot;</span>
+</span><span id="__span-0-241"><a id="__codelineno-0-241" name="__codelineno-0-241"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span>
+</span><span id="__span-0-242"><a id="__codelineno-0-242" name="__codelineno-0-242"></a>
+</span><span id="__span-0-243"><a id="__codelineno-0-243" name="__codelineno-0-243"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-244"><a id="__codelineno-0-244" name="__codelineno-0-244"></a>    <span class="k">def</span> <span class="nf">name</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-245"><a id="__codelineno-0-245" name="__codelineno-0-245"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the name of the signature.&quot;&quot;&quot;</span>
+</span><span id="__span-0-246"><a id="__codelineno-0-246" name="__codelineno-0-246"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span>
+</span><span id="__span-0-247"><a id="__codelineno-0-247" name="__codelineno-0-247"></a>
+</span><span id="__span-0-248"><a id="__codelineno-0-248" name="__codelineno-0-248"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-249"><a id="__codelineno-0-249" name="__codelineno-0-249"></a>    <span class="k">def</span> <span class="nf">filename</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-250"><a id="__codelineno-0-250" name="__codelineno-0-250"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the filename of the signature.&quot;&quot;&quot;</span>
+</span><span id="__span-0-251"><a id="__codelineno-0-251" name="__codelineno-0-251"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span>
+</span><span id="__span-0-252"><a id="__codelineno-0-252" name="__codelineno-0-252"></a>
+</span><span id="__span-0-253"><a id="__codelineno-0-253" name="__codelineno-0-253"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-254"><a id="__codelineno-0-254" name="__codelineno-0-254"></a>    <span class="k">def</span> <span class="nf">sigtype</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">SigType</span><span class="p">:</span>
+</span><span id="__span-0-255"><a id="__codelineno-0-255" name="__codelineno-0-255"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the type of the signature.&quot;&quot;&quot;</span>
+</span><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span>
+</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a>
+</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-259"><a id="__codelineno-0-259" name="__codelineno-0-259"></a>    <span class="k">def</span> <span class="nf">track_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
+</span><span id="__span-0-260"><a id="__codelineno-0-260" name="__codelineno-0-260"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return whether the signature tracks abundance.&quot;&quot;&quot;</span>
+</span><span id="__span-0-261"><a id="__codelineno-0-261" name="__codelineno-0-261"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span>
+</span><span id="__span-0-262"><a id="__codelineno-0-262" name="__codelineno-0-262"></a>
+</span><span id="__span-0-263"><a id="__codelineno-0-263" name="__codelineno-0-263"></a>    <span class="c1"># Basic class methods</span>
+</span><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a>    <span class="k">def</span> <span class="nf">get_name</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Get the name of the signature.&quot;&quot;&quot;</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span>
 </span><span id="__span-0-267"><a id="__codelineno-0-267" name="__codelineno-0-267"></a>
-</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>    <span class="k">def</span> <span class="nf">get_info</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a><span class="sd">        Get information about the signature.</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a><span class="sd">            dict: A dictionary containing signature information.</span>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>        <span class="n">info</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>            <span class="s2">&quot;name&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>            <span class="s2">&quot;filename&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">,</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>            <span class="s2">&quot;md5sum&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span><span class="p">,</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>            <span class="s2">&quot;ksize&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>            <span class="s2">&quot;scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>            <span class="s2">&quot;track_abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">,</span>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>            <span class="s2">&quot;sigtype&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="p">,</span>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>            <span class="s2">&quot;num_hashes&quot;</span><span class="p">:</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>        <span class="p">}</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>        <span class="k">return</span> <span class="n">info</span>
-</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>
-</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>    <span class="k">def</span> <span class="fm">__len__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the number of hashes in the signature.&quot;&quot;&quot;</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>        <span class="k">return</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
-</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>
-</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>    <span class="k">def</span> <span class="fm">__iter__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Iterator</span><span class="p">[</span><span class="nb">tuple</span><span class="p">]:</span>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a><span class="sd">        Iterate over the hashes and their abundances.</span>
+</span><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a>    <span class="c1"># setter sigtype</span>
+</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a>    <span class="nd">@sigtype</span><span class="o">.</span><span class="n">setter</span>
+</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a>    <span class="k">def</span> <span class="nf">sigtype</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">sigtype</span><span class="p">:</span> <span class="n">SigType</span><span class="p">):</span>
+</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a><span class="sd">        Set the type of the signature.</span>
+</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_type</span> <span class="o">=</span> <span class="n">sigtype</span>
+</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>
+</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>    <span class="k">def</span> <span class="nf">get_info</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a><span class="sd">        Get information about the signature.</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a><span class="sd">            dict: A dictionary containing signature information.</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>        <span class="n">info</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>            <span class="s2">&quot;name&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>            <span class="s2">&quot;filename&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">,</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>            <span class="s2">&quot;md5sum&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span><span class="p">,</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>            <span class="s2">&quot;ksize&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>            <span class="s2">&quot;scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>            <span class="s2">&quot;track_abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">,</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>            <span class="s2">&quot;sigtype&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="p">,</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>            <span class="s2">&quot;num_hashes&quot;</span><span class="p">:</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>        <span class="p">}</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>        <span class="k">return</span> <span class="n">info</span>
 </span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>
-</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a><span class="sd">        Yields:</span>
-</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="sd">            tuple: A tuple containing (hash, abundance).</span>
-</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>        <span class="k">for</span> <span class="n">h</span><span class="p">,</span> <span class="n">a</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">):</span>
-</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>            <span class="k">yield</span> <span class="p">(</span><span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">)</span>
-</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a>
-</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a>    <span class="k">def</span> <span class="fm">__contains__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">hash_value</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
-</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a><span class="sd">        Check if a hash is present in the signature.</span>
-</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>
-</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a><span class="sd">            hash_value (int): The hash value to check.</span>
-</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>
-</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a><span class="sd">            bool: True if the hash is present, False otherwise.</span>
-</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>        <span class="c1"># Utilize binary search since hashes are sorted</span>
-</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>        <span class="n">index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">searchsorted</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">hash_value</span><span class="p">)</span>
-</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>        <span class="k">if</span> <span class="n">index</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">index</span><span class="p">]</span> <span class="o">==</span> <span class="n">hash_value</span><span class="p">:</span>
-</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>            <span class="k">return</span> <span class="kc">True</span>
-</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>        <span class="k">return</span> <span class="kc">False</span>
-</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a>
-</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a>    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a>        <span class="k">return</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot;SnipeSig(name=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">, ksize=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="si">}</span><span class="s2">, scale=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="si">}</span><span class="s2">, &quot;</span>
-</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>                <span class="sa">f</span><span class="s2">&quot;type=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="si">}</span><span class="s2">, num_hashes=</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span><span class="si">}</span><span class="s2">)&quot;</span><span class="p">)</span>
-</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>
-</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="fm">__repr__</span><span class="p">()</span>
-</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>
-</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>    <span class="k">def</span> <span class="nf">__verify_snipe_signature</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
-</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a><span class="sd">        Verify that the other object is a SnipeSig instance.</span>
-</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>
-</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a><span class="sd">            other (SnipeSig): The other signature to verify.</span>
-</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>
-</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">            ValueError: If the other object is not a SnipeSig instance.</span>
-</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
-</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>            <span class="n">msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Provided sig (</span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">) is not a SnipeSig instance.&quot;</span>
-</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
-</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
+</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a>    <span class="k">def</span> <span class="fm">__len__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the number of hashes in the signature.&quot;&quot;&quot;</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>        <span class="k">return</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
+</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>
+</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>    <span class="k">def</span> <span class="fm">__iter__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Iterator</span><span class="p">[</span><span class="nb">tuple</span><span class="p">]:</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a><span class="sd">        Iterate over the hashes and their abundances.</span>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a><span class="sd">        Yields:</span>
+</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a><span class="sd">            tuple: A tuple containing (hash, abundance).</span>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>        <span class="k">for</span> <span class="n">h</span><span class="p">,</span> <span class="n">a</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">):</span>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>            <span class="k">yield</span> <span class="p">(</span><span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">)</span>
+</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a>
+</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a>    <span class="k">def</span> <span class="fm">__contains__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">hash_value</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">        Check if a hash is present in the signature.</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a><span class="sd">            hash_value (int): The hash value to check.</span>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a><span class="sd">            bool: True if the hash is present, False otherwise.</span>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>        <span class="c1"># Utilize binary search since hashes are sorted</span>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>        <span class="n">index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">searchsorted</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">hash_value</span><span class="p">)</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>        <span class="k">if</span> <span class="n">index</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">index</span><span class="p">]</span> <span class="o">==</span> <span class="n">hash_value</span><span class="p">:</span>
+</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>            <span class="k">return</span> <span class="kc">True</span>
+</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>        <span class="k">return</span> <span class="kc">False</span>
+</span><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a>
+</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a>    <span class="k">def</span> <span class="fm">__repr__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a>        <span class="k">return</span> <span class="p">(</span><span class="sa">f</span><span class="s2">&quot;SnipeSig(name=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">, ksize=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="si">}</span><span class="s2">, scale=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="si">}</span><span class="s2">, &quot;</span>
+</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>                <span class="sa">f</span><span class="s2">&quot;type=</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="si">}</span><span class="s2">, num_hashes=</span><span class="si">{</span><span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span><span class="si">}</span><span class="s2">)&quot;</span><span class="p">)</span>
+</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a>
+</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a>    <span class="k">def</span> <span class="fm">__str__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="fm">__repr__</span><span class="p">()</span>
+</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a>
+</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a>    <span class="k">def</span> <span class="nf">__verify_snipe_signature</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a><span class="sd">        Verify that the other object is a SnipeSig instance.</span>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a><span class="sd">            other (SnipeSig): The other signature to verify.</span>
 </span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>
-</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a>    <span class="k">def</span> <span class="nf">__verify_matching_ksize_scale</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
-</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a><span class="sd">        Verify that the ksize and scale match between two signatures.</span>
-</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>
-</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a><span class="sd">            other (SnipeSig): The other signature to compare.</span>
-</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>
-</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a><span class="sd">            ValueError: If ksize or scale do not match.</span>
-</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">!=</span> <span class="n">other</span><span class="o">.</span><span class="n">ksize</span><span class="p">:</span>
-</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>            <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;K-mer size does not match between the two signatures: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="si">}</span><span class="s2"> vs </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">.&quot;</span>
-</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">!=</span> <span class="n">other</span><span class="o">.</span><span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>            <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Scale value does not match between the two signatures: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="si">}</span><span class="s2"> vs </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">.&quot;</span>
-</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>
-</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>    <span class="k">def</span> <span class="nf">_validate_abundance_operation</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="kc">None</span><span class="p">],</span> <span class="n">operation</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
-</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a><span class="sd">        Validate that the signature tracks abundance and that the provided value is a non-negative integer.</span>
-</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>
-</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a><span class="sd">            value (int or None): The abundance value to validate. Can be None for operations that don&#39;t require a value.</span>
-</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a><span class="sd">            operation (str): Description of the operation for logging purposes.</span>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a><span class="sd">            ValueError: If the other object is not a SnipeSig instance.</span>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>            <span class="n">msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Provided sig (</span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">) is not a SnipeSig instance.&quot;</span>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
+</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a>
+</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a>    <span class="k">def</span> <span class="nf">__verify_matching_ksize_scale</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a><span class="sd">        Verify that the ksize and scale match between two signatures.</span>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a><span class="sd">            other (SnipeSig): The other signature to compare.</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a><span class="sd">            ValueError: If ksize or scale do not match.</span>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">!=</span> <span class="n">other</span><span class="o">.</span><span class="n">ksize</span><span class="p">:</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>            <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;K-mer size does not match between the two signatures: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="si">}</span><span class="s2"> vs </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">.&quot;</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">!=</span> <span class="n">other</span><span class="o">.</span><span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>            <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Scale value does not match between the two signatures: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="si">}</span><span class="s2"> vs </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">.&quot;</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
 </span><span id="__span-0-365"><a id="__codelineno-0-365" name="__codelineno-0-365"></a>
-</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a><span class="sd">            ValueError: If the signature does not track abundance or if the value is invalid.</span>
-</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">:</span>
-</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Cannot </span><span class="si">%s</span><span class="s2">: signature does not track abundance.&quot;</span><span class="p">,</span> <span class="n">operation</span><span class="p">)</span>
-</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Signature does not track abundance.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a>
-</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>        <span class="k">if</span> <span class="n">value</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">value</span><span class="p">,</span> <span class="nb">int</span><span class="p">)</span> <span class="ow">or</span> <span class="n">value</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> requires a non-negative integer value.&quot;</span><span class="p">,</span> <span class="n">operation</span><span class="o">.</span><span class="n">capitalize</span><span class="p">())</span>
-</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">operation</span><span class="o">.</span><span class="n">capitalize</span><span class="p">()</span><span class="si">}</span><span class="s2"> requires a non-negative integer value.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>
-</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>    <span class="c1"># Mask application method</span>
-</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>    <span class="k">def</span> <span class="nf">_apply_mask</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">mask</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
-</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a><span class="sd">        Apply a boolean mask to the hashes and abundances arrays.</span>
-</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a><span class="sd">        Ensures that the sorted order is preserved.</span>
-</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>
-</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a><span class="sd">            mask (np.ndarray): Boolean array indicating which elements to keep.</span>
-</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
-</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
-</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a>
-</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a>        <span class="c1"># Verify that the hashes remain sorted</span>
-</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">np</span><span class="o">.</span><span class="n">all</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="mi">1</span><span class="p">:]):</span>
-</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Hashes are not sorted after applying mask.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a>                <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Hashes are not sorted after applying mask.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Applied mask. Hashes remain sorted.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>
-</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>    <span class="c1"># Set operation methods</span>
-</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>    <span class="k">def</span> <span class="nf">union_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a><span class="sd">        Combine this signature with another by summing abundances where hashes overlap.</span>
-</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>
-</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a><span class="sd">        Given two signatures \( A \) and \( B \) with hash sets \( H_A \) and \( H_B \),</span>
-</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a><span class="sd">        and their corresponding abundance functions \( a_A \) and \( a_B \), the union</span>
-</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a><span class="sd">        signature \( C \) is defined as follows:</span>
-</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>
-</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a><span class="sd">        - **Hash Set**: </span>
-</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>
-</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a><span class="sd">        $$</span>
-</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a><span class="sd">        H_C = H_A \cup H_B</span>
-</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a><span class="sd">        $$</span>
-</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>
-</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a><span class="sd">        - **Abundance Function**:</span>
+</span><span id="__span-0-366"><a id="__codelineno-0-366" name="__codelineno-0-366"></a>    <span class="k">def</span> <span class="nf">_validate_abundance_operation</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">value</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="kc">None</span><span class="p">],</span> <span class="n">operation</span><span class="p">:</span> <span class="nb">str</span><span class="p">):</span>
+</span><span id="__span-0-367"><a id="__codelineno-0-367" name="__codelineno-0-367"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-368"><a id="__codelineno-0-368" name="__codelineno-0-368"></a><span class="sd">        Validate that the signature tracks abundance and that the provided value is a non-negative integer.</span>
+</span><span id="__span-0-369"><a id="__codelineno-0-369" name="__codelineno-0-369"></a>
+</span><span id="__span-0-370"><a id="__codelineno-0-370" name="__codelineno-0-370"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-371"><a id="__codelineno-0-371" name="__codelineno-0-371"></a><span class="sd">            value (int or None): The abundance value to validate. Can be None for operations that don&#39;t require a value.</span>
+</span><span id="__span-0-372"><a id="__codelineno-0-372" name="__codelineno-0-372"></a><span class="sd">            operation (str): Description of the operation for logging purposes.</span>
+</span><span id="__span-0-373"><a id="__codelineno-0-373" name="__codelineno-0-373"></a>
+</span><span id="__span-0-374"><a id="__codelineno-0-374" name="__codelineno-0-374"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-375"><a id="__codelineno-0-375" name="__codelineno-0-375"></a><span class="sd">            ValueError: If the signature does not track abundance or if the value is invalid.</span>
+</span><span id="__span-0-376"><a id="__codelineno-0-376" name="__codelineno-0-376"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-377"><a id="__codelineno-0-377" name="__codelineno-0-377"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">:</span>
+</span><span id="__span-0-378"><a id="__codelineno-0-378" name="__codelineno-0-378"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Cannot </span><span class="si">%s</span><span class="s2">: signature does not track abundance.&quot;</span><span class="p">,</span> <span class="n">operation</span><span class="p">)</span>
+</span><span id="__span-0-379"><a id="__codelineno-0-379" name="__codelineno-0-379"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Signature does not track abundance.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-380"><a id="__codelineno-0-380" name="__codelineno-0-380"></a>
+</span><span id="__span-0-381"><a id="__codelineno-0-381" name="__codelineno-0-381"></a>        <span class="k">if</span> <span class="n">value</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-382"><a id="__codelineno-0-382" name="__codelineno-0-382"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">value</span><span class="p">,</span> <span class="nb">int</span><span class="p">)</span> <span class="ow">or</span> <span class="n">value</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-383"><a id="__codelineno-0-383" name="__codelineno-0-383"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;</span><span class="si">%s</span><span class="s2"> requires a non-negative integer value.&quot;</span><span class="p">,</span> <span class="n">operation</span><span class="o">.</span><span class="n">capitalize</span><span class="p">())</span>
+</span><span id="__span-0-384"><a id="__codelineno-0-384" name="__codelineno-0-384"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">operation</span><span class="o">.</span><span class="n">capitalize</span><span class="p">()</span><span class="si">}</span><span class="s2"> requires a non-negative integer value.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-385"><a id="__codelineno-0-385" name="__codelineno-0-385"></a>
+</span><span id="__span-0-386"><a id="__codelineno-0-386" name="__codelineno-0-386"></a>    <span class="c1"># Mask application method</span>
+</span><span id="__span-0-387"><a id="__codelineno-0-387" name="__codelineno-0-387"></a>    <span class="k">def</span> <span class="nf">_apply_mask</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">mask</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">):</span>
+</span><span id="__span-0-388"><a id="__codelineno-0-388" name="__codelineno-0-388"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-389"><a id="__codelineno-0-389" name="__codelineno-0-389"></a><span class="sd">        Apply a boolean mask to the hashes and abundances arrays.</span>
+</span><span id="__span-0-390"><a id="__codelineno-0-390" name="__codelineno-0-390"></a><span class="sd">        Ensures that the sorted order is preserved.</span>
+</span><span id="__span-0-391"><a id="__codelineno-0-391" name="__codelineno-0-391"></a>
+</span><span id="__span-0-392"><a id="__codelineno-0-392" name="__codelineno-0-392"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-393"><a id="__codelineno-0-393" name="__codelineno-0-393"></a><span class="sd">            mask (np.ndarray): Boolean array indicating which elements to keep.</span>
+</span><span id="__span-0-394"><a id="__codelineno-0-394" name="__codelineno-0-394"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-395"><a id="__codelineno-0-395" name="__codelineno-0-395"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
+</span><span id="__span-0-396"><a id="__codelineno-0-396" name="__codelineno-0-396"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
+</span><span id="__span-0-397"><a id="__codelineno-0-397" name="__codelineno-0-397"></a>
+</span><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a>        <span class="c1"># Verify that the hashes remain sorted</span>
+</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a>            <span class="k">if</span> <span class="ow">not</span> <span class="n">np</span><span class="o">.</span><span class="n">all</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">&lt;=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="mi">1</span><span class="p">:]):</span>
+</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Hashes are not sorted after applying mask.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a>                <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="s2">&quot;Hashes are not sorted after applying mask.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Applied mask. Hashes remain sorted.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a>
+</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>    <span class="c1"># Set operation methods</span>
+</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a>    <span class="k">def</span> <span class="nf">union_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a><span class="sd">        Combine this signature with another by summing abundances where hashes overlap.</span>
+</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>
+</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a><span class="sd">        Given two signatures \( A \) and \( B \) with hash sets \( H_A \) and \( H_B \),</span>
+</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a><span class="sd">        and their corresponding abundance functions \( a_A \) and \( a_B \), the union</span>
+</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a><span class="sd">        signature \( C \) is defined as follows:</span>
 </span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>
-</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a><span class="sd">        $$</span>
-</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a><span class="sd">        a_C(h) =</span>
-</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a><span class="sd">        \begin{cases} </span>
-</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a><span class="sd">            a_A(h) + a_B(h), &amp; \text{if } h \in H_A \cap H_B \\</span>
-</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a><span class="sd">            a_A(h), &amp; \text{if } h \in H_A \setminus H_B \\</span>
-</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a><span class="sd">            a_B(h), &amp; \text{if } h \in H_B \setminus H_A</span>
-</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a><span class="sd">        \end{cases}</span>
-</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a><span class="sd">        $$</span>
-</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>
-</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Unioning signatures (including all unique hashes).&quot;</span><span class="p">)</span>
-</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>
-</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>        <span class="c1"># Access internal arrays directly</span>
-</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>        <span class="n">self_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span>
-</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>        <span class="n">self_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span>
-</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>        <span class="n">other_hashes</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span>
-</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>        <span class="n">other_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_abundances</span>
+</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a><span class="sd">        - **Hash Set**: </span>
+</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>
+</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a><span class="sd">        $$</span>
+</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a><span class="sd">        H_C = H_A \cup H_B</span>
+</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a><span class="sd">        $$</span>
+</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>
+</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a><span class="sd">        - **Abundance Function**:</span>
+</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a>
+</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a><span class="sd">        $$</span>
+</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a><span class="sd">        a_C(h) =</span>
+</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a><span class="sd">        \begin{cases} </span>
+</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a><span class="sd">            a_A(h) + a_B(h), &amp; \text{if } h \in H_A \cap H_B \\</span>
+</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a><span class="sd">            a_A(h), &amp; \text{if } h \in H_A \setminus H_B \\</span>
+</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a><span class="sd">            a_B(h), &amp; \text{if } h \in H_B \setminus H_A</span>
+</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a><span class="sd">        \end{cases}</span>
+</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a><span class="sd">        $$</span>
+</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>
-</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>        <span class="c1"># Handle the case where &#39;other&#39; does not track abundance</span>
-</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span><span class="p">:</span>
-</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Other signature does not track abundance. Setting abundances to 1.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>            <span class="n">other_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">other_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>
-</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>        <span class="c1"># Combine hashes and abundances</span>
-</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>        <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">self_hashes</span><span class="p">,</span> <span class="n">other_hashes</span><span class="p">))</span>
-</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>        <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">self_abundances</span><span class="p">,</span> <span class="n">other_abundances</span><span class="p">))</span>
-</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>
-</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>        <span class="c1"># Use numpy&#39;s unique function with return_inverse to sum abundances efficiently</span>
-</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>        <span class="n">unique_hashes</span><span class="p">,</span> <span class="n">inverse_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">,</span> <span class="n">return_inverse</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">unique_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Unioning signatures (including all unique hashes).&quot;</span><span class="p">)</span>
+</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>
+</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>        <span class="c1"># Access internal arrays directly</span>
+</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>        <span class="n">self_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span>
+</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>        <span class="n">self_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span>
+</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>        <span class="n">other_hashes</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span>
+</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>        <span class="n">other_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_abundances</span>
+</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>
+</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>        <span class="c1"># Handle the case where &#39;other&#39; does not track abundance</span>
+</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span><span class="p">:</span>
+</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Other signature does not track abundance. Setting abundances to 1.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>            <span class="n">other_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">other_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
 </span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>
-</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>        <span class="c1"># Sum abundances for duplicate hashes</span>
-</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>        <span class="n">np</span><span class="o">.</span><span class="n">add</span><span class="o">.</span><span class="n">at</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">inverse_indices</span><span class="p">,</span> <span class="n">combined_abundances</span><span class="p">)</span>
-</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>
-</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>        <span class="c1"># Handle potential overflow</span>
-</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">iinfo</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">)</span>
-</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>
-</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Union operation completed. Total hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">unique_hashes</span><span class="p">))</span>
+</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>        <span class="c1"># Combine hashes and abundances</span>
+</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>        <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">self_hashes</span><span class="p">,</span> <span class="n">other_hashes</span><span class="p">))</span>
+</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>        <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">self_abundances</span><span class="p">,</span> <span class="n">other_abundances</span><span class="p">))</span>
+</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>
+</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>        <span class="c1"># Use numpy&#39;s unique function with return_inverse to sum abundances efficiently</span>
+</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>        <span class="n">unique_hashes</span><span class="p">,</span> <span class="n">inverse_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">,</span> <span class="n">return_inverse</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">unique_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
 </span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>
-</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>        <span class="c1"># Create a new SnipeSig instance</span>
-</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes</span><span class="p">,</span>
-</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">summed_abundances</span><span class="p">,</span>
-</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_union_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>        <span class="p">)</span>
-</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>
-</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>    <span class="k">def</span> <span class="nf">_convert_to_sourmash_signature</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a><span class="sd">        Convert the SnipeSig instance to a sourmash.signature.SourmashSignature object.</span>
-</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>
-</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a><span class="sd">            sourmash.signature.SourmashSignature: A new sourmash.signature.SourmashSignature instance.</span>
-</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Converting SnipeSig to sourmash.signature.SourmashSignature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>
-</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a>        <span class="n">mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">)</span>
-</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a>        <span class="n">mh</span><span class="o">.</span><span class="n">set_abundances</span><span class="p">(</span><span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)))</span>
-</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span> <span class="n">filename</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">)</span>
-</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Conversion to sourmash.signature.SourmashSignature completed.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a>
-</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a>    <span class="k">def</span> <span class="nf">export</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">path</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a><span class="sd">        Export the signature to a file.</span>
-</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>
-</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a><span class="sd">            path (str): The path to save the signature to.</span>
-</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_convert_to_sourmash_signature</span><span class="p">()</span>
-</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>        <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">path</span><span class="p">),</span> <span class="s2">&quot;wb&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">fp</span><span class="p">:</span>
-</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>            <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">save_signatures_to_json</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span><span class="p">],</span> <span class="n">fp</span><span class="p">)</span>
-</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a>
-</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>    <span class="k">def</span> <span class="nf">export_to_string</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a><span class="sd">        Export the signature to a JSON string.</span>
-</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>
-</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a><span class="sd">            str: JSON string representation of the signature.</span>
-</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_convert_to_sourmash_signature</span><span class="p">()</span>
-</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>        <span class="k">return</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">save_signatures_to_json</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span><span class="p">])</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="s1">&#39;utf-8&#39;</span><span class="p">)</span>
-</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a>
-</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a>    <span class="k">def</span> <span class="nf">intersection_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a><span class="sd">        Compute the intersection of the current signature with another signature.</span>
-</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>
-</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a><span class="sd">        This method keeps only the hashes that are common to both signatures, and retains the abundances from self.</span>
-</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>
-</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>        <span class="c1"># Sum abundances for duplicate hashes</span>
+</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>        <span class="n">np</span><span class="o">.</span><span class="n">add</span><span class="o">.</span><span class="n">at</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">inverse_indices</span><span class="p">,</span> <span class="n">combined_abundances</span><span class="p">)</span>
+</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>
+</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>        <span class="c1"># Handle potential overflow</span>
+</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">iinfo</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">)</span>
+</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>
+</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Union operation completed. Total hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">unique_hashes</span><span class="p">))</span>
+</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>
+</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>        <span class="c1"># Create a new SnipeSig instance</span>
+</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes</span><span class="p">,</span>
+</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">summed_abundances</span><span class="p">,</span>
+</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_union_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>        <span class="p">)</span>
+</span><span id="__span-0-473"><a id="__codelineno-0-473" name="__codelineno-0-473"></a>
+</span><span id="__span-0-474"><a id="__codelineno-0-474" name="__codelineno-0-474"></a>    <span class="k">def</span> <span class="nf">_convert_to_sourmash_signature</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-475"><a id="__codelineno-0-475" name="__codelineno-0-475"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-476"><a id="__codelineno-0-476" name="__codelineno-0-476"></a><span class="sd">        Convert the SnipeSig instance to a sourmash.signature.SourmashSignature object.</span>
+</span><span id="__span-0-477"><a id="__codelineno-0-477" name="__codelineno-0-477"></a>
+</span><span id="__span-0-478"><a id="__codelineno-0-478" name="__codelineno-0-478"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-479"><a id="__codelineno-0-479" name="__codelineno-0-479"></a><span class="sd">            sourmash.signature.SourmashSignature: A new sourmash.signature.SourmashSignature instance.</span>
+</span><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Converting SnipeSig to sourmash.signature.SourmashSignature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a>
+</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>        <span class="n">mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">)</span>
+</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a>        <span class="n">mh</span><span class="o">.</span><span class="n">set_abundances</span><span class="p">(</span><span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)))</span>
+</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span> <span class="n">filename</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">)</span>
+</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Conversion to sourmash.signature.SourmashSignature completed.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>
+</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>    <span class="k">def</span> <span class="nf">export</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">path</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a><span class="sd">        Export the signature to a file.</span>
+</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>
+</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a><span class="sd">            path (str): The path to save the signature to.</span>
+</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_convert_to_sourmash_signature</span><span class="p">()</span>
+</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>        <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">path</span><span class="p">),</span> <span class="s2">&quot;wb&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">fp</span><span class="p">:</span>
+</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>            <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">save_signatures_to_json</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span><span class="p">],</span> <span class="n">fp</span><span class="p">)</span>
+</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>
+</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>    <span class="k">def</span> <span class="nf">export_to_string</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a><span class="sd">        Export the signature to a JSON string.</span>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a><span class="sd">            str: JSON string representation of the signature.</span>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_convert_to_sourmash_signature</span><span class="p">()</span>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>        <span class="k">return</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">save_signatures_to_json</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span><span class="p">])</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="s1">&#39;utf-8&#39;</span><span class="p">)</span>
 </span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>
-</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a><span class="sd">        Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
-</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a><span class="sd">        and abundance functions \( a_A(h) \) and \( a_B(h) \), the intersection signature \( C \) has:</span>
-</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>
-</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a><span class="sd">        - Hash set:</span>
-</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a><span class="sd">        $$</span>
-</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a><span class="sd">        H_C = H_A \cap H_B</span>
-</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a><span class="sd">        $$</span>
+</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a>    <span class="k">def</span> <span class="nf">intersection_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a><span class="sd">        Compute the intersection of the current signature with another signature.</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a><span class="sd">        This method keeps only the hashes that are common to both signatures, and retains the abundances from self.</span>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a><span class="sd">        **Mathematical Explanation**:</span>
 </span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>
-</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a><span class="sd">        - Abundance function:</span>
-</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a><span class="sd">        $$</span>
-</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a><span class="sd">        a_C(h) = a_A(h), \quad \text{for } h \in H_C</span>
-</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a><span class="sd">        $$</span>
-</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>
-</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a><span class="sd">            - `other (SnipeSig)`: Another `SnipeSig` instance to intersect with.</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a><span class="sd">        Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a><span class="sd">        and abundance functions \( a_A(h) \) and \( a_B(h) \), the intersection signature \( C \) has:</span>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>
+</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a><span class="sd">        - Hash set:</span>
+</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a><span class="sd">        $$</span>
+</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a><span class="sd">        H_C = H_A \cap H_B</span>
+</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a><span class="sd">        $$</span>
 </span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>
-</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the two signatures.</span>
-</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a>
-</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a><span class="sd">            - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
-</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a>
-</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersecting signatures.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a><span class="sd">        - Abundance function:</span>
+</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a><span class="sd">        $$</span>
+</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a><span class="sd">        a_C(h) = a_A(h), \quad \text{for } h \in H_C</span>
+</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a><span class="sd">        $$</span>
+</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a>
+</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a><span class="sd">            - `other (SnipeSig)`: Another `SnipeSig` instance to intersect with.</span>
+</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>
+</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the two signatures.</span>
 </span><span id="__span-0-535"><a id="__codelineno-0-535" name="__codelineno-0-535"></a>
-</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a>        <span class="c1"># Use numpy&#39;s intersect1d function</span>
-</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a>        <span class="n">common_hashes</span><span class="p">,</span> <span class="n">self_indices</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">intersect1d</span><span class="p">(</span>
-</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">return_indices</span><span class="o">=</span><span class="kc">True</span>
-</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>        <span class="p">)</span>
-</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>
-</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>        <span class="k">if</span> <span class="n">common_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No common hashes found. Returning an empty signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
-</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
-</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>                <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a>                <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a>                <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_intersection_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a>                <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>            <span class="p">)</span>
-</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>
-</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>        <span class="c1"># Get the abundances from self</span>
-</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>        <span class="n">common_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">self_indices</span><span class="p">]</span>
-</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>
-</span><span id="__span-0-556"><a id="__codelineno-0-556" name="__codelineno-0-556"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersection operation completed. Total common hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">common_hashes</span><span class="p">))</span>
-</span><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a>
-</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a>        <span class="c1"># Create a new SnipeSig instance</span>
-</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">common_hashes</span><span class="p">,</span>
-</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">common_abundances</span><span class="p">,</span>
-</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_intersection_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-566"><a id="__codelineno-0-566" name="__codelineno-0-566"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-567"><a id="__codelineno-0-567" name="__codelineno-0-567"></a>        <span class="p">)</span>
-</span><span id="__span-0-568"><a id="__codelineno-0-568" name="__codelineno-0-568"></a>
-</span><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a>    <span class="k">def</span> <span class="nf">difference_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a><span class="sd">        Compute the difference of the current signature with another signature.</span>
-</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a>
-</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a><span class="sd">        This method removes hashes that are present in the other signature from self,</span>
-</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a><span class="sd">        keeping the abundances from self.</span>
-</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a>
-</span><span id="__span-0-576"><a id="__codelineno-0-576" name="__codelineno-0-576"></a><span class="sd">        **Mathematical Explanation**:</span>
-</span><span id="__span-0-577"><a id="__codelineno-0-577" name="__codelineno-0-577"></a>
-</span><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a><span class="sd">        Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
-</span><span id="__span-0-579"><a id="__codelineno-0-579" name="__codelineno-0-579"></a><span class="sd">        and abundance function \( a_A(h) \), the difference signature \( C \) has:</span>
+</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a><span class="sd">            - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
+</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>
+</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersecting signatures.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>
+</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>        <span class="c1"># Use numpy&#39;s intersect1d function</span>
+</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>        <span class="n">common_hashes</span><span class="p">,</span> <span class="n">self_indices</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">intersect1d</span><span class="p">(</span>
+</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">return_indices</span><span class="o">=</span><span class="kc">True</span>
+</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a>        <span class="p">)</span>
+</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a>
+</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a>        <span class="k">if</span> <span class="n">common_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No common hashes found. Returning an empty signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
+</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
+</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>                <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>                <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-556"><a id="__codelineno-0-556" name="__codelineno-0-556"></a>                <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_intersection_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a>                <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a>            <span class="p">)</span>
+</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>
+</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a>        <span class="c1"># Get the abundances from self</span>
+</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a>        <span class="n">common_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">self_indices</span><span class="p">]</span>
+</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a>
+</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersection operation completed. Total common hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">common_hashes</span><span class="p">))</span>
+</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>
+</span><span id="__span-0-566"><a id="__codelineno-0-566" name="__codelineno-0-566"></a>        <span class="c1"># Create a new SnipeSig instance</span>
+</span><span id="__span-0-567"><a id="__codelineno-0-567" name="__codelineno-0-567"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-568"><a id="__codelineno-0-568" name="__codelineno-0-568"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">common_hashes</span><span class="p">,</span>
+</span><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">common_abundances</span><span class="p">,</span>
+</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_intersection_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a>        <span class="p">)</span>
+</span><span id="__span-0-576"><a id="__codelineno-0-576" name="__codelineno-0-576"></a>
+</span><span id="__span-0-577"><a id="__codelineno-0-577" name="__codelineno-0-577"></a>    <span class="k">def</span> <span class="nf">difference_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-579"><a id="__codelineno-0-579" name="__codelineno-0-579"></a><span class="sd">        Compute the difference of the current signature with another signature.</span>
 </span><span id="__span-0-580"><a id="__codelineno-0-580" name="__codelineno-0-580"></a>
-</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a><span class="sd">        - Hash set:</span>
-</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a><span class="sd">        $$</span>
-</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a><span class="sd">        H_C = H_A \setminus H_B</span>
-</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a><span class="sd">        $$</span>
+</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a><span class="sd">        This method removes hashes that are present in the other signature from self,</span>
+</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a><span class="sd">        keeping the abundances from self.</span>
+</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a>
+</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a><span class="sd">        **Mathematical Explanation**:</span>
 </span><span id="__span-0-585"><a id="__codelineno-0-585" name="__codelineno-0-585"></a>
-</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a><span class="sd">        - Abundance function:</span>
-</span><span id="__span-0-587"><a id="__codelineno-0-587" name="__codelineno-0-587"></a><span class="sd">        $$</span>
-</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a><span class="sd">        a_C(h) = a_A(h), \quad \text{for } h \in H_C</span>
-</span><span id="__span-0-589"><a id="__codelineno-0-589" name="__codelineno-0-589"></a><span class="sd">        $$</span>
-</span><span id="__span-0-590"><a id="__codelineno-0-590" name="__codelineno-0-590"></a>
-</span><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a><span class="sd">            - `other (SnipeSig)`: Another `SnipeSig` instance to subtract from the current signature.</span>
+</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a><span class="sd">        Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
+</span><span id="__span-0-587"><a id="__codelineno-0-587" name="__codelineno-0-587"></a><span class="sd">        and abundance function \( a_A(h) \), the difference signature \( C \) has:</span>
+</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a>
+</span><span id="__span-0-589"><a id="__codelineno-0-589" name="__codelineno-0-589"></a><span class="sd">        - Hash set:</span>
+</span><span id="__span-0-590"><a id="__codelineno-0-590" name="__codelineno-0-590"></a><span class="sd">        $$</span>
+</span><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a><span class="sd">        H_C = H_A \setminus H_B</span>
+</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a><span class="sd">        $$</span>
 </span><span id="__span-0-593"><a id="__codelineno-0-593" name="__codelineno-0-593"></a>
-</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the difference of the two signatures.</span>
-</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a>
-</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a><span class="sd">            - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
-</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a><span class="sd">            - `RuntimeError`: If zero hashes remain after difference.</span>
-</span><span id="__span-0-600"><a id="__codelineno-0-600" name="__codelineno-0-600"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-602"><a id="__codelineno-0-602" name="__codelineno-0-602"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a>
-</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Differencing signatures.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a>
-</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a>        <span class="c1"># Use numpy&#39;s setdiff1d function</span>
-</span><span id="__span-0-607"><a id="__codelineno-0-607" name="__codelineno-0-607"></a>        <span class="n">diff_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-608"><a id="__codelineno-0-608" name="__codelineno-0-608"></a>
-</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a>        <span class="k">if</span> <span class="n">diff_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a>            <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Difference operation resulted in zero hashes, which is not allowed for </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">.&quot;</span>
-</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a>
-</span><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a>        <span class="c1"># Get the indices of the hashes in self</span>
-</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">diff_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a>        <span class="n">diff_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
+</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a><span class="sd">        - Abundance function:</span>
+</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a><span class="sd">        $$</span>
+</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a><span class="sd">        a_C(h) = a_A(h), \quad \text{for } h \in H_C</span>
+</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a><span class="sd">        $$</span>
+</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a>
+</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-600"><a id="__codelineno-0-600" name="__codelineno-0-600"></a><span class="sd">            - `other (SnipeSig)`: Another `SnipeSig` instance to subtract from the current signature.</span>
+</span><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a>
+</span><span id="__span-0-602"><a id="__codelineno-0-602" name="__codelineno-0-602"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the difference of the two signatures.</span>
+</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a>
+</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a><span class="sd">            - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
+</span><span id="__span-0-607"><a id="__codelineno-0-607" name="__codelineno-0-607"></a><span class="sd">            - `RuntimeError`: If zero hashes remain after difference.</span>
+</span><span id="__span-0-608"><a id="__codelineno-0-608" name="__codelineno-0-608"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a>
+</span><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Differencing signatures.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a>
+</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a>        <span class="c1"># Use numpy&#39;s setdiff1d function</span>
+</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a>        <span class="n">diff_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
 </span><span id="__span-0-616"><a id="__codelineno-0-616" name="__codelineno-0-616"></a>
-</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Difference operation completed. Remaining hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">diff_hashes</span><span class="p">))</span>
-</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a>
-</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a>        <span class="c1"># Create a new SnipeSig instance</span>
-</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">diff_hashes</span><span class="p">,</span>
-</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">diff_abundances</span><span class="p">,</span>
-</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_difference_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a>        <span class="p">)</span>
-</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a>
-</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a>    <span class="k">def</span> <span class="nf">symmetric_difference_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-632"><a id="__codelineno-0-632" name="__codelineno-0-632"></a><span class="sd">        Compute the symmetric difference of the current signature with another signature.</span>
-</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a>
-</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a><span class="sd">        This method retains hashes that are unique to each signature, with their respective abundances.</span>
-</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a>
-</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a>        <span class="k">if</span> <span class="n">diff_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a>            <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Difference operation resulted in zero hashes, which is not allowed for </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">.&quot;</span>
+</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a>
+</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a>        <span class="c1"># Get the indices of the hashes in self</span>
+</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">diff_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a>        <span class="n">diff_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
+</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a>
+</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Difference operation completed. Remaining hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">diff_hashes</span><span class="p">))</span>
+</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a>
+</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>        <span class="c1"># Create a new SnipeSig instance</span>
+</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">diff_hashes</span><span class="p">,</span>
+</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">diff_abundances</span><span class="p">,</span>
+</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-632"><a id="__codelineno-0-632" name="__codelineno-0-632"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_difference_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a>        <span class="p">)</span>
 </span><span id="__span-0-637"><a id="__codelineno-0-637" name="__codelineno-0-637"></a>
-</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a><span class="sd">        Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
-</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a><span class="sd">        and abundance functions \( a_A(h) \) and \( a_B(h) \), the symmetric difference signature \( C \) has:</span>
-</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a>
-</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a><span class="sd">        - Hash set:</span>
-</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a><span class="sd">        $$</span>
-</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a><span class="sd">        H_C = (H_A \setminus H_B) \cup (H_B \setminus H_A)</span>
-</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a><span class="sd">        $$</span>
+</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a>    <span class="k">def</span> <span class="nf">symmetric_difference_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a><span class="sd">        Compute the symmetric difference of the current signature with another signature.</span>
+</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a>
+</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a><span class="sd">        This method retains hashes that are unique to each signature, with their respective abundances.</span>
+</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a>
+</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a><span class="sd">        **Mathematical Explanation**:</span>
 </span><span id="__span-0-645"><a id="__codelineno-0-645" name="__codelineno-0-645"></a>
-</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a><span class="sd">        - Abundance function:</span>
-</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a><span class="sd">        $$</span>
-</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a><span class="sd">        a_C(h) =</span>
-</span><span id="__span-0-649"><a id="__codelineno-0-649" name="__codelineno-0-649"></a><span class="sd">        \begin{cases}</span>
-</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a><span class="sd">        a_A(h), &amp; \text{for } h \in H_A \setminus H_B \\</span>
-</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a><span class="sd">        a_B(h), &amp; \text{for } h \in H_B \setminus H_A \\</span>
-</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a><span class="sd">        \end{cases}</span>
-</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a><span class="sd">        $$</span>
-</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a>
-</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a><span class="sd">            - `other (SnipeSig)`: Another `SnipeSig` instance to compute the symmetric difference with.</span>
-</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a>
-</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the symmetric difference of the two signatures.</span>
-</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a>
-</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a><span class="sd">            - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
-</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a><span class="sd">            - `RuntimeError`: If zero hashes remain after symmetric difference.</span>
-</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a>
-</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Computing symmetric difference of signatures.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a>
-</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a>        <span class="c1"># Hashes unique to self and other</span>
-</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a>        <span class="n">unique_self_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a>        <span class="n">unique_other_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>
-</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>        <span class="c1"># Abundances for unique hashes</span>
-</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>        <span class="n">mask_self</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">unique_self_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>        <span class="n">unique_self_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask_self</span><span class="p">]</span>
+</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a><span class="sd">        Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
+</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a><span class="sd">        and abundance functions \( a_A(h) \) and \( a_B(h) \), the symmetric difference signature \( C \) has:</span>
+</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a>
+</span><span id="__span-0-649"><a id="__codelineno-0-649" name="__codelineno-0-649"></a><span class="sd">        - Hash set:</span>
+</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a><span class="sd">        $$</span>
+</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a><span class="sd">        H_C = (H_A \setminus H_B) \cup (H_B \setminus H_A)</span>
+</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a><span class="sd">        $$</span>
+</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a>
+</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a><span class="sd">        - Abundance function:</span>
+</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="sd">        $$</span>
+</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a><span class="sd">        a_C(h) =</span>
+</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a><span class="sd">        \begin{cases}</span>
+</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a><span class="sd">        a_A(h), &amp; \text{for } h \in H_A \setminus H_B \\</span>
+</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a><span class="sd">        a_B(h), &amp; \text{for } h \in H_B \setminus H_A \\</span>
+</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a><span class="sd">        \end{cases}</span>
+</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a><span class="sd">        $$</span>
+</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a>
+</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a><span class="sd">            - `other (SnipeSig)`: Another `SnipeSig` instance to compute the symmetric difference with.</span>
+</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a>
+</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the symmetric difference of the two signatures.</span>
+</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>
+</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a><span class="sd">            - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
+</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a><span class="sd">            - `RuntimeError`: If zero hashes remain after symmetric difference.</span>
+</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>
+</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Computing symmetric difference of signatures.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a>
-</span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>        <span class="n">mask_other</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">unique_other_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a>        <span class="n">unique_other_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask_other</span><span class="p">]</span>
-</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a>
-</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>        <span class="c1"># Handle the case where &#39;other&#39; does not track abundance</span>
-</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span><span class="p">:</span>
-</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Other signature does not track abundance. Setting abundances to 1.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>            <span class="n">unique_other_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">unique_other_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>        <span class="c1"># Hashes unique to self and other</span>
+</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a>        <span class="n">unique_self_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a>        <span class="n">unique_other_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>
+</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>        <span class="c1"># Abundances for unique hashes</span>
+</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>        <span class="n">mask_self</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">unique_self_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>        <span class="n">unique_self_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask_self</span><span class="p">]</span>
 </span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a>
-</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>        <span class="c1"># Combine hashes and abundances</span>
-</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a>        <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">unique_self_hashes</span><span class="p">,</span> <span class="n">unique_other_hashes</span><span class="p">))</span>
-</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a>        <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">unique_self_abundances</span><span class="p">,</span> <span class="n">unique_other_abundances</span><span class="p">))</span>
-</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a>
-</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>        <span class="k">if</span> <span class="n">combined_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a>            <span class="n">_e_msg</span> <span class="o">=</span> <span class="s2">&quot;Symmetric difference operation resulted in zero hashes, which is not allowed.&quot;</span>
-</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>            <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a>
-</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>        <span class="c1"># Sort combined hashes and abundances</span>
-</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a>        <span class="n">sorted_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">)</span>
-</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a>        <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">combined_hashes</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
-</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a>        <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">combined_abundances</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
-</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a>
-</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Symmetric difference operation completed. Total unique hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">))</span>
-</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a>
-</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a>        <span class="c1"># Create a new SnipeSig instance</span>
-</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">combined_hashes</span><span class="p">,</span>
-</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">combined_abundances</span><span class="p">,</span>
-</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_symmetric_difference_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>        <span class="p">)</span>
-</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a>
-</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a>    <span class="c1"># Magic methods for union operations</span>
-</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a>    <span class="k">def</span> <span class="fm">__add__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a><span class="sd">        Implements the + operator.</span>
-</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a><span class="sd">        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
-</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a><span class="sd">        returning a new signature.</span>
-</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>
-</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a><span class="sd">            SnipeSig: Union of self and other.</span>
-</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a>
-</span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a>    <span class="k">def</span> <span class="fm">__iadd__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a><span class="sd">        Implements the += operator.</span>
-</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a><span class="sd">        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
-</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a><span class="sd">        modifying self in-place.</span>
-</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a>
-</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a><span class="sd">            SnipeSig: Updated self after addition.</span>
-</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a>        <span class="n">union_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">union_sig</span><span class="p">)</span>
-</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a>        <span class="k">return</span> <span class="bp">self</span>
-</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a>
-</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a>    <span class="k">def</span> <span class="fm">__or__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a><span class="sd">        Implements the | operator.</span>
-</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a><span class="sd">        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
-</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a><span class="sd">        returning a new signature.</span>
-</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a>
-</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a><span class="sd">            SnipeSig: Union of self and other.</span>
-</span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a>
-</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a>    <span class="k">def</span> <span class="fm">__ior__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a><span class="sd">        Implements the |= operator.</span>
-</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a><span class="sd">        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
-</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a><span class="sd">        modifying self in-place.</span>
-</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a>
-</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a><span class="sd">            SnipeSig: Updated self after union.</span>
-</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a>        <span class="n">union_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">union_sig</span><span class="p">)</span>
-</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a>        <span class="k">return</span> <span class="bp">self</span>
-</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a>
-</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>    <span class="k">def</span> <span class="fm">__sub__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a><span class="sd">        Implements the - operator.</span>
-</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a><span class="sd">        Removes hashes present in other from self, keeping abundances from self,</span>
-</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a><span class="sd">        returning a new signature.</span>
-</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>
-</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-769"><a id="__codelineno-0-769" name="__codelineno-0-769"></a><span class="sd">            SnipeSig: Difference of self and other.</span>
-</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a>
-</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a>    <span class="k">def</span> <span class="fm">__isub__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a><span class="sd">        Implements the -= operator.</span>
-</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a><span class="sd">        Removes hashes present in other from self, keeping abundances from self,</span>
-</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a><span class="sd">        modifying self in-place.</span>
-</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a>
-</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a><span class="sd">            SnipeSig: Updated self after difference.</span>
-</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a>
-</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a><span class="sd">            RuntimeError: If zero hashes remain after difference.</span>
-</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a>        <span class="n">difference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">difference_sig</span><span class="p">)</span>
-</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a>        <span class="k">return</span> <span class="bp">self</span>
-</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a>
-</span><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a>    <span class="k">def</span> <span class="fm">__xor__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a><span class="sd">        Implements the ^ operator.</span>
-</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a><span class="sd">        Keeps unique hashes from each signature with their respective abundances, returning a new signature.</span>
-</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>
-</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a><span class="sd">            SnipeSig: Symmetric difference of self and other.</span>
-</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">symmetric_difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a>
-</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a>    <span class="k">def</span> <span class="fm">__ixor__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a><span class="sd">        Implements the ^= operator.</span>
-</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a><span class="sd">        Keeps unique hashes from each signature with their respective abundances, modifying self in-place.</span>
-</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a>
-</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a><span class="sd">            SnipeSig: Updated self after symmetric difference.</span>
+</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>        <span class="n">mask_other</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">unique_other_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a>        <span class="n">unique_other_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask_other</span><span class="p">]</span>
+</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a>
+</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a>        <span class="c1"># Handle the case where &#39;other&#39; does not track abundance</span>
+</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span><span class="p">:</span>
+</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Other signature does not track abundance. Setting abundances to 1.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>            <span class="n">unique_other_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">unique_other_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>
+</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a>        <span class="c1"># Combine hashes and abundances</span>
+</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>        <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">unique_self_hashes</span><span class="p">,</span> <span class="n">unique_other_hashes</span><span class="p">))</span>
+</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a>        <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">unique_self_abundances</span><span class="p">,</span> <span class="n">unique_other_abundances</span><span class="p">))</span>
+</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a>
+</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a>        <span class="k">if</span> <span class="n">combined_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a>            <span class="n">_e_msg</span> <span class="o">=</span> <span class="s2">&quot;Symmetric difference operation resulted in zero hashes, which is not allowed.&quot;</span>
+</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a>            <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a>
+</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>        <span class="c1"># Sort combined hashes and abundances</span>
+</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a>        <span class="n">sorted_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">)</span>
+</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>        <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">combined_hashes</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
+</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a>        <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">combined_abundances</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
+</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a>
+</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Symmetric difference operation completed. Total unique hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">))</span>
+</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>
+</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>        <span class="c1"># Create a new SnipeSig instance</span>
+</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">combined_hashes</span><span class="p">,</span>
+</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">combined_abundances</span><span class="p">,</span>
+</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_symmetric_difference_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>        <span class="p">)</span>
+</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a>
+</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a>    <span class="c1"># Magic methods for union operations</span>
+</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a>    <span class="k">def</span> <span class="fm">__add__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a><span class="sd">        Implements the + operator.</span>
+</span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a><span class="sd">        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
+</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a><span class="sd">        returning a new signature.</span>
+</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a>
+</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a><span class="sd">            SnipeSig: Union of self and other.</span>
+</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a>
+</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a>    <span class="k">def</span> <span class="fm">__iadd__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a><span class="sd">        Implements the += operator.</span>
+</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a><span class="sd">        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
+</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a><span class="sd">        modifying self in-place.</span>
+</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a>
+</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a><span class="sd">            SnipeSig: Updated self after addition.</span>
+</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a>        <span class="n">union_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">union_sig</span><span class="p">)</span>
+</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a>        <span class="k">return</span> <span class="bp">self</span>
+</span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a>
+</span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a>    <span class="k">def</span> <span class="fm">__or__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a><span class="sd">        Implements the | operator.</span>
+</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a><span class="sd">        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
+</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a><span class="sd">        returning a new signature.</span>
+</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a>
+</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a><span class="sd">            SnipeSig: Union of self and other.</span>
+</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a>
+</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a>    <span class="k">def</span> <span class="fm">__ior__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a><span class="sd">        Implements the |= operator.</span>
+</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a><span class="sd">        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
+</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a><span class="sd">        modifying self in-place.</span>
+</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>
+</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a><span class="sd">            SnipeSig: Updated self after union.</span>
+</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a>        <span class="n">union_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">union_sig</span><span class="p">)</span>
+</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a>        <span class="k">return</span> <span class="bp">self</span>
+</span><span id="__span-0-769"><a id="__codelineno-0-769" name="__codelineno-0-769"></a>
+</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a>    <span class="k">def</span> <span class="fm">__sub__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a><span class="sd">        Implements the - operator.</span>
+</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a><span class="sd">        Removes hashes present in other from self, keeping abundances from self,</span>
+</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a><span class="sd">        returning a new signature.</span>
+</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a>
+</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a><span class="sd">            SnipeSig: Difference of self and other.</span>
+</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a>
+</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a>    <span class="k">def</span> <span class="fm">__isub__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a><span class="sd">        Implements the -= operator.</span>
+</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a><span class="sd">        Removes hashes present in other from self, keeping abundances from self,</span>
+</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a><span class="sd">        modifying self in-place.</span>
+</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a>
+</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a><span class="sd">            SnipeSig: Updated self after difference.</span>
+</span><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a>
+</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a><span class="sd">            RuntimeError: If zero hashes remain after difference.</span>
+</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>        <span class="n">difference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">difference_sig</span><span class="p">)</span>
+</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a>        <span class="k">return</span> <span class="bp">self</span>
+</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a>
+</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a>    <span class="k">def</span> <span class="fm">__xor__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a><span class="sd">        Implements the ^ operator.</span>
+</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a><span class="sd">        Keeps unique hashes from each signature with their respective abundances, returning a new signature.</span>
+</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a>
+</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a><span class="sd">            SnipeSig: Symmetric difference of self and other.</span>
+</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">symmetric_difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>
-</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a><span class="sd">            RuntimeError: If zero hashes remain after symmetric difference.</span>
-</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a>        <span class="n">symmetric_diff_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">symmetric_difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">symmetric_diff_sig</span><span class="p">)</span>
-</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a>        <span class="k">return</span> <span class="bp">self</span>
-</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a>
-</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a>    <span class="k">def</span> <span class="fm">__and__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a><span class="sd">        Implements the &amp; operator.</span>
-</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a><span class="sd">        Keeps common hashes and retains abundances from self only, returning a new signature.</span>
-</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>
-</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a><span class="sd">            SnipeSig: Intersection of self and other.</span>
-</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">intersection_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a>
-</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a>    <span class="k">def</span> <span class="nf">_update_from_union</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
-</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a><span class="sd">        Update self&#39;s hashes and abundances from another SnipeSig instance.</span>
-</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a>
-</span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a><span class="sd">            other (SnipeSig): The other SnipeSig instance to update from.</span>
-</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">hashes</span>
-</span><span id="__span-0-832"><a id="__codelineno-0-832" name="__codelineno-0-832"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">abundances</span>
-</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
-</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">filename</span>
-</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">md5sum</span>
-</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span>
-</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a>        <span class="c1"># No need to update ksize and scale since they are verified to match</span>
-</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a>
-</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a>    <span class="nd">@classmethod</span>
-</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a>    <span class="k">def</span> <span class="nf">create_from_hashes_abundances</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">hashes</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">abundances</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span>
-</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>                                      <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a>                                      <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">:</span> <span class="n">SigType</span> <span class="o">=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a><span class="sd">        Internal method to create a SnipeSig instance from hashes and abundances.</span>
-</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a>
-</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a><span class="sd">            hashes (np.ndarray): Array of hash values.</span>
-</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a><span class="sd">            abundances (np.ndarray): Array of abundance values corresponding to the hashes.</span>
-</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a><span class="sd">            ksize (int): K-mer size.</span>
-</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a><span class="sd">            scale (int): Scale value.</span>
-</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a><span class="sd">            name (str): Optional name for the signature.</span>
-</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a><span class="sd">            filename (str): Optional filename for the signature.</span>
-</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a><span class="sd">            sig_type (SigType): Type of the signature.</span>
-</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a><span class="sd">            enable_logging (bool): Flag to enable logging.</span>
-</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a>
-</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a><span class="sd">            SnipeSig: A new SnipeSig instance.</span>
-</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a>        <span class="c1"># Create a mock sourmash signature object</span>
-</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a>        <span class="n">mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a>        <span class="n">mh</span><span class="o">.</span><span class="n">set_abundances</span><span class="p">(</span><span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">hashes</span><span class="p">,</span> <span class="n">abundances</span><span class="p">)))</span>
-</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a>        <span class="n">sig</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">name</span> <span class="ow">or</span> <span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">filename</span><span class="o">=</span><span class="n">filename</span> <span class="ow">or</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>        <span class="k">return</span> <span class="bp">cls</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">sig_type</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">)</span>
-</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a>
-</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a>    <span class="c1"># Aggregation Operations</span>
-</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a>    <span class="nd">@classmethod</span>
-</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>    <span class="k">def</span> <span class="nf">sum_signatures</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">signatures</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="s1">&#39;SnipeSig&#39;</span><span class="p">],</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;summed_signature&quot;</span><span class="p">,</span>
-</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>                       <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>
-</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a><span class="sd">        Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap.</span>
-</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a><span class="sd">        This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.</span>
-</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>
-</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a><span class="sd">        $$</span>
-</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a><span class="sd">        \text{Sum}(A_1, A_2, \dots, A_n) = \bigcup_{i=1}^{n} A_i</span>
-</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a><span class="sd">        $$</span>
+</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a>    <span class="k">def</span> <span class="fm">__ixor__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a><span class="sd">        Implements the ^= operator.</span>
+</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a><span class="sd">        Keeps unique hashes from each signature with their respective abundances, modifying self in-place.</span>
+</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>
+</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a><span class="sd">            SnipeSig: Updated self after symmetric difference.</span>
+</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a>
+</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a><span class="sd">            RuntimeError: If zero hashes remain after symmetric difference.</span>
+</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>        <span class="n">symmetric_diff_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">symmetric_difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">symmetric_diff_sig</span><span class="p">)</span>
+</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>        <span class="k">return</span> <span class="bp">self</span>
+</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a>
+</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>    <span class="k">def</span> <span class="fm">__and__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a><span class="sd">        Implements the &amp; operator.</span>
+</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a><span class="sd">        Keeps common hashes and retains abundances from self only, returning a new signature.</span>
+</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a>
+</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a><span class="sd">            SnipeSig: Intersection of self and other.</span>
+</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">intersection_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-831"><a id="__codelineno-0-831" name="__codelineno-0-831"></a>
+</span><span id="__span-0-832"><a id="__codelineno-0-832" name="__codelineno-0-832"></a>    <span class="k">def</span> <span class="nf">_update_from_union</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
+</span><span id="__span-0-833"><a id="__codelineno-0-833" name="__codelineno-0-833"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-834"><a id="__codelineno-0-834" name="__codelineno-0-834"></a><span class="sd">        Update self&#39;s hashes and abundances from another SnipeSig instance.</span>
+</span><span id="__span-0-835"><a id="__codelineno-0-835" name="__codelineno-0-835"></a>
+</span><span id="__span-0-836"><a id="__codelineno-0-836" name="__codelineno-0-836"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-837"><a id="__codelineno-0-837" name="__codelineno-0-837"></a><span class="sd">            other (SnipeSig): The other SnipeSig instance to update from.</span>
+</span><span id="__span-0-838"><a id="__codelineno-0-838" name="__codelineno-0-838"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">hashes</span>
+</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">abundances</span>
+</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">name</span>
+</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">filename</span>
+</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">md5sum</span>
+</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span>
+</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a>        <span class="c1"># No need to update ksize and scale since they are verified to match</span>
+</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a>
+</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a>    <span class="nd">@classmethod</span>
+</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a>    <span class="k">def</span> <span class="nf">create_from_hashes_abundances</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">hashes</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">abundances</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span>
+</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a>                                      <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>                                      <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">:</span> <span class="n">SigType</span> <span class="o">=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a><span class="sd">        Internal method to create a SnipeSig instance from hashes and abundances.</span>
+</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a>
+</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a><span class="sd">            hashes (np.ndarray): Array of hash values.</span>
+</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a><span class="sd">            abundances (np.ndarray): Array of abundance values corresponding to the hashes.</span>
+</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a><span class="sd">            ksize (int): K-mer size.</span>
+</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a><span class="sd">            scale (int): Scale value.</span>
+</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a><span class="sd">            name (str): Optional name for the signature.</span>
+</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a><span class="sd">            filename (str): Optional filename for the signature.</span>
+</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a><span class="sd">            sig_type (SigType): Type of the signature.</span>
+</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a><span class="sd">            enable_logging (bool): Flag to enable logging.</span>
+</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>
+</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a><span class="sd">            SnipeSig: A new SnipeSig instance.</span>
+</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>        <span class="c1"># Create a mock sourmash signature object</span>
+</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>        <span class="n">mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>        <span class="n">mh</span><span class="o">.</span><span class="n">set_abundances</span><span class="p">(</span><span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">hashes</span><span class="p">,</span> <span class="n">abundances</span><span class="p">)))</span>
+</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a>        <span class="n">sig</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">name</span> <span class="ow">or</span> <span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">filename</span><span class="o">=</span><span class="n">filename</span> <span class="ow">or</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>        <span class="k">return</span> <span class="bp">cls</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">sig_type</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">)</span>
+</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a>
+</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>    <span class="c1"># Aggregation Operations</span>
+</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a>    <span class="nd">@classmethod</span>
+</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a>    <span class="k">def</span> <span class="nf">sum_signatures</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">signatures</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="s1">&#39;SnipeSig&#39;</span><span class="p">],</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;summed_signature&quot;</span><span class="p">,</span>
+</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a>                       <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
 </span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>
-</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a><span class="sd">        For each hash \( h \), its total abundance is:</span>
-</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a><span class="sd">        $$</span>
-</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a><span class="sd">        \text{abundance}(h) = \sum_{i=1}^{n} \text{abundance}_i(h)</span>
-</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a><span class="sd">        $$</span>
-</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a>
-</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a><span class="sd">        **Mathematical Explanation**:</span>
-</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a>
-</span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a><span class="sd">        - **Union of Signatures**:</span>
-</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a><span class="sd">            The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.</span>
-</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a>
-</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a><span class="sd">        - **Total Abundance Calculation**:</span>
-</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a><span class="sd">            For each unique hash \( h \), the total abundance is the sum of its abundances across all signatures where it appears.</span>
+</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a><span class="sd">        Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap.</span>
+</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a><span class="sd">        This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.</span>
+</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>
+</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a><span class="sd">        $$</span>
+</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a><span class="sd">        \text{Sum}(A_1, A_2, \dots, A_n) = \bigcup_{i=1}^{n} A_i</span>
+</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a><span class="sd">        $$</span>
+</span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a>
+</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a><span class="sd">        For each hash \( h \), its total abundance is:</span>
+</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a><span class="sd">        $$</span>
+</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a><span class="sd">        \text{abundance}(h) = \sum_{i=1}^{n} \text{abundance}_i(h)</span>
+</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a><span class="sd">        $$</span>
 </span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a>
-</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a><span class="sd">        - **Algorithm Efficiency**:</span>
-</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a><span class="sd">            By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.</span>
-</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a>
-</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a><span class="sd">            - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to sum.</span>
-</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a><span class="sd">            - `name (str)`: Optional name for the resulting signature.</span>
-</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a><span class="sd">            - `filename (str)`: Optional filename for the resulting signature.</span>
-</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a><span class="sd">            - `enable_logging (bool)`: Flag to enable detailed logging.</span>
-</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a>
-</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the sum of the signatures.</span>
-</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a>
-</span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a><span class="sd">            - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.</span>
-</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a><span class="sd">            - `RuntimeError`: If an error occurs during the summation process.</span>
-</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signatures provided for summation.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a>
-</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>        <span class="c1"># Verify that all signatures have the same ksize, scale, and track_abundance</span>
-</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a>        <span class="n">first_sig</span> <span class="o">=</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a>        <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
-</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a>        <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
-</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a>        <span class="n">track_abundance</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">track_abundance</span>
-</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>
-</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>        <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">1</span><span class="p">:]:</span>
-</span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>            <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same ksize and scale.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>            <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">track_abundance</span> <span class="o">!=</span> <span class="n">track_abundance</span><span class="p">:</span>
-</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same track_abundance setting.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>
-</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>        <span class="c1"># Initialize iterators for each signature&#39;s hashes and abundances</span>
-</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>        <span class="n">iterators</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>        <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>            <span class="n">it</span> <span class="o">=</span> <span class="nb">iter</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
-</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>                <span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">it</span><span class="p">)</span>
-</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>                <span class="n">iterators</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">))</span>
-</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>                <span class="k">continue</span>  <span class="c1"># Skip empty signatures</span>
-</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>
-</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">iterators</span><span class="p">:</span>
-</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All provided signatures are empty.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>
-</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>        <span class="c1"># Initialize the heap with the first element from each iterator</span>
-</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>        <span class="n">heap</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>        <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">iterators</span><span class="p">):</span>
-</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>            <span class="n">heap</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
-</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>        <span class="n">heapq</span><span class="o">.</span><span class="n">heapify</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>
-</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>        <span class="c1"># Prepare lists to collect the summed hashes and abundances</span>
-</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>        <span class="n">summed_hashes</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>
-</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>        <span class="k">while</span> <span class="n">heap</span><span class="p">:</span>
-</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>            <span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>            <span class="c1"># Initialize total abundance for the current_hash</span>
-</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>            <span class="n">total_abundance</span> <span class="o">=</span> <span class="n">current_abundance</span>
-</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>
-</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>            <span class="c1"># Check if the next element in the heap has the same hash</span>
-</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>            <span class="k">while</span> <span class="n">heap</span> <span class="ow">and</span> <span class="n">heap</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">current_hash</span><span class="p">:</span>
-</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>                <span class="n">_</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">same_idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>                <span class="n">total_abundance</span> <span class="o">+=</span> <span class="n">abundance</span>
-</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>                <span class="c1"># Push the next element from the same iterator</span>
-</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>                <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>                    <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">same_idx</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="__span-0-957"><a id="__codelineno-0-957" name="__codelineno-0-957"></a>                    <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">same_idx</span><span class="p">))</span>
-</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a>                <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a>                    <span class="k">pass</span>  <span class="c1"># No more elements in this iterator</span>
-</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>
-</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a>            <span class="c1"># Append the summed hash and abundance</span>
-</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>            <span class="n">summed_hashes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">current_hash</span><span class="p">)</span>
-</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>            <span class="n">summed_abundances</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">total_abundance</span><span class="p">)</span>
-</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>
-</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>            <span class="c1"># Push the next element from the current iterator</span>
-</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>                <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">idx</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>                <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
-</span><span id="__span-0-969"><a id="__codelineno-0-969" name="__codelineno-0-969"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a>                <span class="k">pass</span>  <span class="c1"># No more elements in this iterator</span>
-</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a>
-</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a>        <span class="c1"># Convert the results to NumPy arrays for efficient storage and processing</span>
-</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a>        <span class="n">summed_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">summed_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a>
-</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>        <span class="c1"># Handle potential overflow by capping at the maximum value of uint32</span>
-</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">iinfo</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">)</span>
-</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>
-</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>        <span class="c1"># Create a new SnipeSig instance from the summed hashes and abundances</span>
-</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>        <span class="n">summed_signature</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">summed_hashes</span><span class="p">,</span>
-</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">summed_abundances</span><span class="p">,</span>
-</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>            <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>            <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>            <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
-</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>            <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
-</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
-</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>        <span class="p">)</span>
-</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>
-</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>        <span class="k">return</span> <span class="n">summed_signature</span>
-</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a>
-</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a>    <span class="nd">@staticmethod</span>
-</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a>    <span class="k">def</span> <span class="nf">get_unique_signatures</span><span class="p">(</span><span class="n">signatures</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">]:</span>
-</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a><span class="sd">        Extract unique signatures from a dictionary of SnipeSig instances.</span>
-</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>
-</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a><span class="sd">        For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.</span>
-</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>
-</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a><span class="sd">            signatures (Dict[str, SnipeSig]): A dictionary mapping signature names to SnipeSig instances.</span>
-</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>
-</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a><span class="sd">            Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.</span>
+</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a>
+</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a><span class="sd">        - **Union of Signatures**:</span>
+</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a><span class="sd">            The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.</span>
+</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a>
+</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a><span class="sd">        - **Total Abundance Calculation**:</span>
+</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a><span class="sd">            For each unique hash \( h \), the total abundance is the sum of its abundances across all signatures where it appears.</span>
+</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a>
+</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a><span class="sd">        - **Algorithm Efficiency**:</span>
+</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a><span class="sd">            By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.</span>
+</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a>
+</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a><span class="sd">            - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to sum.</span>
+</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a><span class="sd">            - `name (str)`: Optional name for the resulting signature.</span>
+</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a><span class="sd">            - `filename (str)`: Optional filename for the resulting signature.</span>
+</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a><span class="sd">            - `enable_logging (bool)`: Flag to enable detailed logging.</span>
+</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>
+</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the sum of the signatures.</span>
+</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>
+</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a><span class="sd">            - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.</span>
+</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a><span class="sd">            - `RuntimeError`: If an error occurs during the summation process.</span>
+</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signatures provided for summation.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>
+</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>        <span class="c1"># Verify that all signatures have the same ksize, scale, and track_abundance</span>
+</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>        <span class="n">first_sig</span> <span class="o">=</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>        <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
+</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>        <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
+</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>        <span class="n">track_abundance</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">track_abundance</span>
+</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>
+</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>        <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">1</span><span class="p">:]:</span>
+</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>            <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same ksize and scale.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>            <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">track_abundance</span> <span class="o">!=</span> <span class="n">track_abundance</span><span class="p">:</span>
+</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same track_abundance setting.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>
+</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>        <span class="c1"># Initialize iterators for each signature&#39;s hashes and abundances</span>
+</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>        <span class="n">iterators</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>        <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>            <span class="n">it</span> <span class="o">=</span> <span class="nb">iter</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
+</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>                <span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">it</span><span class="p">)</span>
+</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>                <span class="n">iterators</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">))</span>
+</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>                <span class="k">continue</span>  <span class="c1"># Skip empty signatures</span>
+</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>
+</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">iterators</span><span class="p">:</span>
+</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All provided signatures are empty.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>
+</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>        <span class="c1"># Initialize the heap with the first element from each iterator</span>
+</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>        <span class="n">heap</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>        <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">iterators</span><span class="p">):</span>
+</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>            <span class="n">heap</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
+</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>        <span class="n">heapq</span><span class="o">.</span><span class="n">heapify</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>
+</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>        <span class="c1"># Prepare lists to collect the summed hashes and abundances</span>
+</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>        <span class="n">summed_hashes</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>
+</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>        <span class="k">while</span> <span class="n">heap</span><span class="p">:</span>
+</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>            <span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>            <span class="c1"># Initialize total abundance for the current_hash</span>
+</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>            <span class="n">total_abundance</span> <span class="o">=</span> <span class="n">current_abundance</span>
+</span><span id="__span-0-957"><a id="__codelineno-0-957" name="__codelineno-0-957"></a>
+</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a>            <span class="c1"># Check if the next element in the heap has the same hash</span>
+</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a>            <span class="k">while</span> <span class="n">heap</span> <span class="ow">and</span> <span class="n">heap</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">current_hash</span><span class="p">:</span>
+</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>                <span class="n">_</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">same_idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a>                <span class="n">total_abundance</span> <span class="o">+=</span> <span class="n">abundance</span>
+</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>                <span class="c1"># Push the next element from the same iterator</span>
+</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>                <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>                    <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">same_idx</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>                    <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">same_idx</span><span class="p">))</span>
+</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>                <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>                    <span class="k">pass</span>  <span class="c1"># No more elements in this iterator</span>
+</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>
+</span><span id="__span-0-969"><a id="__codelineno-0-969" name="__codelineno-0-969"></a>            <span class="c1"># Append the summed hash and abundance</span>
+</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a>            <span class="n">summed_hashes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">current_hash</span><span class="p">)</span>
+</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a>            <span class="n">summed_abundances</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">total_abundance</span><span class="p">)</span>
+</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a>
+</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a>            <span class="c1"># Push the next element from the current iterator</span>
+</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a>                <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">idx</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>                <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
+</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>                <span class="k">pass</span>  <span class="c1"># No more elements in this iterator</span>
+</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>
+</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>        <span class="c1"># Convert the results to NumPy arrays for efficient storage and processing</span>
+</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>        <span class="n">summed_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">summed_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>
+</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>        <span class="c1"># Handle potential overflow by capping at the maximum value of uint32</span>
+</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>        <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">iinfo</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">)</span>
+</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>
+</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>        <span class="c1"># Create a new SnipeSig instance from the summed hashes and abundances</span>
+</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>        <span class="n">summed_signature</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">summed_hashes</span><span class="p">,</span>
+</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">summed_abundances</span><span class="p">,</span>
+</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a>            <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a>            <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a>            <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
+</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>            <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
+</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>        <span class="p">)</span>
+</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a>
+</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>        <span class="k">return</span> <span class="n">summed_signature</span>
+</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a>
+</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a>    <span class="nd">@staticmethod</span>
+</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>    <span class="k">def</span> <span class="nf">get_unique_signatures</span><span class="p">(</span><span class="n">signatures</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">]:</span>
+</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a><span class="sd">        Extract unique signatures from a dictionary of SnipeSig instances.</span>
 </span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a>
-</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a><span class="sd">            ValueError: If the input dictionary is empty or if signatures have mismatched ksize/scale.</span>
-</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;The input signatures dictionary is empty.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a>
-</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a>        <span class="c1"># Extract ksize and scale from the first signature</span>
-</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>        <span class="n">first_name</span><span class="p">,</span> <span class="n">first_sig</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">()))</span>
-</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a>        <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
-</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a>        <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
-</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a>
-</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>        <span class="c1"># Verify that all signatures have the same ksize and scale</span>
-</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>            <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Signature &#39;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&#39; has mismatched ksize or scale.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>
-</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>        <span class="c1"># Aggregate all hashes from all signatures</span>
-</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>        <span class="n">all_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span> <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">values</span><span class="p">()])</span>
+</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a><span class="sd">        For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.</span>
+</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>
+</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a><span class="sd">            signatures (Dict[str, SnipeSig]): A dictionary mapping signature names to SnipeSig instances.</span>
+</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>
+</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a><span class="sd">            Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.</span>
+</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>
+</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a><span class="sd">            ValueError: If the input dictionary is empty or if signatures have mismatched ksize/scale.</span>
+</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;The input signatures dictionary is empty.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>
+</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>        <span class="c1"># Extract ksize and scale from the first signature</span>
+</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>        <span class="n">first_name</span><span class="p">,</span> <span class="n">first_sig</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">()))</span>
+</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>        <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
+</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>        <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
 </span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a>
-</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>        <span class="c1"># Count the occurrences of each hash</span>
-</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>        <span class="n">unique_hashes</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">all_hashes</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>
-</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>        <span class="c1"># Identify hashes that are unique across all signatures (count == 1)</span>
-</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>        <span class="n">unique_across_all</span> <span class="o">=</span> <span class="n">unique_hashes</span><span class="p">[</span><span class="n">counts</span> <span class="o">==</span> <span class="mi">1</span><span class="p">]</span>
-</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>
-</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>        <span class="c1"># Convert to a set for faster membership testing</span>
-</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a>        <span class="n">unique_set</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique_across_all</span><span class="p">)</span>
-</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a>
-</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a>        <span class="n">unique_signatures</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>        <span class="c1"># Verify that all signatures have the same ksize and scale</span>
+</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>            <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Signature &#39;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&#39; has mismatched ksize or scale.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>
+</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>        <span class="c1"># Aggregate all hashes from all signatures</span>
+</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>        <span class="n">all_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span> <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">values</span><span class="p">()])</span>
+</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a>
+</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a>        <span class="c1"># Count the occurrences of each hash</span>
+</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a>        <span class="n">unique_hashes</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">all_hashes</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
 </span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a>
-</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>            <span class="c1"># Find hashes in the current signature that are unique across all signatures</span>
-</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>            <span class="n">mask_unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="nb">list</span><span class="p">(</span><span class="n">unique_set</span><span class="p">))</span>
-</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>
-</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>            <span class="c1"># Extract unique hashes and their abundances</span>
-</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>            <span class="n">unique_hashes_sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">[</span><span class="n">mask_unique</span><span class="p">]</span>
-</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>            <span class="n">unique_abundances_sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">[</span><span class="n">mask_unique</span><span class="p">]</span>
+</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>        <span class="c1"># Identify hashes that are unique across all signatures (count == 1)</span>
+</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>        <span class="n">unique_across_all</span> <span class="o">=</span> <span class="n">unique_hashes</span><span class="p">[</span><span class="n">counts</span> <span class="o">==</span> <span class="mi">1</span><span class="p">]</span>
+</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>
+</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>        <span class="c1"># Convert to a set for faster membership testing</span>
+</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>        <span class="n">unique_set</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique_across_all</span><span class="p">)</span>
+</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>
+</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>        <span class="n">unique_signatures</span> <span class="o">=</span> <span class="p">{}</span>
 </span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>
-</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>            <span class="c1"># Create a new SnipeSig instance with the unique hashes and abundances</span>
-</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>            <span class="n">unique_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes_sig</span><span class="p">,</span>
-</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">unique_abundances_sig</span><span class="p">,</span>
-</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a>                <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a>                <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>                <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">_unique&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>                <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>  <span class="c1"># Set to True if you want logging for the new signatures</span>
-</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>                <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span>  <span class="c1"># Adjust sig_type as needed</span>
-</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a>            <span class="p">)</span>
-</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a>
-</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a>            <span class="n">unique_signatures</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">unique_sig</span>
-</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>
-</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a>        <span class="k">return</span> <span class="n">unique_signatures</span>
-</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a>
-</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a>
-</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a>    <span class="nd">@classmethod</span>
-</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a>    <span class="k">def</span> <span class="nf">common_hashes</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">signatures</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="s1">&#39;SnipeSig&#39;</span><span class="p">],</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;common_hashes_signature&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>                      <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a><span class="sd">        Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing</span>
-</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a><span class="sd">        only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.</span>
+</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>            <span class="c1"># Find hashes in the current signature that are unique across all signatures</span>
+</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>            <span class="n">mask_unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="nb">list</span><span class="p">(</span><span class="n">unique_set</span><span class="p">))</span>
+</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>
+</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a>            <span class="c1"># Extract unique hashes and their abundances</span>
+</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a>            <span class="n">unique_hashes_sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">[</span><span class="n">mask_unique</span><span class="p">]</span>
+</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>            <span class="n">unique_abundances_sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">[</span><span class="n">mask_unique</span><span class="p">]</span>
+</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>
+</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>            <span class="c1"># Create a new SnipeSig instance with the unique hashes and abundances</span>
+</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>            <span class="n">unique_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes_sig</span><span class="p">,</span>
+</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">unique_abundances_sig</span><span class="p">,</span>
+</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a>                <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>                <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a>                <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">_unique&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a>                <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>  <span class="c1"># Set to True if you want logging for the new signatures</span>
+</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a>                <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span>  <span class="c1"># Adjust sig_type as needed</span>
+</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a>            <span class="p">)</span>
+</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>
+</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a>            <span class="n">unique_signatures</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">unique_sig</span>
+</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a>
+</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a>        <span class="k">return</span> <span class="n">unique_signatures</span>
 </span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a>
-</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a><span class="sd">        This method uses a heap-based multi-way merge algorithm for efficient computation,</span>
-</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a><span class="sd">        especially when handling a large number of signatures with sorted hashes.</span>
-</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a>
-</span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a><span class="sd">        **Mathematical Explanation**:</span>
-</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a>
-</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="sd">        Given signatures \( A_1, A_2, \dots, A_n \) with hash sets \( H_1, H_2, \dots, H_n \),</span>
-</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">        the intersection signature \( C \) has:</span>
+</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a>
+</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a>    <span class="nd">@classmethod</span>
+</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a>    <span class="k">def</span> <span class="nf">common_hashes</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">signatures</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="s1">&#39;SnipeSig&#39;</span><span class="p">],</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;common_hashes_signature&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a>                      <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="sd">        Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing</span>
+</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">        only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.</span>
 </span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a>
-</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">        - Hash set:</span>
-</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a><span class="sd">        H_C = \bigcap_{i=1}^{n} H_i</span>
-</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">        This method uses a heap-based multi-way merge algorithm for efficient computation,</span>
+</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">        especially when handling a large number of signatures with sorted hashes.</span>
+</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a>
+</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">        **Mathematical Explanation**:</span>
 </span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a>
-</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a><span class="sd">        - Abundance function:</span>
-</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a><span class="sd">        a_C(h) = \min_{i=1}^{n} a_i(h), \quad \text{for } h \in H_C</span>
-</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a>
-</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a><span class="sd">            - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to compute the intersection.</span>
-</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a><span class="sd">            - `name (str)`: Optional name for the resulting signature.</span>
-</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a><span class="sd">            - `filename (str)`: Optional filename for the resulting signature.</span>
-</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a><span class="sd">            - `enable_logging (bool)`: Flag to enable detailed logging.</span>
-</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a>
-</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the signatures.</span>
-</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a>
-</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a><span class="sd">            - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.</span>
-</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signatures provided for intersection.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a>
-</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>        <span class="c1"># Verify that all signatures have the same ksize and scale</span>
-</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>        <span class="n">first_sig</span> <span class="o">=</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a>        <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
-</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a>        <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
-</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>        <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">1</span><span class="p">:]:</span>
-</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>            <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same ksize and scale.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a><span class="sd">        Given signatures \( A_1, A_2, \dots, A_n \) with hash sets \( H_1, H_2, \dots, H_n \),</span>
+</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">        the intersection signature \( C \) has:</span>
+</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a>
+</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a><span class="sd">        - Hash set:</span>
+</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a><span class="sd">        H_C = \bigcap_{i=1}^{n} H_i</span>
+</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a>
+</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a><span class="sd">        - Abundance function:</span>
+</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a><span class="sd">        a_C(h) = \min_{i=1}^{n} a_i(h), \quad \text{for } h \in H_C</span>
+</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a>
+</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a><span class="sd">            - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to compute the intersection.</span>
+</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a><span class="sd">            - `name (str)`: Optional name for the resulting signature.</span>
+</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a><span class="sd">            - `filename (str)`: Optional filename for the resulting signature.</span>
+</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a><span class="sd">            - `enable_logging (bool)`: Flag to enable detailed logging.</span>
+</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>
+</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a><span class="sd">            - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the signatures.</span>
+</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>
+</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a><span class="sd">            - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.</span>
+</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signatures provided for intersection.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a>
-</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a>        <span class="n">num_signatures</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">signatures</span><span class="p">)</span>
-</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a>        <span class="n">iterators</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>        <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a>            <span class="n">it</span> <span class="o">=</span> <span class="nb">iter</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
-</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a>                <span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">it</span><span class="p">)</span>
-</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a>                <span class="n">iterators</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">))</span>
-</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>                <span class="c1"># One of the signatures is empty; intersection is empty</span>
-</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>                <span class="k">return</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>                    <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
-</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>                    <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
-</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a>                    <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a>                    <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a>                    <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
-</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a>                    <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
-</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a>                    <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
-</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a>                <span class="p">)</span>
-</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a>
-</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a>        <span class="c1"># Initialize the heap with the first element from each iterator</span>
-</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>        <span class="n">heap</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a>        <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">iterators</span><span class="p">):</span>
-</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>            <span class="n">heap</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
-</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>        <span class="n">heapq</span><span class="o">.</span><span class="n">heapify</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a>
-</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a>        <span class="n">common_hashes</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a>        <span class="n">common_abundances</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a>
-</span><span id="__span-0-1136"><a id="__codelineno-0-1136" name="__codelineno-0-1136"></a>        <span class="k">while</span> <span class="n">heap</span><span class="p">:</span>
-</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a>            <span class="c1"># Pop all entries with the smallest hash</span>
-</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a>            <span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a>            <span class="n">same_hash_entries</span> <span class="o">=</span> <span class="p">[(</span><span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">)]</span>
+</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a>        <span class="c1"># Verify that all signatures have the same ksize and scale</span>
+</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a>        <span class="n">first_sig</span> <span class="o">=</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>        <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
+</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a>        <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
+</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>        <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">1</span><span class="p">:]:</span>
+</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a>            <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same ksize and scale.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a>
+</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>        <span class="n">num_signatures</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">signatures</span><span class="p">)</span>
+</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>        <span class="n">iterators</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>        <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>            <span class="n">it</span> <span class="o">=</span> <span class="nb">iter</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
+</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a>                <span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">it</span><span class="p">)</span>
+</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a>                <span class="n">iterators</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">))</span>
+</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a>                <span class="c1"># One of the signatures is empty; intersection is empty</span>
+</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a>                <span class="k">return</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a>                    <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
+</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a>                    <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
+</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>                    <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a>                    <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>                    <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
+</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>                    <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a>                    <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
+</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a>                <span class="p">)</span>
+</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a>
+</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a>        <span class="c1"># Initialize the heap with the first element from each iterator</span>
+</span><span id="__span-0-1136"><a id="__codelineno-0-1136" name="__codelineno-0-1136"></a>        <span class="n">heap</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a>        <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">iterators</span><span class="p">):</span>
+</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a>            <span class="n">heap</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
+</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a>        <span class="n">heapq</span><span class="o">.</span><span class="n">heapify</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
 </span><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a>
-</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a>            <span class="c1"># Collect all entries in the heap that have the same current_hash</span>
-</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a>            <span class="k">while</span> <span class="n">heap</span> <span class="ow">and</span> <span class="n">heap</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">current_hash</span><span class="p">:</span>
-</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a>                <span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a>                <span class="n">same_hash_entries</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span><span class="p">))</span>
-</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a>
-</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">same_hash_entries</span><span class="p">)</span> <span class="o">==</span> <span class="n">num_signatures</span><span class="p">:</span>
-</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a>                <span class="c1"># The current_hash is present in all signatures</span>
-</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a>                <span class="c1"># Take the minimum abundance across signatures</span>
-</span><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a>                <span class="n">min_abundance</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">entry</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="n">same_hash_entries</span><span class="p">)</span>
-</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a>                <span class="n">common_hashes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">current_hash</span><span class="p">)</span>
-</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a>                <span class="n">common_abundances</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">min_abundance</span><span class="p">)</span>
-</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a>
-</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a>            <span class="c1"># Push the next element from each iterator that had the current_hash</span>
-</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a>            <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="n">same_hash_entries</span><span class="p">:</span>
-</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a>                <span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">entry</span>
-</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a>                <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a>                    <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a>                    <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">i</span><span class="p">))</span>
-</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a>                <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a>                    <span class="k">pass</span>  <span class="c1"># Iterator exhausted</span>
-</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a>
-</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a>        <span class="c1"># Convert the results to NumPy arrays</span>
-</span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">common_hashes</span><span class="p">:</span>
-</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a>            <span class="c1"># No common hashes found</span>
-</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a>            <span class="n">unique_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a>            <span class="n">unique_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a>            <span class="n">unique_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">common_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a>            <span class="n">unique_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">common_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a>
-</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a>        <span class="c1"># Create a new SnipeSig instance from the common hashes and abundances</span>
-</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a>        <span class="n">common_signature</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes</span><span class="p">,</span>
-</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">unique_abundances</span><span class="p">,</span>
-</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>            <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>            <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>            <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
-</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>            <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
-</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
-</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>        <span class="p">)</span>
-</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>
-</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>        <span class="k">return</span> <span class="n">common_signature</span>
-</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a>
-</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>    <span class="k">def</span> <span class="nf">copy</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a><span class="sd">        Create a copy of the current SnipeSig instance.</span>
-</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>
-</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a><span class="sd">            SnipeSig: A new instance that is a copy of self.</span>
-</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a>        <span class="k">return</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">export_to_string</span><span class="p">(),</span> <span class="n">sig_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sigtype</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
-</span><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a>
-</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a>    <span class="c1"># Implement the __radd__ method to support sum()</span>
-</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a>    <span class="k">def</span> <span class="fm">__radd__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a><span class="sd">        Implements the right-hand + operator to support sum().</span>
-</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>
-</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a><span class="sd">            SnipeSig: Union of self and other.</span>
-</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">__radd_sum__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a>
-</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a>    <span class="c1"># Override the __sum__ method</span>
-</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a>    <span class="k">def</span> <span class="nf">__radd_sum__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a><span class="sd">        Internal helper method to support the sum() function.</span>
-</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a>
-</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a><span class="sd">        Parameters:</span>
-</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a><span class="sd">            other (int or SnipeSig): The other object to add. If other is 0, return self.</span>
+</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a>        <span class="n">common_hashes</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a>        <span class="n">common_abundances</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a>
+</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a>        <span class="k">while</span> <span class="n">heap</span><span class="p">:</span>
+</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a>            <span class="c1"># Pop all entries with the smallest hash</span>
+</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a>            <span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a>            <span class="n">same_hash_entries</span> <span class="o">=</span> <span class="p">[(</span><span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">)]</span>
+</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a>
+</span><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a>            <span class="c1"># Collect all entries in the heap that have the same current_hash</span>
+</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a>            <span class="k">while</span> <span class="n">heap</span> <span class="ow">and</span> <span class="n">heap</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">current_hash</span><span class="p">:</span>
+</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a>                <span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a>                <span class="n">same_hash_entries</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span><span class="p">))</span>
+</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a>
+</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">same_hash_entries</span><span class="p">)</span> <span class="o">==</span> <span class="n">num_signatures</span><span class="p">:</span>
+</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a>                <span class="c1"># The current_hash is present in all signatures</span>
+</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a>                <span class="c1"># Take the minimum abundance across signatures</span>
+</span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a>                <span class="n">min_abundance</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">entry</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="n">same_hash_entries</span><span class="p">)</span>
+</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a>                <span class="n">common_hashes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">current_hash</span><span class="p">)</span>
+</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a>                <span class="n">common_abundances</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">min_abundance</span><span class="p">)</span>
+</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a>
+</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a>            <span class="c1"># Push the next element from each iterator that had the current_hash</span>
+</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a>            <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="n">same_hash_entries</span><span class="p">:</span>
+</span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a>                <span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">entry</span>
+</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a>                <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a>                    <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a>                    <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">i</span><span class="p">))</span>
+</span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>                <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a>                    <span class="k">pass</span>  <span class="c1"># Iterator exhausted</span>
+</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a>
+</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a>        <span class="c1"># Convert the results to NumPy arrays</span>
+</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">common_hashes</span><span class="p">:</span>
+</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a>            <span class="c1"># No common hashes found</span>
+</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a>            <span class="n">unique_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>            <span class="n">unique_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>            <span class="n">unique_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">common_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>            <span class="n">unique_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">common_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>
+</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>        <span class="c1"># Create a new SnipeSig instance from the common hashes and abundances</span>
+</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>        <span class="n">common_signature</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes</span><span class="p">,</span>
+</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">unique_abundances</span><span class="p">,</span>
+</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a>            <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>            <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a>            <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
+</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>            <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
+</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a>        <span class="p">)</span>
+</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a>
+</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a>        <span class="k">return</span> <span class="n">common_signature</span>
+</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a>
+</span><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a>    <span class="k">def</span> <span class="nf">copy</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a><span class="sd">        Create a copy of the current SnipeSig instance.</span>
+</span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a>
+</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a><span class="sd">            SnipeSig: A new instance that is a copy of self.</span>
+</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a>        <span class="k">return</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">export_to_string</span><span class="p">(),</span> <span class="n">sig_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sigtype</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a>
+</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a>    <span class="c1"># Implement the __radd__ method to support sum()</span>
+</span><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a>    <span class="k">def</span> <span class="fm">__radd__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a><span class="sd">        Implements the right-hand + operator to support sum().</span>
+</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a>
+</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a><span class="sd">            SnipeSig: Union of self and other.</span>
+</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">__radd_sum__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a>
-</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a><span class="sd">            SnipeSig: The result of the addition.</span>
-</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a>        <span class="k">if</span> <span class="n">other</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a>            <span class="k">return</span> <span class="bp">self</span>
-</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
-</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a>            <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unsupported operand type(s) for +: &#39;SnipeSig&#39; and &#39;</span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">&#39;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a>
-</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a>    <span class="k">def</span> <span class="nf">reset_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">new_abundance</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a><span class="sd">        Reset all abundances to a specified value.</span>
-</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a>
-</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a><span class="sd">        This method sets the abundance of every hash in the signature to the specified `new_abundance` value.</span>
-</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a>
-</span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a>    <span class="c1"># Override the __sum__ method</span>
+</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a>    <span class="k">def</span> <span class="nf">__radd_sum__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a><span class="sd">        Internal helper method to support the sum() function.</span>
+</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a>
+</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a><span class="sd">        Parameters:</span>
+</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a><span class="sd">            other (int or SnipeSig): The other object to add. If other is 0, return self.</span>
+</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a>
+</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a><span class="sd">            SnipeSig: The result of the addition.</span>
+</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a>        <span class="k">if</span> <span class="n">other</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a>            <span class="k">return</span> <span class="bp">self</span>
+</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
+</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a>            <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unsupported operand type(s) for +: &#39;SnipeSig&#39; and &#39;</span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">&#39;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a>
-</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a><span class="sd">        For each hash \( h \) in the signature, the abundance function is updated to:</span>
-</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a><span class="sd">        a(h) = \text{new\_abundance}</span>
-</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a>
-</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a><span class="sd">            - `new_abundance (int)`: The new abundance value to set for all hashes. Default is 1.</span>
+</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a>    <span class="k">def</span> <span class="nf">reset_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">new_abundance</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a><span class="sd">        Reset all abundances to a specified value.</span>
+</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a>
+</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a><span class="sd">        This method sets the abundance of every hash in the signature to the specified `new_abundance` value.</span>
+</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a>
+</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a><span class="sd">        **Mathematical Explanation**:</span>
 </span><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a>
-</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a><span class="sd">            - `ValueError`: If the signature does not track abundance or if `new_abundance` is invalid.</span>
-</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a>
-</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">new_abundance</span><span class="p">,</span> <span class="s2">&quot;reset abundance&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a>
-</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[:]</span> <span class="o">=</span> <span class="n">new_abundance</span>
-</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Reset all abundances to </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">new_abundance</span><span class="p">)</span>
-</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a>
-</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a>    <span class="k">def</span> <span class="nf">keep_min_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">min_abundance</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
-</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a><span class="sd">        Keep only hashes with abundances greater than or equal to a minimum threshold.</span>
-</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>
-</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a><span class="sd">        This method removes hashes whose abundances are less than the specified `min_abundance`.</span>
-</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a>
-</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a><span class="sd">        For each hash \( h \) in the signature, the abundance function is updated to:</span>
+</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a><span class="sd">        a(h) = \text{new\_abundance}</span>
+</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>
+</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a><span class="sd">            - `new_abundance (int)`: The new abundance value to set for all hashes. Default is 1.</span>
+</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>
+</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a><span class="sd">            - `ValueError`: If the signature does not track abundance or if `new_abundance` is invalid.</span>
+</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a>
+</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">new_abundance</span><span class="p">,</span> <span class="s2">&quot;reset abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a>
+</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[:]</span> <span class="o">=</span> <span class="n">new_abundance</span>
+</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Reset all abundances to </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">new_abundance</span><span class="p">)</span>
 </span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>
-</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a><span class="sd">        The updated hash set \( H&#39; \) is:</span>
-</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a><span class="sd">        H&#39; = \{ h \in H \mid a(h) \geq \text{min\_abundance} \}</span>
-</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>
-</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a><span class="sd">            - `min_abundance (int)`: The minimum abundance threshold.</span>
+</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a>    <span class="k">def</span> <span class="nf">keep_min_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">min_abundance</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
+</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a><span class="sd">        Keep only hashes with abundances greater than or equal to a minimum threshold.</span>
+</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a>
+</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a><span class="sd">        This method removes hashes whose abundances are less than the specified `min_abundance`.</span>
+</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a>
+</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a><span class="sd">        **Mathematical Explanation**:</span>
 </span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a>
-</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a><span class="sd">            - `ValueError`: If the signature does not track abundance or if `min_abundance` is invalid.</span>
-</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">min_abundance</span><span class="p">,</span> <span class="s2">&quot;keep minimum abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a><span class="sd">        The updated hash set \( H&#39; \) is:</span>
+</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a><span class="sd">        H&#39; = \{ h \in H \mid a(h) \geq \text{min\_abundance} \}</span>
+</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a><span class="sd">        $$</span>
 </span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>
-</span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&gt;=</span> <span class="n">min_abundance</span>
-</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
-</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Kept hashes with abundance &gt;= </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">min_abundance</span><span class="p">)</span>
-</span><span id="__span-0-1269"><a id="__codelineno-0-1269" name="__codelineno-0-1269"></a>
-</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a>    <span class="k">def</span> <span class="nf">keep_max_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">max_abundance</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
-</span><span id="__span-0-1271"><a id="__codelineno-0-1271" name="__codelineno-0-1271"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a><span class="sd">        Keep only hashes with abundances less than or equal to a maximum threshold.</span>
+</span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a><span class="sd">            - `min_abundance (int)`: The minimum abundance threshold.</span>
+</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>
+</span><span id="__span-0-1269"><a id="__codelineno-0-1269" name="__codelineno-0-1269"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a><span class="sd">            - `ValueError`: If the signature does not track abundance or if `min_abundance` is invalid.</span>
+</span><span id="__span-0-1271"><a id="__codelineno-0-1271" name="__codelineno-0-1271"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">min_abundance</span><span class="p">,</span> <span class="s2">&quot;keep minimum abundance&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1273"><a id="__codelineno-0-1273" name="__codelineno-0-1273"></a>
-</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a><span class="sd">        This method removes hashes whose abundances are greater than the specified `max_abundance`.</span>
-</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a>
-</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&gt;=</span> <span class="n">min_abundance</span>
+</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
+</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Kept hashes with abundance &gt;= </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">min_abundance</span><span class="p">)</span>
 </span><span id="__span-0-1277"><a id="__codelineno-0-1277" name="__codelineno-0-1277"></a>
-</span><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a><span class="sd">        The updated hash set \( H&#39; \) is:</span>
-</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a><span class="sd">        H&#39; = \{ h \in H \mid a(h) \leq \text{max\_abundance} \}</span>
-</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a>
-</span><span id="__span-0-1283"><a id="__codelineno-0-1283" name="__codelineno-0-1283"></a><span class="sd">        **Parameters**:</span>
-</span><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a><span class="sd">            - `max_abundance (int)`: The maximum abundance threshold.</span>
+</span><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a>    <span class="k">def</span> <span class="nf">keep_max_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">max_abundance</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
+</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a><span class="sd">        Keep only hashes with abundances less than or equal to a maximum threshold.</span>
+</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a>
+</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a><span class="sd">        This method removes hashes whose abundances are greater than the specified `max_abundance`.</span>
+</span><span id="__span-0-1283"><a id="__codelineno-0-1283" name="__codelineno-0-1283"></a>
+</span><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a><span class="sd">        **Mathematical Explanation**:</span>
 </span><span id="__span-0-1285"><a id="__codelineno-0-1285" name="__codelineno-0-1285"></a>
-</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a><span class="sd">            - `ValueError`: If the signature does not track abundance or if `max_abundance` is invalid.</span>
-</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">max_abundance</span><span class="p">,</span> <span class="s2">&quot;keep maximum abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a><span class="sd">        The updated hash set \( H&#39; \) is:</span>
+</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a><span class="sd">        H&#39; = \{ h \in H \mid a(h) \leq \text{max\_abundance} \}</span>
+</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a><span class="sd">        $$</span>
 </span><span id="__span-0-1290"><a id="__codelineno-0-1290" name="__codelineno-0-1290"></a>
-</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&lt;=</span> <span class="n">max_abundance</span>
-</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
-</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Kept hashes with abundance &lt;= </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">max_abundance</span><span class="p">)</span>
-</span><span id="__span-0-1294"><a id="__codelineno-0-1294" name="__codelineno-0-1294"></a>
-</span><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a>    <span class="k">def</span> <span class="nf">trim_below_median</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a><span class="sd">        Trim hashes with abundances below the median abundance.</span>
+</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a><span class="sd">        **Parameters**:</span>
+</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a><span class="sd">            - `max_abundance (int)`: The maximum abundance threshold.</span>
+</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a>
+</span><span id="__span-0-1294"><a id="__codelineno-0-1294" name="__codelineno-0-1294"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a><span class="sd">            - `ValueError`: If the signature does not track abundance or if `max_abundance` is invalid.</span>
+</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">max_abundance</span><span class="p">,</span> <span class="s2">&quot;keep maximum abundance&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1298"><a id="__codelineno-0-1298" name="__codelineno-0-1298"></a>
-</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a><span class="sd">        This method removes all hashes whose abundances are less than the median abundance of the signature.</span>
-</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a>
-</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&lt;=</span> <span class="n">max_abundance</span>
+</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
+</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Kept hashes with abundance &lt;= </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">max_abundance</span><span class="p">)</span>
 </span><span id="__span-0-1302"><a id="__codelineno-0-1302" name="__codelineno-0-1302"></a>
-</span><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a><span class="sd">        Let \\( m \\) be the median of \\( \\{ a(h) \mid h \in H \\} \\).</span>
-</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a><span class="sd">        The updated hash set \\( H&#39; \\) is:</span>
-</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a>
-</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a><span class="sd">        H&#39; = \\{ h \in H \mid a(h) \geq m \\}</span>
-</span><span id="__span-0-1308"><a id="__codelineno-0-1308" name="__codelineno-0-1308"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a>
-</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a><span class="sd">            - `ValueError`: If the signature does not track abundance.</span>
-</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a>    <span class="k">def</span> <span class="nf">trim_below_median</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a><span class="sd">        Trim hashes with abundances below the median abundance.</span>
+</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a>
+</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a><span class="sd">        This method removes all hashes whose abundances are less than the median abundance of the signature.</span>
+</span><span id="__span-0-1308"><a id="__codelineno-0-1308" name="__codelineno-0-1308"></a>
+</span><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a>
+</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a><span class="sd">        Let \\( m \\) be the median of \\( \\{ a(h) \mid h \in H \\} \\).</span>
+</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a><span class="sd">        The updated hash set \\( H&#39; \\) is:</span>
 </span><span id="__span-0-1313"><a id="__codelineno-0-1313" name="__codelineno-0-1313"></a>
-</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;trim below median&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a>
-</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No hashes to trim based on median abundance.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a>            <span class="k">return</span>
-</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a>
-</span><span id="__span-0-1320"><a id="__codelineno-0-1320" name="__codelineno-0-1320"></a>        <span class="n">median</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span>
-</span><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&gt;=</span> <span class="n">median</span>
-</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
-</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trimmed hashes with abundance below median (</span><span class="si">%f</span><span class="s2">).&quot;</span><span class="p">,</span> <span class="n">median</span><span class="p">)</span>
-</span><span id="__span-0-1324"><a id="__codelineno-0-1324" name="__codelineno-0-1324"></a>
-</span><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a>    <span class="k">def</span> <span class="nf">count_singletons</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
-</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a><span class="sd">        Return the number of hashes with abundance equal to 1.</span>
-</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a>
-</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a><span class="sd">            int: Number of singletons.</span>
-</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a>
-</span><span id="__span-0-1332"><a id="__codelineno-0-1332" name="__codelineno-0-1332"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a><span class="sd">            ValueError: If the signature does not track abundance.</span>
-</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;count singletons&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a><span class="sd">        H&#39; = \\{ h \in H \mid a(h) \geq m \\}</span>
+</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a>
+</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a><span class="sd">            - `ValueError`: If the signature does not track abundance.</span>
+</span><span id="__span-0-1320"><a id="__codelineno-0-1320" name="__codelineno-0-1320"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a>
+</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;trim below median&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>
+</span><span id="__span-0-1324"><a id="__codelineno-0-1324" name="__codelineno-0-1324"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No hashes to trim based on median abundance.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a>            <span class="k">return</span>
+</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a>
+</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a>        <span class="n">median</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span>
+</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&gt;=</span> <span class="n">median</span>
+</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
+</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trimmed hashes with abundance below median (</span><span class="si">%f</span><span class="s2">).&quot;</span><span class="p">,</span> <span class="n">median</span><span class="p">)</span>
+</span><span id="__span-0-1332"><a id="__codelineno-0-1332" name="__codelineno-0-1332"></a>
+</span><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a>    <span class="k">def</span> <span class="nf">count_singletons</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a><span class="sd">        Return the number of hashes with abundance equal to 1.</span>
 </span><span id="__span-0-1336"><a id="__codelineno-0-1336" name="__codelineno-0-1336"></a>
-</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a>        <span class="n">count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">==</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-1338"><a id="__codelineno-0-1338" name="__codelineno-0-1338"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Number of singletons (abundance == 1): </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">count</span><span class="p">)</span>
-</span><span id="__span-0-1339"><a id="__codelineno-0-1339" name="__codelineno-0-1339"></a>        <span class="k">return</span> <span class="nb">int</span><span class="p">(</span><span class="n">count</span><span class="p">)</span>
-</span><span id="__span-0-1340"><a id="__codelineno-0-1340" name="__codelineno-0-1340"></a>
-</span><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a>    <span class="k">def</span> <span class="nf">trim_singletons</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a><span class="sd">        Remove hashes with abundance equal to 1.</span>
+</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1338"><a id="__codelineno-0-1338" name="__codelineno-0-1338"></a><span class="sd">            int: Number of singletons.</span>
+</span><span id="__span-0-1339"><a id="__codelineno-0-1339" name="__codelineno-0-1339"></a>
+</span><span id="__span-0-1340"><a id="__codelineno-0-1340" name="__codelineno-0-1340"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a><span class="sd">            ValueError: If the signature does not track abundance.</span>
+</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;count singletons&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1344"><a id="__codelineno-0-1344" name="__codelineno-0-1344"></a>
-</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a><span class="sd">        This method removes all hashes that are singletons (abundance equals 1).</span>
-</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a>
-</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a>        <span class="n">count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">==</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Number of singletons (abundance == 1): </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">count</span><span class="p">)</span>
+</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a>        <span class="k">return</span> <span class="nb">int</span><span class="p">(</span><span class="n">count</span><span class="p">)</span>
 </span><span id="__span-0-1348"><a id="__codelineno-0-1348" name="__codelineno-0-1348"></a>
-</span><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a><span class="sd">        The updated hash set \( H&#39; \) is:</span>
-</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a><span class="sd">        H&#39; = \{ h \in H \mid a(h) \neq 1 \}</span>
-</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a><span class="sd">        $$</span>
-</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a>
-</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a><span class="sd">        **Raises**:</span>
-</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a><span class="sd">            - `ValueError`: If the signature does not track abundance.</span>
-</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;trim singletons&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a>
-</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">!=</span> <span class="mi">1</span>
-</span><span id="__span-0-1360"><a id="__codelineno-0-1360" name="__codelineno-0-1360"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
-</span><span id="__span-0-1361"><a id="__codelineno-0-1361" name="__codelineno-0-1361"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trimmed hashes with abundance equal to 1.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1362"><a id="__codelineno-0-1362" name="__codelineno-0-1362"></a>
-</span><span id="__span-0-1363"><a id="__codelineno-0-1363" name="__codelineno-0-1363"></a>    <span class="c1"># New Properties Implemented as per Request</span>
-</span><span id="__span-0-1364"><a id="__codelineno-0-1364" name="__codelineno-0-1364"></a>
-</span><span id="__span-0-1365"><a id="__codelineno-0-1365" name="__codelineno-0-1365"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-1366"><a id="__codelineno-0-1366" name="__codelineno-0-1366"></a>    <span class="k">def</span> <span class="nf">total_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
-</span><span id="__span-0-1367"><a id="__codelineno-0-1367" name="__codelineno-0-1367"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1368"><a id="__codelineno-0-1368" name="__codelineno-0-1368"></a><span class="sd">        Return the total abundance (sum of all abundances).</span>
-</span><span id="__span-0-1369"><a id="__codelineno-0-1369" name="__codelineno-0-1369"></a>
-</span><span id="__span-0-1370"><a id="__codelineno-0-1370" name="__codelineno-0-1370"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1371"><a id="__codelineno-0-1371" name="__codelineno-0-1371"></a><span class="sd">            int: Total abundance.</span>
-</span><span id="__span-0-1372"><a id="__codelineno-0-1372" name="__codelineno-0-1372"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1373"><a id="__codelineno-0-1373" name="__codelineno-0-1373"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;calculate total abundance&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1374"><a id="__codelineno-0-1374" name="__codelineno-0-1374"></a>
-</span><span id="__span-0-1375"><a id="__codelineno-0-1375" name="__codelineno-0-1375"></a>        <span class="n">total</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">))</span>
-</span><span id="__span-0-1376"><a id="__codelineno-0-1376" name="__codelineno-0-1376"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Total abundance: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">total</span><span class="p">)</span>
-</span><span id="__span-0-1377"><a id="__codelineno-0-1377" name="__codelineno-0-1377"></a>        <span class="k">return</span> <span class="n">total</span>
+</span><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a>    <span class="k">def</span> <span class="nf">trim_singletons</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a><span class="sd">        Remove hashes with abundance equal to 1.</span>
+</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a>
+</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a><span class="sd">        This method removes all hashes that are singletons (abundance equals 1).</span>
+</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a>
+</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a><span class="sd">        **Mathematical Explanation**:</span>
+</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a>
+</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a><span class="sd">        The updated hash set \( H&#39; \) is:</span>
+</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a><span class="sd">        H&#39; = \{ h \in H \mid a(h) \neq 1 \}</span>
+</span><span id="__span-0-1360"><a id="__codelineno-0-1360" name="__codelineno-0-1360"></a><span class="sd">        $$</span>
+</span><span id="__span-0-1361"><a id="__codelineno-0-1361" name="__codelineno-0-1361"></a>
+</span><span id="__span-0-1362"><a id="__codelineno-0-1362" name="__codelineno-0-1362"></a><span class="sd">        **Raises**:</span>
+</span><span id="__span-0-1363"><a id="__codelineno-0-1363" name="__codelineno-0-1363"></a><span class="sd">            - `ValueError`: If the signature does not track abundance.</span>
+</span><span id="__span-0-1364"><a id="__codelineno-0-1364" name="__codelineno-0-1364"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1365"><a id="__codelineno-0-1365" name="__codelineno-0-1365"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;trim singletons&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1366"><a id="__codelineno-0-1366" name="__codelineno-0-1366"></a>
+</span><span id="__span-0-1367"><a id="__codelineno-0-1367" name="__codelineno-0-1367"></a>        <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">!=</span> <span class="mi">1</span>
+</span><span id="__span-0-1368"><a id="__codelineno-0-1368" name="__codelineno-0-1368"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trimming </span><span class="si">%d</span><span class="s2"> hashes with abundance equal to 1.&quot;</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="o">~</span><span class="n">mask</span><span class="p">))</span>
+</span><span id="__span-0-1369"><a id="__codelineno-0-1369" name="__codelineno-0-1369"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
+</span><span id="__span-0-1370"><a id="__codelineno-0-1370" name="__codelineno-0-1370"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Size after trimming singletons: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">))</span> 
+</span><span id="__span-0-1371"><a id="__codelineno-0-1371" name="__codelineno-0-1371"></a>
+</span><span id="__span-0-1372"><a id="__codelineno-0-1372" name="__codelineno-0-1372"></a>    <span class="c1"># New Properties Implemented as per Request</span>
+</span><span id="__span-0-1373"><a id="__codelineno-0-1373" name="__codelineno-0-1373"></a>
+</span><span id="__span-0-1374"><a id="__codelineno-0-1374" name="__codelineno-0-1374"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-1375"><a id="__codelineno-0-1375" name="__codelineno-0-1375"></a>    <span class="k">def</span> <span class="nf">total_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="__span-0-1376"><a id="__codelineno-0-1376" name="__codelineno-0-1376"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1377"><a id="__codelineno-0-1377" name="__codelineno-0-1377"></a><span class="sd">        Return the total abundance (sum of all abundances).</span>
 </span><span id="__span-0-1378"><a id="__codelineno-0-1378" name="__codelineno-0-1378"></a>
-</span><span id="__span-0-1379"><a id="__codelineno-0-1379" name="__codelineno-0-1379"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-1380"><a id="__codelineno-0-1380" name="__codelineno-0-1380"></a>    <span class="k">def</span> <span class="nf">mean_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="__span-0-1381"><a id="__codelineno-0-1381" name="__codelineno-0-1381"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1382"><a id="__codelineno-0-1382" name="__codelineno-0-1382"></a><span class="sd">        Return the mean (average) abundance.</span>
+</span><span id="__span-0-1379"><a id="__codelineno-0-1379" name="__codelineno-0-1379"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1380"><a id="__codelineno-0-1380" name="__codelineno-0-1380"></a><span class="sd">            int: Total abundance.</span>
+</span><span id="__span-0-1381"><a id="__codelineno-0-1381" name="__codelineno-0-1381"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1382"><a id="__codelineno-0-1382" name="__codelineno-0-1382"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;calculate total abundance&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1383"><a id="__codelineno-0-1383" name="__codelineno-0-1383"></a>
-</span><span id="__span-0-1384"><a id="__codelineno-0-1384" name="__codelineno-0-1384"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1385"><a id="__codelineno-0-1385" name="__codelineno-0-1385"></a><span class="sd">            float: Mean abundance.</span>
-</span><span id="__span-0-1386"><a id="__codelineno-0-1386" name="__codelineno-0-1386"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1387"><a id="__codelineno-0-1387" name="__codelineno-0-1387"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;calculate mean abundance&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1388"><a id="__codelineno-0-1388" name="__codelineno-0-1388"></a>
-</span><span id="__span-0-1389"><a id="__codelineno-0-1389" name="__codelineno-0-1389"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1390"><a id="__codelineno-0-1390" name="__codelineno-0-1390"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No abundances to calculate mean.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1391"><a id="__codelineno-0-1391" name="__codelineno-0-1391"></a>            <span class="k">return</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1384"><a id="__codelineno-0-1384" name="__codelineno-0-1384"></a>        <span class="n">total</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">))</span>
+</span><span id="__span-0-1385"><a id="__codelineno-0-1385" name="__codelineno-0-1385"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Total abundance: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">total</span><span class="p">)</span>
+</span><span id="__span-0-1386"><a id="__codelineno-0-1386" name="__codelineno-0-1386"></a>        <span class="k">return</span> <span class="n">total</span>
+</span><span id="__span-0-1387"><a id="__codelineno-0-1387" name="__codelineno-0-1387"></a>
+</span><span id="__span-0-1388"><a id="__codelineno-0-1388" name="__codelineno-0-1388"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-1389"><a id="__codelineno-0-1389" name="__codelineno-0-1389"></a>    <span class="k">def</span> <span class="nf">mean_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="__span-0-1390"><a id="__codelineno-0-1390" name="__codelineno-0-1390"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1391"><a id="__codelineno-0-1391" name="__codelineno-0-1391"></a><span class="sd">        Return the mean (average) abundance.</span>
 </span><span id="__span-0-1392"><a id="__codelineno-0-1392" name="__codelineno-0-1392"></a>
-</span><span id="__span-0-1393"><a id="__codelineno-0-1393" name="__codelineno-0-1393"></a>        <span class="n">mean</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">))</span>  <span class="c1"># Changed to float</span>
-</span><span id="__span-0-1394"><a id="__codelineno-0-1394" name="__codelineno-0-1394"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Mean abundance: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">mean</span><span class="p">)</span>
-</span><span id="__span-0-1395"><a id="__codelineno-0-1395" name="__codelineno-0-1395"></a>        <span class="k">return</span> <span class="n">mean</span>
-</span><span id="__span-0-1396"><a id="__codelineno-0-1396" name="__codelineno-0-1396"></a>
-</span><span id="__span-0-1397"><a id="__codelineno-0-1397" name="__codelineno-0-1397"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-1398"><a id="__codelineno-0-1398" name="__codelineno-0-1398"></a>    <span class="k">def</span> <span class="nf">get_sample_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
-</span><span id="__span-0-1399"><a id="__codelineno-0-1399" name="__codelineno-0-1399"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1400"><a id="__codelineno-0-1400" name="__codelineno-0-1400"></a><span class="sd">        Retrieve statistical information about the signature.</span>
+</span><span id="__span-0-1393"><a id="__codelineno-0-1393" name="__codelineno-0-1393"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1394"><a id="__codelineno-0-1394" name="__codelineno-0-1394"></a><span class="sd">            float: Mean abundance.</span>
+</span><span id="__span-0-1395"><a id="__codelineno-0-1395" name="__codelineno-0-1395"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1396"><a id="__codelineno-0-1396" name="__codelineno-0-1396"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;calculate mean abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1397"><a id="__codelineno-0-1397" name="__codelineno-0-1397"></a>
+</span><span id="__span-0-1398"><a id="__codelineno-0-1398" name="__codelineno-0-1398"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1399"><a id="__codelineno-0-1399" name="__codelineno-0-1399"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No abundances to calculate mean.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1400"><a id="__codelineno-0-1400" name="__codelineno-0-1400"></a>            <span class="k">return</span> <span class="mf">0.0</span>
 </span><span id="__span-0-1401"><a id="__codelineno-0-1401" name="__codelineno-0-1401"></a>
-</span><span id="__span-0-1402"><a id="__codelineno-0-1402" name="__codelineno-0-1402"></a><span class="sd">        This property computes and returns a dictionary containing various statistics of the signature, such as total abundance, mean and median abundances, number of singletons, and total number of hashes.</span>
-</span><span id="__span-0-1403"><a id="__codelineno-0-1403" name="__codelineno-0-1403"></a>
-</span><span id="__span-0-1404"><a id="__codelineno-0-1404" name="__codelineno-0-1404"></a><span class="sd">        **Returns**:</span>
-</span><span id="__span-0-1405"><a id="__codelineno-0-1405" name="__codelineno-0-1405"></a><span class="sd">            - `dict`: A dictionary containing sample statistics:</span>
-</span><span id="__span-0-1406"><a id="__codelineno-0-1406" name="__codelineno-0-1406"></a><span class="sd">                - `total_abundance`: Sum of abundances.</span>
-</span><span id="__span-0-1407"><a id="__codelineno-0-1407" name="__codelineno-0-1407"></a><span class="sd">                - `mean_abundance`: Mean abundance.</span>
-</span><span id="__span-0-1408"><a id="__codelineno-0-1408" name="__codelineno-0-1408"></a><span class="sd">                - `median_abundance`: Median abundance.</span>
-</span><span id="__span-0-1409"><a id="__codelineno-0-1409" name="__codelineno-0-1409"></a><span class="sd">                - `num_singletons`: Number of hashes with abundance equal to 1.</span>
-</span><span id="__span-0-1410"><a id="__codelineno-0-1410" name="__codelineno-0-1410"></a><span class="sd">                - `num_hashes`: Total number of hashes.</span>
-</span><span id="__span-0-1411"><a id="__codelineno-0-1411" name="__codelineno-0-1411"></a><span class="sd">                - `ksize`: K-mer size.</span>
-</span><span id="__span-0-1412"><a id="__codelineno-0-1412" name="__codelineno-0-1412"></a><span class="sd">                - `scale`: Scale value.</span>
-</span><span id="__span-0-1413"><a id="__codelineno-0-1413" name="__codelineno-0-1413"></a><span class="sd">                - `name`: Name of the signature.</span>
-</span><span id="__span-0-1414"><a id="__codelineno-0-1414" name="__codelineno-0-1414"></a><span class="sd">                - `filename`: Filename of the signature.</span>
-</span><span id="__span-0-1415"><a id="__codelineno-0-1415" name="__codelineno-0-1415"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1416"><a id="__codelineno-0-1416" name="__codelineno-0-1416"></a>
-</span><span id="__span-0-1417"><a id="__codelineno-0-1417" name="__codelineno-0-1417"></a>        <span class="c1"># if self.sigtype != SigType.SAMPLE then don&#39;t return abundance stats</span>
-</span><span id="__span-0-1418"><a id="__codelineno-0-1418" name="__codelineno-0-1418"></a>
-</span><span id="__span-0-1419"><a id="__codelineno-0-1419" name="__codelineno-0-1419"></a>        <span class="n">stats</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-1420"><a id="__codelineno-0-1420" name="__codelineno-0-1420"></a>            <span class="s2">&quot;num_hashes&quot;</span><span class="p">:</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">),</span>
-</span><span id="__span-0-1421"><a id="__codelineno-0-1421" name="__codelineno-0-1421"></a>            <span class="s2">&quot;ksize&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-1422"><a id="__codelineno-0-1422" name="__codelineno-0-1422"></a>            <span class="s2">&quot;scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-1423"><a id="__codelineno-0-1423" name="__codelineno-0-1423"></a>            <span class="s2">&quot;name&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span>
-</span><span id="__span-0-1424"><a id="__codelineno-0-1424" name="__codelineno-0-1424"></a>            <span class="s2">&quot;filename&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span>
-</span><span id="__span-0-1425"><a id="__codelineno-0-1425" name="__codelineno-0-1425"></a>        <span class="p">}</span>
-</span><span id="__span-0-1426"><a id="__codelineno-0-1426" name="__codelineno-0-1426"></a>
-</span><span id="__span-0-1427"><a id="__codelineno-0-1427" name="__codelineno-0-1427"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">!=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">:</span>
-</span><span id="__span-0-1428"><a id="__codelineno-0-1428" name="__codelineno-0-1428"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1429"><a id="__codelineno-0-1429" name="__codelineno-0-1429"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1430"><a id="__codelineno-0-1430" name="__codelineno-0-1430"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1431"><a id="__codelineno-0-1431" name="__codelineno-0-1431"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;num_singletons&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-1432"><a id="__codelineno-0-1432" name="__codelineno-0-1432"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1433"><a id="__codelineno-0-1433" name="__codelineno-0-1433"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">total_abundance</span>
-</span><span id="__span-0-1434"><a id="__codelineno-0-1434" name="__codelineno-0-1434"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">mean_abundance</span>
-</span><span id="__span-0-1435"><a id="__codelineno-0-1435" name="__codelineno-0-1435"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">median_abundance</span>
-</span><span id="__span-0-1436"><a id="__codelineno-0-1436" name="__codelineno-0-1436"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;num_singletons&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">count_singletons</span><span class="p">()</span>
-</span><span id="__span-0-1437"><a id="__codelineno-0-1437" name="__codelineno-0-1437"></a>
-</span><span id="__span-0-1438"><a id="__codelineno-0-1438" name="__codelineno-0-1438"></a>        <span class="k">return</span> <span class="n">stats</span>
-</span><span id="__span-0-1439"><a id="__codelineno-0-1439" name="__codelineno-0-1439"></a>
-</span><span id="__span-0-1440"><a id="__codelineno-0-1440" name="__codelineno-0-1440"></a>    <span class="nd">@property</span>
-</span><span id="__span-0-1441"><a id="__codelineno-0-1441" name="__codelineno-0-1441"></a>    <span class="k">def</span> <span class="nf">median_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
-</span><span id="__span-0-1442"><a id="__codelineno-0-1442" name="__codelineno-0-1442"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1443"><a id="__codelineno-0-1443" name="__codelineno-0-1443"></a><span class="sd">        Return the median abundance.</span>
-</span><span id="__span-0-1444"><a id="__codelineno-0-1444" name="__codelineno-0-1444"></a>
-</span><span id="__span-0-1445"><a id="__codelineno-0-1445" name="__codelineno-0-1445"></a><span class="sd">        Returns:</span>
-</span><span id="__span-0-1446"><a id="__codelineno-0-1446" name="__codelineno-0-1446"></a><span class="sd">            float: Median abundance.</span>
-</span><span id="__span-0-1447"><a id="__codelineno-0-1447" name="__codelineno-0-1447"></a>
-</span><span id="__span-0-1448"><a id="__codelineno-0-1448" name="__codelineno-0-1448"></a><span class="sd">        Raises:</span>
-</span><span id="__span-0-1449"><a id="__codelineno-0-1449" name="__codelineno-0-1449"></a><span class="sd">            ValueError: If the signature does not track abundance.</span>
-</span><span id="__span-0-1450"><a id="__codelineno-0-1450" name="__codelineno-0-1450"></a><span class="sd">        &quot;&quot;&quot;</span>
-</span><span id="__span-0-1451"><a id="__codelineno-0-1451" name="__codelineno-0-1451"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;calculate median abundance&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1452"><a id="__codelineno-0-1452" name="__codelineno-0-1452"></a>
-</span><span id="__span-0-1453"><a id="__codelineno-0-1453" name="__codelineno-0-1453"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1454"><a id="__codelineno-0-1454" name="__codelineno-0-1454"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No abundances to calculate median.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1455"><a id="__codelineno-0-1455" name="__codelineno-0-1455"></a>            <span class="k">return</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1402"><a id="__codelineno-0-1402" name="__codelineno-0-1402"></a>        <span class="n">mean</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">))</span>  <span class="c1"># Changed to float</span>
+</span><span id="__span-0-1403"><a id="__codelineno-0-1403" name="__codelineno-0-1403"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Mean abundance: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">mean</span><span class="p">)</span>
+</span><span id="__span-0-1404"><a id="__codelineno-0-1404" name="__codelineno-0-1404"></a>        <span class="k">return</span> <span class="n">mean</span>
+</span><span id="__span-0-1405"><a id="__codelineno-0-1405" name="__codelineno-0-1405"></a>
+</span><span id="__span-0-1406"><a id="__codelineno-0-1406" name="__codelineno-0-1406"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-1407"><a id="__codelineno-0-1407" name="__codelineno-0-1407"></a>    <span class="k">def</span> <span class="nf">get_sample_stats</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
+</span><span id="__span-0-1408"><a id="__codelineno-0-1408" name="__codelineno-0-1408"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1409"><a id="__codelineno-0-1409" name="__codelineno-0-1409"></a><span class="sd">        Retrieve statistical information about the signature.</span>
+</span><span id="__span-0-1410"><a id="__codelineno-0-1410" name="__codelineno-0-1410"></a>
+</span><span id="__span-0-1411"><a id="__codelineno-0-1411" name="__codelineno-0-1411"></a><span class="sd">        This property computes and returns a dictionary containing various statistics of the signature, such as total abundance, mean and median abundances, number of singletons, and total number of hashes.</span>
+</span><span id="__span-0-1412"><a id="__codelineno-0-1412" name="__codelineno-0-1412"></a>
+</span><span id="__span-0-1413"><a id="__codelineno-0-1413" name="__codelineno-0-1413"></a><span class="sd">        **Returns**:</span>
+</span><span id="__span-0-1414"><a id="__codelineno-0-1414" name="__codelineno-0-1414"></a><span class="sd">            - `dict`: A dictionary containing sample statistics:</span>
+</span><span id="__span-0-1415"><a id="__codelineno-0-1415" name="__codelineno-0-1415"></a><span class="sd">                - `total_abundance`: Sum of abundances.</span>
+</span><span id="__span-0-1416"><a id="__codelineno-0-1416" name="__codelineno-0-1416"></a><span class="sd">                - `mean_abundance`: Mean abundance.</span>
+</span><span id="__span-0-1417"><a id="__codelineno-0-1417" name="__codelineno-0-1417"></a><span class="sd">                - `median_abundance`: Median abundance.</span>
+</span><span id="__span-0-1418"><a id="__codelineno-0-1418" name="__codelineno-0-1418"></a><span class="sd">                - `num_singletons`: Number of hashes with abundance equal to 1.</span>
+</span><span id="__span-0-1419"><a id="__codelineno-0-1419" name="__codelineno-0-1419"></a><span class="sd">                - `num_hashes`: Total number of hashes.</span>
+</span><span id="__span-0-1420"><a id="__codelineno-0-1420" name="__codelineno-0-1420"></a><span class="sd">                - `ksize`: K-mer size.</span>
+</span><span id="__span-0-1421"><a id="__codelineno-0-1421" name="__codelineno-0-1421"></a><span class="sd">                - `scale`: Scale value.</span>
+</span><span id="__span-0-1422"><a id="__codelineno-0-1422" name="__codelineno-0-1422"></a><span class="sd">                - `name`: Name of the signature.</span>
+</span><span id="__span-0-1423"><a id="__codelineno-0-1423" name="__codelineno-0-1423"></a><span class="sd">                - `filename`: Filename of the signature.</span>
+</span><span id="__span-0-1424"><a id="__codelineno-0-1424" name="__codelineno-0-1424"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1425"><a id="__codelineno-0-1425" name="__codelineno-0-1425"></a>
+</span><span id="__span-0-1426"><a id="__codelineno-0-1426" name="__codelineno-0-1426"></a>        <span class="c1"># if self.sigtype != SigType.SAMPLE then don&#39;t return abundance stats</span>
+</span><span id="__span-0-1427"><a id="__codelineno-0-1427" name="__codelineno-0-1427"></a>
+</span><span id="__span-0-1428"><a id="__codelineno-0-1428" name="__codelineno-0-1428"></a>        <span class="n">stats</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-1429"><a id="__codelineno-0-1429" name="__codelineno-0-1429"></a>            <span class="s2">&quot;num_hashes&quot;</span><span class="p">:</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">),</span>
+</span><span id="__span-0-1430"><a id="__codelineno-0-1430" name="__codelineno-0-1430"></a>            <span class="s2">&quot;ksize&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-1431"><a id="__codelineno-0-1431" name="__codelineno-0-1431"></a>            <span class="s2">&quot;scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-1432"><a id="__codelineno-0-1432" name="__codelineno-0-1432"></a>            <span class="s2">&quot;name&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span>
+</span><span id="__span-0-1433"><a id="__codelineno-0-1433" name="__codelineno-0-1433"></a>            <span class="s2">&quot;filename&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span>
+</span><span id="__span-0-1434"><a id="__codelineno-0-1434" name="__codelineno-0-1434"></a>        <span class="p">}</span>
+</span><span id="__span-0-1435"><a id="__codelineno-0-1435" name="__codelineno-0-1435"></a>
+</span><span id="__span-0-1436"><a id="__codelineno-0-1436" name="__codelineno-0-1436"></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">sigtype</span> <span class="o">!=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">:</span>
+</span><span id="__span-0-1437"><a id="__codelineno-0-1437" name="__codelineno-0-1437"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1438"><a id="__codelineno-0-1438" name="__codelineno-0-1438"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1439"><a id="__codelineno-0-1439" name="__codelineno-0-1439"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1440"><a id="__codelineno-0-1440" name="__codelineno-0-1440"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;num_singletons&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-1441"><a id="__codelineno-0-1441" name="__codelineno-0-1441"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1442"><a id="__codelineno-0-1442" name="__codelineno-0-1442"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;total_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">total_abundance</span>
+</span><span id="__span-0-1443"><a id="__codelineno-0-1443" name="__codelineno-0-1443"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;mean_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">mean_abundance</span>
+</span><span id="__span-0-1444"><a id="__codelineno-0-1444" name="__codelineno-0-1444"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;median_abundance&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">median_abundance</span>
+</span><span id="__span-0-1445"><a id="__codelineno-0-1445" name="__codelineno-0-1445"></a>            <span class="n">stats</span><span class="p">[</span><span class="s2">&quot;num_singletons&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">count_singletons</span><span class="p">()</span>
+</span><span id="__span-0-1446"><a id="__codelineno-0-1446" name="__codelineno-0-1446"></a>
+</span><span id="__span-0-1447"><a id="__codelineno-0-1447" name="__codelineno-0-1447"></a>        <span class="k">return</span> <span class="n">stats</span>
+</span><span id="__span-0-1448"><a id="__codelineno-0-1448" name="__codelineno-0-1448"></a>
+</span><span id="__span-0-1449"><a id="__codelineno-0-1449" name="__codelineno-0-1449"></a>    <span class="nd">@property</span>
+</span><span id="__span-0-1450"><a id="__codelineno-0-1450" name="__codelineno-0-1450"></a>    <span class="k">def</span> <span class="nf">median_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">float</span><span class="p">:</span>
+</span><span id="__span-0-1451"><a id="__codelineno-0-1451" name="__codelineno-0-1451"></a><span class="w">        </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1452"><a id="__codelineno-0-1452" name="__codelineno-0-1452"></a><span class="sd">        Return the median abundance.</span>
+</span><span id="__span-0-1453"><a id="__codelineno-0-1453" name="__codelineno-0-1453"></a>
+</span><span id="__span-0-1454"><a id="__codelineno-0-1454" name="__codelineno-0-1454"></a><span class="sd">        Returns:</span>
+</span><span id="__span-0-1455"><a id="__codelineno-0-1455" name="__codelineno-0-1455"></a><span class="sd">            float: Median abundance.</span>
 </span><span id="__span-0-1456"><a id="__codelineno-0-1456" name="__codelineno-0-1456"></a>
-</span><span id="__span-0-1457"><a id="__codelineno-0-1457" name="__codelineno-0-1457"></a>        <span class="n">median</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">))</span>  <span class="c1"># Changed to float</span>
-</span><span id="__span-0-1458"><a id="__codelineno-0-1458" name="__codelineno-0-1458"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Median abundance: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">median</span><span class="p">)</span>
-</span><span id="__span-0-1459"><a id="__codelineno-0-1459" name="__codelineno-0-1459"></a>        <span class="k">return</span> <span class="n">median</span>
+</span><span id="__span-0-1457"><a id="__codelineno-0-1457" name="__codelineno-0-1457"></a><span class="sd">        Raises:</span>
+</span><span id="__span-0-1458"><a id="__codelineno-0-1458" name="__codelineno-0-1458"></a><span class="sd">            ValueError: If the signature does not track abundance.</span>
+</span><span id="__span-0-1459"><a id="__codelineno-0-1459" name="__codelineno-0-1459"></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="__span-0-1460"><a id="__codelineno-0-1460" name="__codelineno-0-1460"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;calculate median abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1461"><a id="__codelineno-0-1461" name="__codelineno-0-1461"></a>
+</span><span id="__span-0-1462"><a id="__codelineno-0-1462" name="__codelineno-0-1462"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1463"><a id="__codelineno-0-1463" name="__codelineno-0-1463"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No abundances to calculate median.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1464"><a id="__codelineno-0-1464" name="__codelineno-0-1464"></a>            <span class="k">return</span> <span class="mf">0.0</span>
+</span><span id="__span-0-1465"><a id="__codelineno-0-1465" name="__codelineno-0-1465"></a>
+</span><span id="__span-0-1466"><a id="__codelineno-0-1466" name="__codelineno-0-1466"></a>        <span class="n">median</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">))</span>  <span class="c1"># Changed to float</span>
+</span><span id="__span-0-1467"><a id="__codelineno-0-1467" name="__codelineno-0-1467"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Median abundance: </span><span class="si">%f</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">median</span><span class="p">)</span>
+</span><span id="__span-0-1468"><a id="__codelineno-0-1468" name="__codelineno-0-1468"></a>        <span class="k">return</span> <span class="n">median</span>
 </span></code></pre></div></td></tr></table></div>
               </details>
 
@@ -4406,14 +4447,14 @@ <h2 id="snipe.api.SnipeSig" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.abundances" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.abundances" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">abundances</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.abundances" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.abundances" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4427,14 +4468,14 @@ <h3 id="snipe.api.SnipeSig.abundances" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.filename" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.filename" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">filename</span><span class="p">:</span> <span class="nb">str</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.filename" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.filename" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4448,14 +4489,14 @@ <h3 id="snipe.api.SnipeSig.filename" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.get_sample_stats" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.get_sample_stats" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">get_sample_stats</span><span class="p">:</span> <span class="nb">dict</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.get_sample_stats" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.get_sample_stats" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4481,14 +4522,14 @@ <h3 id="snipe.api.SnipeSig.get_sample_stats" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.hashes" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.hashes" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">hashes</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.hashes" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.hashes" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4502,14 +4543,14 @@ <h3 id="snipe.api.SnipeSig.hashes" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.ksize" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.ksize" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.ksize" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.ksize" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4523,14 +4564,14 @@ <h3 id="snipe.api.SnipeSig.ksize" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.md5sum" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.md5sum" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">md5sum</span><span class="p">:</span> <span class="nb">str</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.md5sum" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.md5sum" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4544,14 +4585,14 @@ <h3 id="snipe.api.SnipeSig.md5sum" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.mean_abundance" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.mean_abundance" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">mean_abundance</span><span class="p">:</span> <span class="nb">float</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.mean_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.mean_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4588,14 +4629,14 @@ <h3 id="snipe.api.SnipeSig.mean_abundance" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.median_abundance" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.median_abundance" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">median_abundance</span><span class="p">:</span> <span class="nb">float</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.median_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.median_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4655,14 +4696,14 @@ <h3 id="snipe.api.SnipeSig.median_abundance" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.name" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.name" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">name</span><span class="p">:</span> <span class="nb">str</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.name" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.name" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4676,14 +4717,14 @@ <h3 id="snipe.api.SnipeSig.name" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.scale" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.scale" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">scale</span><span class="p">:</span> <span class="nb">int</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.scale" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.scale" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4697,7 +4738,7 @@ <h3 id="snipe.api.SnipeSig.scale" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.sigtype" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.sigtype" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">sigtype</span><span class="p">:</span> <span class="n">SigType</span></code>
 
   <span class="doc doc-labels">
@@ -4705,7 +4746,7 @@ <h3 id="snipe.api.SnipeSig.sigtype" class="doc doc-heading">
       <small class="doc doc-label doc-label-writable"><code>writable</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.sigtype" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.sigtype" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4719,14 +4760,14 @@ <h3 id="snipe.api.SnipeSig.sigtype" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.total_abundance" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.total_abundance" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">total_abundance</span><span class="p">:</span> <span class="nb">int</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.total_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.total_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4763,14 +4804,14 @@ <h3 id="snipe.api.SnipeSig.total_abundance" class="doc doc-heading">
 
 
 
-<h3 id="snipe.api.SnipeSig.track_abundance" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.track_abundance" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">track_abundance</span><span class="p">:</span> <span class="nb">bool</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-property"><code>property</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.track_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.track_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4785,10 +4826,10 @@ <h3 id="snipe.api.SnipeSig.track_abundance" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__add__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__add__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__add__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__add__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__add__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4821,26 +4862,26 @@ <h3 id="snipe.api.SnipeSig.__add__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-714">714</a></span>
-<span class="normal"><a href="#__codelineno-0-715">715</a></span>
-<span class="normal"><a href="#__codelineno-0-716">716</a></span>
-<span class="normal"><a href="#__codelineno-0-717">717</a></span>
-<span class="normal"><a href="#__codelineno-0-718">718</a></span>
-<span class="normal"><a href="#__codelineno-0-719">719</a></span>
-<span class="normal"><a href="#__codelineno-0-720">720</a></span>
-<span class="normal"><a href="#__codelineno-0-721">721</a></span>
-<span class="normal"><a href="#__codelineno-0-722">722</a></span>
-<span class="normal"><a href="#__codelineno-0-723">723</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a><span class="k">def</span> <span class="fm">__add__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a><span class="sd">    Implements the + operator.</span>
-</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a><span class="sd">    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
-</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a><span class="sd">    returning a new signature.</span>
-</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>
-</span><span id="__span-0-720"><a id="__codelineno-0-720" name="__codelineno-0-720"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-721"><a id="__codelineno-0-721" name="__codelineno-0-721"></a><span class="sd">        SnipeSig: Union of self and other.</span>
-</span><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-722">722</a></span>
+<span class="normal"><a href="#__codelineno-0-723">723</a></span>
+<span class="normal"><a href="#__codelineno-0-724">724</a></span>
+<span class="normal"><a href="#__codelineno-0-725">725</a></span>
+<span class="normal"><a href="#__codelineno-0-726">726</a></span>
+<span class="normal"><a href="#__codelineno-0-727">727</a></span>
+<span class="normal"><a href="#__codelineno-0-728">728</a></span>
+<span class="normal"><a href="#__codelineno-0-729">729</a></span>
+<span class="normal"><a href="#__codelineno-0-730">730</a></span>
+<span class="normal"><a href="#__codelineno-0-731">731</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-722"><a id="__codelineno-0-722" name="__codelineno-0-722"></a><span class="k">def</span> <span class="fm">__add__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-723"><a id="__codelineno-0-723" name="__codelineno-0-723"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-724"><a id="__codelineno-0-724" name="__codelineno-0-724"></a><span class="sd">    Implements the + operator.</span>
+</span><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a><span class="sd">    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
+</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a><span class="sd">    returning a new signature.</span>
+</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a>
+</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a><span class="sd">        SnipeSig: Union of self and other.</span>
+</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4850,10 +4891,10 @@ <h3 id="snipe.api.SnipeSig.__add__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__and__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__and__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__and__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__and__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__and__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4885,24 +4926,24 @@ <h3 id="snipe.api.SnipeSig.__and__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-814">814</a></span>
-<span class="normal"><a href="#__codelineno-0-815">815</a></span>
-<span class="normal"><a href="#__codelineno-0-816">816</a></span>
-<span class="normal"><a href="#__codelineno-0-817">817</a></span>
-<span class="normal"><a href="#__codelineno-0-818">818</a></span>
-<span class="normal"><a href="#__codelineno-0-819">819</a></span>
-<span class="normal"><a href="#__codelineno-0-820">820</a></span>
-<span class="normal"><a href="#__codelineno-0-821">821</a></span>
-<span class="normal"><a href="#__codelineno-0-822">822</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a><span class="k">def</span> <span class="fm">__and__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a><span class="sd">    Implements the &amp; operator.</span>
-</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a><span class="sd">    Keeps common hashes and retains abundances from self only, returning a new signature.</span>
-</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>
-</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a><span class="sd">        SnipeSig: Intersection of self and other.</span>
-</span><span id="__span-0-821"><a id="__codelineno-0-821" name="__codelineno-0-821"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">intersection_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-822">822</a></span>
+<span class="normal"><a href="#__codelineno-0-823">823</a></span>
+<span class="normal"><a href="#__codelineno-0-824">824</a></span>
+<span class="normal"><a href="#__codelineno-0-825">825</a></span>
+<span class="normal"><a href="#__codelineno-0-826">826</a></span>
+<span class="normal"><a href="#__codelineno-0-827">827</a></span>
+<span class="normal"><a href="#__codelineno-0-828">828</a></span>
+<span class="normal"><a href="#__codelineno-0-829">829</a></span>
+<span class="normal"><a href="#__codelineno-0-830">830</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-822"><a id="__codelineno-0-822" name="__codelineno-0-822"></a><span class="k">def</span> <span class="fm">__and__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-823"><a id="__codelineno-0-823" name="__codelineno-0-823"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-824"><a id="__codelineno-0-824" name="__codelineno-0-824"></a><span class="sd">    Implements the &amp; operator.</span>
+</span><span id="__span-0-825"><a id="__codelineno-0-825" name="__codelineno-0-825"></a><span class="sd">    Keeps common hashes and retains abundances from self only, returning a new signature.</span>
+</span><span id="__span-0-826"><a id="__codelineno-0-826" name="__codelineno-0-826"></a>
+</span><span id="__span-0-827"><a id="__codelineno-0-827" name="__codelineno-0-827"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-828"><a id="__codelineno-0-828" name="__codelineno-0-828"></a><span class="sd">        SnipeSig: Intersection of self and other.</span>
+</span><span id="__span-0-829"><a id="__codelineno-0-829" name="__codelineno-0-829"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-830"><a id="__codelineno-0-830" name="__codelineno-0-830"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">intersection_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -4912,10 +4953,10 @@ <h3 id="snipe.api.SnipeSig.__and__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__contains__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__contains__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__contains__</span><span class="p">(</span><span class="n">hash_value</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__contains__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__contains__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -4977,36 +5018,36 @@ <h3 id="snipe.api.SnipeSig.__contains__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-301">301</a></span>
-<span class="normal"><a href="#__codelineno-0-302">302</a></span>
-<span class="normal"><a href="#__codelineno-0-303">303</a></span>
-<span class="normal"><a href="#__codelineno-0-304">304</a></span>
-<span class="normal"><a href="#__codelineno-0-305">305</a></span>
-<span class="normal"><a href="#__codelineno-0-306">306</a></span>
-<span class="normal"><a href="#__codelineno-0-307">307</a></span>
-<span class="normal"><a href="#__codelineno-0-308">308</a></span>
-<span class="normal"><a href="#__codelineno-0-309">309</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-309">309</a></span>
 <span class="normal"><a href="#__codelineno-0-310">310</a></span>
 <span class="normal"><a href="#__codelineno-0-311">311</a></span>
 <span class="normal"><a href="#__codelineno-0-312">312</a></span>
 <span class="normal"><a href="#__codelineno-0-313">313</a></span>
 <span class="normal"><a href="#__codelineno-0-314">314</a></span>
-<span class="normal"><a href="#__codelineno-0-315">315</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a><span class="k">def</span> <span class="fm">__contains__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">hash_value</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
-</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a><span class="sd">    Check if a hash is present in the signature.</span>
-</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a>
-</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a><span class="sd">        hash_value (int): The hash value to check.</span>
-</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>
-</span><span id="__span-0-308"><a id="__codelineno-0-308" name="__codelineno-0-308"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a><span class="sd">        bool: True if the hash is present, False otherwise.</span>
-</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a>    <span class="c1"># Utilize binary search since hashes are sorted</span>
-</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>    <span class="n">index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">searchsorted</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">hash_value</span><span class="p">)</span>
-</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a>    <span class="k">if</span> <span class="n">index</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">index</span><span class="p">]</span> <span class="o">==</span> <span class="n">hash_value</span><span class="p">:</span>
-</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a>        <span class="k">return</span> <span class="kc">True</span>
-</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>    <span class="k">return</span> <span class="kc">False</span>
+<span class="normal"><a href="#__codelineno-0-315">315</a></span>
+<span class="normal"><a href="#__codelineno-0-316">316</a></span>
+<span class="normal"><a href="#__codelineno-0-317">317</a></span>
+<span class="normal"><a href="#__codelineno-0-318">318</a></span>
+<span class="normal"><a href="#__codelineno-0-319">319</a></span>
+<span class="normal"><a href="#__codelineno-0-320">320</a></span>
+<span class="normal"><a href="#__codelineno-0-321">321</a></span>
+<span class="normal"><a href="#__codelineno-0-322">322</a></span>
+<span class="normal"><a href="#__codelineno-0-323">323</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-309"><a id="__codelineno-0-309" name="__codelineno-0-309"></a><span class="k">def</span> <span class="fm">__contains__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">hash_value</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">bool</span><span class="p">:</span>
+</span><span id="__span-0-310"><a id="__codelineno-0-310" name="__codelineno-0-310"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-311"><a id="__codelineno-0-311" name="__codelineno-0-311"></a><span class="sd">    Check if a hash is present in the signature.</span>
+</span><span id="__span-0-312"><a id="__codelineno-0-312" name="__codelineno-0-312"></a>
+</span><span id="__span-0-313"><a id="__codelineno-0-313" name="__codelineno-0-313"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-314"><a id="__codelineno-0-314" name="__codelineno-0-314"></a><span class="sd">        hash_value (int): The hash value to check.</span>
+</span><span id="__span-0-315"><a id="__codelineno-0-315" name="__codelineno-0-315"></a>
+</span><span id="__span-0-316"><a id="__codelineno-0-316" name="__codelineno-0-316"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-317"><a id="__codelineno-0-317" name="__codelineno-0-317"></a><span class="sd">        bool: True if the hash is present, False otherwise.</span>
+</span><span id="__span-0-318"><a id="__codelineno-0-318" name="__codelineno-0-318"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-319"><a id="__codelineno-0-319" name="__codelineno-0-319"></a>    <span class="c1"># Utilize binary search since hashes are sorted</span>
+</span><span id="__span-0-320"><a id="__codelineno-0-320" name="__codelineno-0-320"></a>    <span class="n">index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">searchsorted</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">hash_value</span><span class="p">)</span>
+</span><span id="__span-0-321"><a id="__codelineno-0-321" name="__codelineno-0-321"></a>    <span class="k">if</span> <span class="n">index</span> <span class="o">&lt;</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span> <span class="ow">and</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">index</span><span class="p">]</span> <span class="o">==</span> <span class="n">hash_value</span><span class="p">:</span>
+</span><span id="__span-0-322"><a id="__codelineno-0-322" name="__codelineno-0-322"></a>        <span class="k">return</span> <span class="kc">True</span>
+</span><span id="__span-0-323"><a id="__codelineno-0-323" name="__codelineno-0-323"></a>    <span class="k">return</span> <span class="kc">False</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5016,10 +5057,10 @@ <h3 id="snipe.api.SnipeSig.__contains__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__iadd__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__iadd__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__iadd__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__iadd__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__iadd__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -5052,30 +5093,30 @@ <h3 id="snipe.api.SnipeSig.__iadd__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-725">725</a></span>
-<span class="normal"><a href="#__codelineno-0-726">726</a></span>
-<span class="normal"><a href="#__codelineno-0-727">727</a></span>
-<span class="normal"><a href="#__codelineno-0-728">728</a></span>
-<span class="normal"><a href="#__codelineno-0-729">729</a></span>
-<span class="normal"><a href="#__codelineno-0-730">730</a></span>
-<span class="normal"><a href="#__codelineno-0-731">731</a></span>
-<span class="normal"><a href="#__codelineno-0-732">732</a></span>
-<span class="normal"><a href="#__codelineno-0-733">733</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-733">733</a></span>
 <span class="normal"><a href="#__codelineno-0-734">734</a></span>
 <span class="normal"><a href="#__codelineno-0-735">735</a></span>
-<span class="normal"><a href="#__codelineno-0-736">736</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-725"><a id="__codelineno-0-725" name="__codelineno-0-725"></a><span class="k">def</span> <span class="fm">__iadd__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-726"><a id="__codelineno-0-726" name="__codelineno-0-726"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-727"><a id="__codelineno-0-727" name="__codelineno-0-727"></a><span class="sd">    Implements the += operator.</span>
-</span><span id="__span-0-728"><a id="__codelineno-0-728" name="__codelineno-0-728"></a><span class="sd">    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
-</span><span id="__span-0-729"><a id="__codelineno-0-729" name="__codelineno-0-729"></a><span class="sd">    modifying self in-place.</span>
-</span><span id="__span-0-730"><a id="__codelineno-0-730" name="__codelineno-0-730"></a>
-</span><span id="__span-0-731"><a id="__codelineno-0-731" name="__codelineno-0-731"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-732"><a id="__codelineno-0-732" name="__codelineno-0-732"></a><span class="sd">        SnipeSig: Updated self after addition.</span>
-</span><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a>    <span class="n">union_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">union_sig</span><span class="p">)</span>
-</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a>    <span class="k">return</span> <span class="bp">self</span>
+<span class="normal"><a href="#__codelineno-0-736">736</a></span>
+<span class="normal"><a href="#__codelineno-0-737">737</a></span>
+<span class="normal"><a href="#__codelineno-0-738">738</a></span>
+<span class="normal"><a href="#__codelineno-0-739">739</a></span>
+<span class="normal"><a href="#__codelineno-0-740">740</a></span>
+<span class="normal"><a href="#__codelineno-0-741">741</a></span>
+<span class="normal"><a href="#__codelineno-0-742">742</a></span>
+<span class="normal"><a href="#__codelineno-0-743">743</a></span>
+<span class="normal"><a href="#__codelineno-0-744">744</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-733"><a id="__codelineno-0-733" name="__codelineno-0-733"></a><span class="k">def</span> <span class="fm">__iadd__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-734"><a id="__codelineno-0-734" name="__codelineno-0-734"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-735"><a id="__codelineno-0-735" name="__codelineno-0-735"></a><span class="sd">    Implements the += operator.</span>
+</span><span id="__span-0-736"><a id="__codelineno-0-736" name="__codelineno-0-736"></a><span class="sd">    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
+</span><span id="__span-0-737"><a id="__codelineno-0-737" name="__codelineno-0-737"></a><span class="sd">    modifying self in-place.</span>
+</span><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a>
+</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a><span class="sd">        SnipeSig: Updated self after addition.</span>
+</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a>    <span class="n">union_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">union_sig</span><span class="p">)</span>
+</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a>    <span class="k">return</span> <span class="bp">self</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5085,10 +5126,10 @@ <h3 id="snipe.api.SnipeSig.__iadd__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__init__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__init__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__init__</span><span class="p">(</span><span class="o">*</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="mi">51</span><span class="p">,</span> <span class="n">scale</span><span class="o">=</span><span class="mi">10000</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__init__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__init__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -5206,8 +5247,49 @@ <h3 id="snipe.api.SnipeSig.__init__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-60"> 60</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-19"> 19</a></span>
+<span class="normal"><a href="#__codelineno-0-20"> 20</a></span>
+<span class="normal"><a href="#__codelineno-0-21"> 21</a></span>
+<span class="normal"><a href="#__codelineno-0-22"> 22</a></span>
+<span class="normal"><a href="#__codelineno-0-23"> 23</a></span>
+<span class="normal"><a href="#__codelineno-0-24"> 24</a></span>
+<span class="normal"><a href="#__codelineno-0-25"> 25</a></span>
+<span class="normal"><a href="#__codelineno-0-26"> 26</a></span>
+<span class="normal"><a href="#__codelineno-0-27"> 27</a></span>
+<span class="normal"><a href="#__codelineno-0-28"> 28</a></span>
+<span class="normal"><a href="#__codelineno-0-29"> 29</a></span>
+<span class="normal"><a href="#__codelineno-0-30"> 30</a></span>
+<span class="normal"><a href="#__codelineno-0-31"> 31</a></span>
+<span class="normal"><a href="#__codelineno-0-32"> 32</a></span>
+<span class="normal"><a href="#__codelineno-0-33"> 33</a></span>
+<span class="normal"><a href="#__codelineno-0-34"> 34</a></span>
+<span class="normal"><a href="#__codelineno-0-35"> 35</a></span>
+<span class="normal"><a href="#__codelineno-0-36"> 36</a></span>
+<span class="normal"><a href="#__codelineno-0-37"> 37</a></span>
+<span class="normal"><a href="#__codelineno-0-38"> 38</a></span>
+<span class="normal"><a href="#__codelineno-0-39"> 39</a></span>
+<span class="normal"><a href="#__codelineno-0-40"> 40</a></span>
+<span class="normal"><a href="#__codelineno-0-41"> 41</a></span>
+<span class="normal"><a href="#__codelineno-0-42"> 42</a></span>
+<span class="normal"><a href="#__codelineno-0-43"> 43</a></span>
+<span class="normal"><a href="#__codelineno-0-44"> 44</a></span>
+<span class="normal"><a href="#__codelineno-0-45"> 45</a></span>
+<span class="normal"><a href="#__codelineno-0-46"> 46</a></span>
+<span class="normal"><a href="#__codelineno-0-47"> 47</a></span>
+<span class="normal"><a href="#__codelineno-0-48"> 48</a></span>
+<span class="normal"><a href="#__codelineno-0-49"> 49</a></span>
+<span class="normal"><a href="#__codelineno-0-50"> 50</a></span>
+<span class="normal"><a href="#__codelineno-0-51"> 51</a></span>
+<span class="normal"><a href="#__codelineno-0-52"> 52</a></span>
+<span class="normal"><a href="#__codelineno-0-53"> 53</a></span>
+<span class="normal"><a href="#__codelineno-0-54"> 54</a></span>
+<span class="normal"><a href="#__codelineno-0-55"> 55</a></span>
+<span class="normal"><a href="#__codelineno-0-56"> 56</a></span>
+<span class="normal"><a href="#__codelineno-0-57"> 57</a></span>
+<span class="normal"><a href="#__codelineno-0-58"> 58</a></span>
+<span class="normal"><a href="#__codelineno-0-59"> 59</a></span>
+<span class="normal"><a href="#__codelineno-0-60"> 60</a></span>
 <span class="normal"><a href="#__codelineno-0-61"> 61</a></span>
 <span class="normal"><a href="#__codelineno-0-62"> 62</a></span>
 <span class="normal"><a href="#__codelineno-0-63"> 63</a></span>
@@ -5323,185 +5405,164 @@ <h3 id="snipe.api.SnipeSig.__init__" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-173">173</a></span>
 <span class="normal"><a href="#__codelineno-0-174">174</a></span>
 <span class="normal"><a href="#__codelineno-0-175">175</a></span>
-<span class="normal"><a href="#__codelineno-0-176">176</a></span>
-<span class="normal"><a href="#__codelineno-0-177">177</a></span>
-<span class="normal"><a href="#__codelineno-0-178">178</a></span>
-<span class="normal"><a href="#__codelineno-0-179">179</a></span>
-<span class="normal"><a href="#__codelineno-0-180">180</a></span>
-<span class="normal"><a href="#__codelineno-0-181">181</a></span>
-<span class="normal"><a href="#__codelineno-0-182">182</a></span>
-<span class="normal"><a href="#__codelineno-0-183">183</a></span>
-<span class="normal"><a href="#__codelineno-0-184">184</a></span>
-<span class="normal"><a href="#__codelineno-0-185">185</a></span>
-<span class="normal"><a href="#__codelineno-0-186">186</a></span>
-<span class="normal"><a href="#__codelineno-0-187">187</a></span>
-<span class="normal"><a href="#__codelineno-0-188">188</a></span>
-<span class="normal"><a href="#__codelineno-0-189">189</a></span>
-<span class="normal"><a href="#__codelineno-0-190">190</a></span>
-<span class="normal"><a href="#__codelineno-0-191">191</a></span>
-<span class="normal"><a href="#__codelineno-0-192">192</a></span>
-<span class="normal"><a href="#__codelineno-0-193">193</a></span>
-<span class="normal"><a href="#__codelineno-0-194">194</a></span>
-<span class="normal"><a href="#__codelineno-0-195">195</a></span>
-<span class="normal"><a href="#__codelineno-0-196">196</a></span>
-<span class="normal"><a href="#__codelineno-0-197">197</a></span>
-<span class="normal"><a href="#__codelineno-0-198">198</a></span>
-<span class="normal"><a href="#__codelineno-0-199">199</a></span>
-<span class="normal"><a href="#__codelineno-0-200">200</a></span>
-<span class="normal"><a href="#__codelineno-0-201">201</a></span>
-<span class="normal"><a href="#__codelineno-0-202">202</a></span>
-<span class="normal"><a href="#__codelineno-0-203">203</a></span>
-<span class="normal"><a href="#__codelineno-0-204">204</a></span>
-<span class="normal"><a href="#__codelineno-0-205">205</a></span>
-<span class="normal"><a href="#__codelineno-0-206">206</a></span>
-<span class="normal"><a href="#__codelineno-0-207">207</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">],</span>
-</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>             <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span> <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10000</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
-</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a><span class="sd">    Initialize the SnipeSig with a sourmash signature object or a path to a signature.</span>
+<span class="normal"><a href="#__codelineno-0-176">176</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-19"><a id="__codelineno-0-19" name="__codelineno-0-19"></a><span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="o">*</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">],</span>
+</span><span id="__span-0-20"><a id="__codelineno-0-20" name="__codelineno-0-20"></a>             <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">51</span><span class="p">,</span> <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">10000</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="o">**</span><span class="n">kwargs</span><span class="p">):</span>
+</span><span id="__span-0-21"><a id="__codelineno-0-21" name="__codelineno-0-21"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-22"><a id="__codelineno-0-22" name="__codelineno-0-22"></a><span class="sd">    Initialize the SnipeSig with a sourmash signature object or a path to a signature.</span>
+</span><span id="__span-0-23"><a id="__codelineno-0-23" name="__codelineno-0-23"></a>
+</span><span id="__span-0-24"><a id="__codelineno-0-24" name="__codelineno-0-24"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-25"><a id="__codelineno-0-25" name="__codelineno-0-25"></a><span class="sd">        sourmash_sig (str or sourmash.signature.SourmashSignature): A path to a signature file or a signature object.</span>
+</span><span id="__span-0-26"><a id="__codelineno-0-26" name="__codelineno-0-26"></a><span class="sd">        ksize (int): K-mer size.</span>
+</span><span id="__span-0-27"><a id="__codelineno-0-27" name="__codelineno-0-27"></a><span class="sd">        scale (int): Scale value.</span>
+</span><span id="__span-0-28"><a id="__codelineno-0-28" name="__codelineno-0-28"></a><span class="sd">        sig_type (SigType): Type of the signature.</span>
+</span><span id="__span-0-29"><a id="__codelineno-0-29" name="__codelineno-0-29"></a><span class="sd">        enable_logging (bool): Flag to enable detailed logging.</span>
+</span><span id="__span-0-30"><a id="__codelineno-0-30" name="__codelineno-0-30"></a><span class="sd">        **kwargs: Additional keyword arguments.</span>
+</span><span id="__span-0-31"><a id="__codelineno-0-31" name="__codelineno-0-31"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-32"><a id="__codelineno-0-32" name="__codelineno-0-32"></a>    <span class="c1"># Initialize logging based on the flag</span>
+</span><span id="__span-0-33"><a id="__codelineno-0-33" name="__codelineno-0-33"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="__span-0-34"><a id="__codelineno-0-34" name="__codelineno-0-34"></a>
+</span><span id="__span-0-35"><a id="__codelineno-0-35" name="__codelineno-0-35"></a>    <span class="c1"># Configure the logger</span>
+</span><span id="__span-0-36"><a id="__codelineno-0-36" name="__codelineno-0-36"></a>    <span class="k">if</span> <span class="n">enable_logging</span><span class="p">:</span>
+</span><span id="__span-0-37"><a id="__codelineno-0-37" name="__codelineno-0-37"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="__span-0-38"><a id="__codelineno-0-38" name="__codelineno-0-38"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">hasHandlers</span><span class="p">():</span>
+</span><span id="__span-0-39"><a id="__codelineno-0-39" name="__codelineno-0-39"></a>            <span class="c1"># Create console handler</span>
+</span><span id="__span-0-40"><a id="__codelineno-0-40" name="__codelineno-0-40"></a>            <span class="n">ch</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">StreamHandler</span><span class="p">()</span>
+</span><span id="__span-0-41"><a id="__codelineno-0-41" name="__codelineno-0-41"></a>            <span class="n">ch</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+</span><span id="__span-0-42"><a id="__codelineno-0-42" name="__codelineno-0-42"></a>            <span class="c1"># Create formatter</span>
+</span><span id="__span-0-43"><a id="__codelineno-0-43" name="__codelineno-0-43"></a>            <span class="n">formatter</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">Formatter</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">%(asctime)s</span><span class="s1"> - </span><span class="si">%(name)s</span><span class="s1"> - </span><span class="si">%(levelname)s</span><span class="s1"> - </span><span class="si">%(message)s</span><span class="s1">&#39;</span><span class="p">)</span>
+</span><span id="__span-0-44"><a id="__codelineno-0-44" name="__codelineno-0-44"></a>            <span class="c1"># Add formatter to handler</span>
+</span><span id="__span-0-45"><a id="__codelineno-0-45" name="__codelineno-0-45"></a>            <span class="n">ch</span><span class="o">.</span><span class="n">setFormatter</span><span class="p">(</span><span class="n">formatter</span><span class="p">)</span>
+</span><span id="__span-0-46"><a id="__codelineno-0-46" name="__codelineno-0-46"></a>            <span class="c1"># Add handler to logger</span>
+</span><span id="__span-0-47"><a id="__codelineno-0-47" name="__codelineno-0-47"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">addHandler</span><span class="p">(</span><span class="n">ch</span><span class="p">)</span>
+</span><span id="__span-0-48"><a id="__codelineno-0-48" name="__codelineno-0-48"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Logging is enabled for SnipeSig.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-49"><a id="__codelineno-0-49" name="__codelineno-0-49"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-50"><a id="__codelineno-0-50" name="__codelineno-0-50"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">CRITICAL</span><span class="p">)</span>
+</span><span id="__span-0-51"><a id="__codelineno-0-51" name="__codelineno-0-51"></a>
+</span><span id="__span-0-52"><a id="__codelineno-0-52" name="__codelineno-0-52"></a>    <span class="c1"># Initialize internal variables</span>
+</span><span id="__span-0-53"><a id="__codelineno-0-53" name="__codelineno-0-53"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Initializing SnipeSig with sourmash_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">)</span>
+</span><span id="__span-0-54"><a id="__codelineno-0-54" name="__codelineno-0-54"></a>
+</span><span id="__span-0-55"><a id="__codelineno-0-55" name="__codelineno-0-55"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">=</span> <span class="n">scale</span>
+</span><span id="__span-0-56"><a id="__codelineno-0-56" name="__codelineno-0-56"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">=</span> <span class="n">ksize</span>
+</span><span id="__span-0-57"><a id="__codelineno-0-57" name="__codelineno-0-57"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-58"><a id="__codelineno-0-58" name="__codelineno-0-58"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-59"><a id="__codelineno-0-59" name="__codelineno-0-59"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-60"><a id="__codelineno-0-60" name="__codelineno-0-60"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_type</span> <span class="o">=</span> <span class="n">sig_type</span>
+</span><span id="__span-0-61"><a id="__codelineno-0-61" name="__codelineno-0-61"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-62"><a id="__codelineno-0-62" name="__codelineno-0-62"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-63"><a id="__codelineno-0-63" name="__codelineno-0-63"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="kc">False</span>
 </span><span id="__span-0-64"><a id="__codelineno-0-64" name="__codelineno-0-64"></a>
-</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a><span class="sd">        sourmash_sig (str or sourmash.signature.SourmashSignature): A path to a signature file or a signature object.</span>
-</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a><span class="sd">        ksize (int): K-mer size.</span>
-</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a><span class="sd">        scale (int): Scale value.</span>
-</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a><span class="sd">        sig_type (SigType): Type of the signature.</span>
-</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a><span class="sd">        enable_logging (bool): Flag to enable detailed logging.</span>
-</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a><span class="sd">        **kwargs: Additional keyword arguments.</span>
-</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a>    <span class="c1"># Initialize logging based on the flag</span>
-</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">getLogger</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="vm">__class__</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>
-</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a>    <span class="c1"># Configure the logger</span>
-</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a>    <span class="k">if</span> <span class="n">enable_logging</span><span class="p">:</span>
-</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
-</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">hasHandlers</span><span class="p">():</span>
-</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>            <span class="c1"># Create console handler</span>
-</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>            <span class="n">ch</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">StreamHandler</span><span class="p">()</span>
-</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>            <span class="n">ch</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
-</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>            <span class="c1"># Create formatter</span>
-</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>            <span class="n">formatter</span> <span class="o">=</span> <span class="n">logging</span><span class="o">.</span><span class="n">Formatter</span><span class="p">(</span><span class="s1">&#39;</span><span class="si">%(asctime)s</span><span class="s1"> - </span><span class="si">%(name)s</span><span class="s1"> - </span><span class="si">%(levelname)s</span><span class="s1"> - </span><span class="si">%(message)s</span><span class="s1">&#39;</span><span class="p">)</span>
-</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>            <span class="c1"># Add formatter to handler</span>
-</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>            <span class="n">ch</span><span class="o">.</span><span class="n">setFormatter</span><span class="p">(</span><span class="n">formatter</span><span class="p">)</span>
-</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>            <span class="c1"># Add handler to logger</span>
-</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">addHandler</span><span class="p">(</span><span class="n">ch</span><span class="p">)</span>
-</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Logging is enabled for SnipeSig.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">setLevel</span><span class="p">(</span><span class="n">logging</span><span class="o">.</span><span class="n">CRITICAL</span><span class="p">)</span>
-</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>
-</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>    <span class="c1"># Initialize internal variables</span>
-</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Initializing SnipeSig with sourmash_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sourmash_sig</span><span class="p">)</span>
-</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>
-</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">=</span> <span class="n">scale</span>
-</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">=</span> <span class="n">ksize</span>
-</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_type</span> <span class="o">=</span> <span class="n">sig_type</span>
-</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="kc">False</span>
-</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>
-</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>    <span class="n">sourmash_sigs</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
-</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>    <span class="n">_sourmash_sig</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
-</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>
-</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>
-</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Proceeding with a sigtype of </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">)</span>
+</span><span id="__span-0-65"><a id="__codelineno-0-65" name="__codelineno-0-65"></a>    <span class="n">sourmash_sigs</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-66"><a id="__codelineno-0-66" name="__codelineno-0-66"></a>    <span class="n">_sourmash_sig</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">]</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="__span-0-67"><a id="__codelineno-0-67" name="__codelineno-0-67"></a>
+</span><span id="__span-0-68"><a id="__codelineno-0-68" name="__codelineno-0-68"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">chr_to_sig</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-69"><a id="__codelineno-0-69" name="__codelineno-0-69"></a>
+</span><span id="__span-0-70"><a id="__codelineno-0-70" name="__codelineno-0-70"></a>
+</span><span id="__span-0-71"><a id="__codelineno-0-71" name="__codelineno-0-71"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Proceeding with a sigtype of </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">)</span>
+</span><span id="__span-0-72"><a id="__codelineno-0-72" name="__codelineno-0-72"></a>
+</span><span id="__span-0-73"><a id="__codelineno-0-73" name="__codelineno-0-73"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="p">(</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">)):</span>
+</span><span id="__span-0-74"><a id="__codelineno-0-74" name="__codelineno-0-74"></a>        <span class="c1"># if the str is not a file path</span>
+</span><span id="__span-0-75"><a id="__codelineno-0-75" name="__codelineno-0-75"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid type for sourmash_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">type</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
+</span><span id="__span-0-76"><a id="__codelineno-0-76" name="__codelineno-0-76"></a>        <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sourmash_sig must be a file path, sourmash.signature.SourmashSignature, or Frozensourmash_signature, got </span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-77"><a id="__codelineno-0-77" name="__codelineno-0-77"></a>
+</span><span id="__span-0-78"><a id="__codelineno-0-78" name="__codelineno-0-78"></a>    <span class="c1"># Case 1: If sourmash_sig is already a valid sourmash signature object</span>
+</span><span id="__span-0-79"><a id="__codelineno-0-79" name="__codelineno-0-79"></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="p">(</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">)):</span>
+</span><span id="__span-0-80"><a id="__codelineno-0-80" name="__codelineno-0-80"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signature directly from object.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-81"><a id="__codelineno-0-81" name="__codelineno-0-81"></a>        <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="p">{</span><span class="n">sourmash_sig</span><span class="o">.</span><span class="n">name</span><span class="p">:</span> <span class="n">sourmash_sig</span><span class="p">}</span>
+</span><span id="__span-0-82"><a id="__codelineno-0-82" name="__codelineno-0-82"></a>
+</span><span id="__span-0-83"><a id="__codelineno-0-83" name="__codelineno-0-83"></a>    <span class="c1"># Case 2: If sourmash_sig is a string, try to load as JSON or a file</span>
+</span><span id="__span-0-84"><a id="__codelineno-0-84" name="__codelineno-0-84"></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
+</span><span id="__span-0-85"><a id="__codelineno-0-85" name="__codelineno-0-85"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Attempting to load sourmash signature from string input.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-86"><a id="__codelineno-0-86" name="__codelineno-0-86"></a>
+</span><span id="__span-0-87"><a id="__codelineno-0-87" name="__codelineno-0-87"></a>        <span class="c1"># First, try loading from JSON</span>
+</span><span id="__span-0-88"><a id="__codelineno-0-88" name="__codelineno-0-88"></a>        <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_try_load_from_json</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span>
+</span><span id="__span-0-89"><a id="__codelineno-0-89" name="__codelineno-0-89"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signature from JSON: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sourmash_sigs</span><span class="p">)</span>
+</span><span id="__span-0-90"><a id="__codelineno-0-90" name="__codelineno-0-90"></a>
+</span><span id="__span-0-91"><a id="__codelineno-0-91" name="__codelineno-0-91"></a>        <span class="c1"># If JSON loading fails, try loading from file</span>
+</span><span id="__span-0-92"><a id="__codelineno-0-92" name="__codelineno-0-92"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
+</span><span id="__span-0-93"><a id="__codelineno-0-93" name="__codelineno-0-93"></a>            <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_try_load_from_file</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span>
+</span><span id="__span-0-94"><a id="__codelineno-0-94" name="__codelineno-0-94"></a>
+</span><span id="__span-0-95"><a id="__codelineno-0-95" name="__codelineno-0-95"></a>        <span class="c1"># If both attempts fail, raise an error</span>
+</span><span id="__span-0-96"><a id="__codelineno-0-96" name="__codelineno-0-96"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
+</span><span id="__span-0-97"><a id="__codelineno-0-97" name="__codelineno-0-97"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Failed to load sourmash signature from the provided string.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-98"><a id="__codelineno-0-98" name="__codelineno-0-98"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;An unexpected error occurred while loading the sourmash signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-99"><a id="__codelineno-0-99" name="__codelineno-0-99"></a>
+</span><span id="__span-0-100"><a id="__codelineno-0-100" name="__codelineno-0-100"></a>    <span class="k">if</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span> <span class="ow">or</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">:</span>
+</span><span id="__span-0-101"><a id="__codelineno-0-101" name="__codelineno-0-101"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-102"><a id="__codelineno-0-102" name="__codelineno-0-102"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Multiple signatures found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-103"><a id="__codelineno-0-103" name="__codelineno-0-103"></a>            <span class="c1"># not supported at this time</span>
+</span><span id="__span-0-104"><a id="__codelineno-0-104" name="__codelineno-0-104"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Loading multiple sample signatures is not supported at this time.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-105"><a id="__codelineno-0-105" name="__codelineno-0-105"></a>        <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-106"><a id="__codelineno-0-106" name="__codelineno-0-106"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a single signature in the sample sig input; Will use this signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-107"><a id="__codelineno-0-107" name="__codelineno-0-107"></a>            <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">values</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-108"><a id="__codelineno-0-108" name="__codelineno-0-108"></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-109"><a id="__codelineno-0-109" name="__codelineno-0-109"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No signature found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-110"><a id="__codelineno-0-110" name="__codelineno-0-110"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signature found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-111"><a id="__codelineno-0-111" name="__codelineno-0-111"></a>
-</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>
-</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>
-</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>
-</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>
-</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>
-</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="p">(</span><span class="nb">str</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">)):</span>
-</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>        <span class="c1"># if the str is not a file path</span>
-</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Invalid type for sourmash_sig: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">type</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="p">)</span>
-</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>        <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;sourmash_sig must be a file path, sourmash.signature.SourmashSignature, or Frozensourmash_signature, got </span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>
-</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>    <span class="c1"># Case 1: If sourmash_sig is already a valid sourmash signature object</span>
-</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>    <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="p">(</span><span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">FrozenSourmashSignature</span><span class="p">,</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">)):</span>
-</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signature directly from object.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>        <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="p">{</span><span class="n">sourmash_sig</span><span class="o">.</span><span class="n">name</span><span class="p">:</span> <span class="n">sourmash_sig</span><span class="p">}</span>
-</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>
-</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>    <span class="c1"># Case 2: If sourmash_sig is a string, try to load as JSON or a file</span>
-</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>    <span class="k">elif</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">,</span> <span class="nb">str</span><span class="p">):</span>
-</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Attempting to load sourmash signature from string input.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>
-</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>        <span class="c1"># First, try loading from JSON</span>
-</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>        <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_try_load_from_json</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span>
-</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Loaded sourmash signature from JSON: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sourmash_sigs</span><span class="p">)</span>
-</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>
-</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>        <span class="c1"># If JSON loading fails, try loading from file</span>
-</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
-</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>            <span class="n">sourmash_sigs</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_try_load_from_file</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="p">)</span>
-</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>
-</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>        <span class="c1"># If both attempts fail, raise an error</span>
-</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>        <span class="k">if</span> <span class="ow">not</span> <span class="n">sourmash_sigs</span><span class="p">:</span>
-</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="s2">&quot;Failed to load sourmash signature from the provided string.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;An unexpected error occurred while loading the sourmash signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-112"><a id="__codelineno-0-112" name="__codelineno-0-112"></a>    <span class="k">elif</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">:</span>
+</span><span id="__span-0-113"><a id="__codelineno-0-113" name="__codelineno-0-113"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-114"><a id="__codelineno-0-114" name="__codelineno-0-114"></a>            <span class="k">for</span> <span class="n">signame</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-115"><a id="__codelineno-0-115" name="__codelineno-0-115"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Iterating over signature: </span><span class="si">{</span><span class="n">signame</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="__span-0-116"><a id="__codelineno-0-116" name="__codelineno-0-116"></a>                <span class="k">if</span> <span class="n">signame</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">):</span>
+</span><span id="__span-0-117"><a id="__codelineno-0-117" name="__codelineno-0-117"></a>                    <span class="n">sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">to_mutable</span><span class="p">()</span>
+</span><span id="__span-0-118"><a id="__codelineno-0-118" name="__codelineno-0-118"></a>                    <span class="n">sig</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-119"><a id="__codelineno-0-119" name="__codelineno-0-119"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a genome signature with the snipe suffix `-snipegenome`. Restoring original name `</span><span class="si">%s</span><span class="s2">`.&quot;</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+</span><span id="__span-0-120"><a id="__codelineno-0-120" name="__codelineno-0-120"></a>                    <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="n">sig</span>
+</span><span id="__span-0-121"><a id="__codelineno-0-121" name="__codelineno-0-121"></a>                <span class="k">elif</span> <span class="n">signame</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;sex-&quot;</span><span class="p">):</span>
+</span><span id="__span-0-122"><a id="__codelineno-0-122" name="__codelineno-0-122"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a sex chr signature </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">signame</span><span class="p">)</span>
+</span><span id="__span-0-123"><a id="__codelineno-0-123" name="__codelineno-0-123"></a>                    <span class="n">sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">to_mutable</span><span class="p">()</span>
+</span><span id="__span-0-124"><a id="__codelineno-0-124" name="__codelineno-0-124"></a>                    <span class="n">sig</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">signame</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;sex-&quot;</span><span class="p">,</span><span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-125"><a id="__codelineno-0-125" name="__codelineno-0-125"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">chr_to_sig</span><span class="p">[</span><span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">)</span>
+</span><span id="__span-0-126"><a id="__codelineno-0-126" name="__codelineno-0-126"></a>                <span class="k">elif</span> <span class="n">signame</span><span class="o">.</span><span class="n">startswith</span><span class="p">(</span><span class="s2">&quot;autosome-&quot;</span><span class="p">):</span>
+</span><span id="__span-0-127"><a id="__codelineno-0-127" name="__codelineno-0-127"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found an autosome signature </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">signame</span><span class="p">)</span>
+</span><span id="__span-0-128"><a id="__codelineno-0-128" name="__codelineno-0-128"></a>                    <span class="n">sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">to_mutable</span><span class="p">()</span>
+</span><span id="__span-0-129"><a id="__codelineno-0-129" name="__codelineno-0-129"></a>                    <span class="n">sig</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">signame</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;autosome-&quot;</span><span class="p">,</span><span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-130"><a id="__codelineno-0-130" name="__codelineno-0-130"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">chr_to_sig</span><span class="p">[</span><span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">)</span>
+</span><span id="__span-0-131"><a id="__codelineno-0-131" name="__codelineno-0-131"></a>                <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-132"><a id="__codelineno-0-132" name="__codelineno-0-132"></a>                    <span class="k">continue</span>
+</span><span id="__span-0-133"><a id="__codelineno-0-133" name="__codelineno-0-133"></a>            <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-134"><a id="__codelineno-0-134" name="__codelineno-0-134"></a>                <span class="k">if</span> <span class="ow">not</span> <span class="n">_sourmash_sig</span><span class="p">:</span>
+</span><span id="__span-0-135"><a id="__codelineno-0-135" name="__codelineno-0-135"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found multiple signature per the genome file, but none with the snipe suffix `-snipegenome`.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-136"><a id="__codelineno-0-136" name="__codelineno-0-136"></a>                    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Found multiple signature per the genome file, but none with the snipe suffix `-snipegenome`.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-137"><a id="__codelineno-0-137" name="__codelineno-0-137"></a>        <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="__span-0-138"><a id="__codelineno-0-138" name="__codelineno-0-138"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a single signature in the genome sig input; Will use this signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-139"><a id="__codelineno-0-139" name="__codelineno-0-139"></a>            <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">values</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-140"><a id="__codelineno-0-140" name="__codelineno-0-140"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-141"><a id="__codelineno-0-141" name="__codelineno-0-141"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Unknown sigtype: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">)</span>
+</span><span id="__span-0-142"><a id="__codelineno-0-142" name="__codelineno-0-142"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unknown sigtype: </span><span class="si">{</span><span class="n">sig_type</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
 </span><span id="__span-0-143"><a id="__codelineno-0-143" name="__codelineno-0-143"></a>
-</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>    <span class="k">if</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span> <span class="ow">or</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">AMPLICON</span><span class="p">:</span>
-</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Multiple signatures found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>            <span class="c1"># not supported at this time</span>
-</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Loading multiple sample signatures is not supported at this time.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>        <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a single signature in the sample sig input; Will use this signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>            <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">values</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>        <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No signature found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signature found in the input. Expected a single sample signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a>
-</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>    <span class="k">elif</span> <span class="n">sig_type</span> <span class="o">==</span> <span class="n">SigType</span><span class="o">.</span><span class="n">GENOME</span><span class="p">:</span>
-</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>            <span class="k">for</span> <span class="n">signame</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>                <span class="k">if</span> <span class="n">signame</span><span class="o">.</span><span class="n">endswith</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">):</span>
-</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>                    <span class="n">sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">to_mutable</span><span class="p">()</span>
-</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>                    <span class="n">sig</span><span class="o">.</span><span class="n">name</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="o">.</span><span class="n">replace</span><span class="p">(</span><span class="s2">&quot;-snipegenome&quot;</span><span class="p">,</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>                    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a genome signature with a snipe modified name. Restoring original name `</span><span class="si">%s</span><span class="s2">`.&quot;</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
-</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>                    <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="n">sig</span>
-</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>                    <span class="k">break</span>
-</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>            <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>                <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found multiple signature per the genome file, but none with a snipe modified name.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Found multiple signature per the genome file, but none with a snipe modified name.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>        <span class="k">elif</span> <span class="nb">len</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="p">)</span> <span class="o">==</span> <span class="mi">1</span><span class="p">:</span>
-</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Found a single signature in the genome sig input; Will use this signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>            <span class="n">_sourmash_sig</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">sourmash_sigs</span><span class="o">.</span><span class="n">values</span><span class="p">())[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Unknown sigtype: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">)</span>
-</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unknown sigtype: </span><span class="si">{</span><span class="n">sig_type</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
-</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>
-</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Length of currently loaded signature: </span><span class="si">%d</span><span class="s2">, with name: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="p">),</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
-</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>
-</span><span id="__span-0-177"><a id="__codelineno-0-177" name="__codelineno-0-177"></a>    <span class="c1"># Extract properties from the loaded signature</span>
-</span><span id="__span-0-178"><a id="__codelineno-0-178" name="__codelineno-0-178"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">ksize</span>
-</span><span id="__span-0-179"><a id="__codelineno-0-179" name="__codelineno-0-179"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">scaled</span>
-</span><span id="__span-0-180"><a id="__codelineno-0-180" name="__codelineno-0-180"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">md5sum</span><span class="p">()</span>
-</span><span id="__span-0-181"><a id="__codelineno-0-181" name="__codelineno-0-181"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">name</span>
-</span><span id="__span-0-182"><a id="__codelineno-0-182" name="__codelineno-0-182"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">filename</span>
-</span><span id="__span-0-183"><a id="__codelineno-0-183" name="__codelineno-0-183"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">track_abundance</span>
-</span><span id="__span-0-184"><a id="__codelineno-0-184" name="__codelineno-0-184"></a>
-</span><span id="__span-0-185"><a id="__codelineno-0-185" name="__codelineno-0-185"></a>    <span class="c1"># If the signature does not track abundance, assume abundance of 1 for all hashes</span>
-</span><span id="__span-0-186"><a id="__codelineno-0-186" name="__codelineno-0-186"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">:</span>
-</span><span id="__span-0-187"><a id="__codelineno-0-187" name="__codelineno-0-187"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Signature does not track abundance. Setting all abundances to 1.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-188"><a id="__codelineno-0-188" name="__codelineno-0-188"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-189"><a id="__codelineno-0-189" name="__codelineno-0-189"></a>        <span class="c1"># self._track_abundance = True</span>
-</span><span id="__span-0-190"><a id="__codelineno-0-190" name="__codelineno-0-190"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-191"><a id="__codelineno-0-191" name="__codelineno-0-191"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-192"><a id="__codelineno-0-192" name="__codelineno-0-192"></a>
-</span><span id="__span-0-193"><a id="__codelineno-0-193" name="__codelineno-0-193"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="o">.</span><span class="n">keys</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-194"><a id="__codelineno-0-194" name="__codelineno-0-194"></a>
-</span><span id="__span-0-195"><a id="__codelineno-0-195" name="__codelineno-0-195"></a>    <span class="c1"># Sort the hashes and rearrange abundances accordingly</span>
-</span><span id="__span-0-196"><a id="__codelineno-0-196" name="__codelineno-0-196"></a>    <span class="n">sorted_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
-</span><span id="__span-0-197"><a id="__codelineno-0-197" name="__codelineno-0-197"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
-</span><span id="__span-0-198"><a id="__codelineno-0-198" name="__codelineno-0-198"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
-</span><span id="__span-0-199"><a id="__codelineno-0-199" name="__codelineno-0-199"></a>
-</span><span id="__span-0-200"><a id="__codelineno-0-200" name="__codelineno-0-200"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span>
-</span><span id="__span-0-201"><a id="__codelineno-0-201" name="__codelineno-0-201"></a>        <span class="s2">&quot;Loaded sourmash signature from file: </span><span class="si">%s</span><span class="s2">, name: </span><span class="si">%s</span><span class="s2">, md5sum: </span><span class="si">%s</span><span class="s2">, ksize: </span><span class="si">%d</span><span class="s2">, scale: </span><span class="si">%d</span><span class="s2">, &quot;</span>
-</span><span id="__span-0-202"><a id="__codelineno-0-202" name="__codelineno-0-202"></a>        <span class="s2">&quot;track_abundance: </span><span class="si">%s</span><span class="s2">, type: </span><span class="si">%s</span><span class="s2">, length: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-203"><a id="__codelineno-0-203" name="__codelineno-0-203"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-204"><a id="__codelineno-0-204" name="__codelineno-0-204"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
-</span><span id="__span-0-205"><a id="__codelineno-0-205" name="__codelineno-0-205"></a>    <span class="p">)</span>
-</span><span id="__span-0-206"><a id="__codelineno-0-206" name="__codelineno-0-206"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Hashes sorted during initialization.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-207"><a id="__codelineno-0-207" name="__codelineno-0-207"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Sourmash signature loading completed successfully.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-144"><a id="__codelineno-0-144" name="__codelineno-0-144"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Length of currently loaded signature: </span><span class="si">%d</span><span class="s2">, with name: </span><span class="si">%s</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="p">),</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">name</span><span class="p">)</span>
+</span><span id="__span-0-145"><a id="__codelineno-0-145" name="__codelineno-0-145"></a>
+</span><span id="__span-0-146"><a id="__codelineno-0-146" name="__codelineno-0-146"></a>    <span class="c1"># Extract properties from the loaded signature</span>
+</span><span id="__span-0-147"><a id="__codelineno-0-147" name="__codelineno-0-147"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">ksize</span>
+</span><span id="__span-0-148"><a id="__codelineno-0-148" name="__codelineno-0-148"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">scaled</span>
+</span><span id="__span-0-149"><a id="__codelineno-0-149" name="__codelineno-0-149"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">md5sum</span><span class="p">()</span>
+</span><span id="__span-0-150"><a id="__codelineno-0-150" name="__codelineno-0-150"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_name</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">name</span>
+</span><span id="__span-0-151"><a id="__codelineno-0-151" name="__codelineno-0-151"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">filename</span>
+</span><span id="__span-0-152"><a id="__codelineno-0-152" name="__codelineno-0-152"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span> <span class="o">=</span> <span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">track_abundance</span>
+</span><span id="__span-0-153"><a id="__codelineno-0-153" name="__codelineno-0-153"></a>
+</span><span id="__span-0-154"><a id="__codelineno-0-154" name="__codelineno-0-154"></a>    <span class="c1"># If the signature does not track abundance, assume abundance of 1 for all hashes</span>
+</span><span id="__span-0-155"><a id="__codelineno-0-155" name="__codelineno-0-155"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">:</span>
+</span><span id="__span-0-156"><a id="__codelineno-0-156" name="__codelineno-0-156"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Signature does not track abundance. Setting all abundances to 1.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-157"><a id="__codelineno-0-157" name="__codelineno-0-157"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="p">),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-158"><a id="__codelineno-0-158" name="__codelineno-0-158"></a>        <span class="c1"># self._track_abundance = True</span>
+</span><span id="__span-0-159"><a id="__codelineno-0-159" name="__codelineno-0-159"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-160"><a id="__codelineno-0-160" name="__codelineno-0-160"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-161"><a id="__codelineno-0-161" name="__codelineno-0-161"></a>
+</span><span id="__span-0-162"><a id="__codelineno-0-162" name="__codelineno-0-162"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">_sourmash_sig</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">hashes</span><span class="o">.</span><span class="n">keys</span><span class="p">()),</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-163"><a id="__codelineno-0-163" name="__codelineno-0-163"></a>
+</span><span id="__span-0-164"><a id="__codelineno-0-164" name="__codelineno-0-164"></a>    <span class="c1"># Sort the hashes and rearrange abundances accordingly</span>
+</span><span id="__span-0-165"><a id="__codelineno-0-165" name="__codelineno-0-165"></a>    <span class="n">sorted_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
+</span><span id="__span-0-166"><a id="__codelineno-0-166" name="__codelineno-0-166"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
+</span><span id="__span-0-167"><a id="__codelineno-0-167" name="__codelineno-0-167"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
+</span><span id="__span-0-168"><a id="__codelineno-0-168" name="__codelineno-0-168"></a>
+</span><span id="__span-0-169"><a id="__codelineno-0-169" name="__codelineno-0-169"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span>
+</span><span id="__span-0-170"><a id="__codelineno-0-170" name="__codelineno-0-170"></a>        <span class="s2">&quot;Loaded sourmash signature from file: </span><span class="si">%s</span><span class="s2">, name: </span><span class="si">%s</span><span class="s2">, md5sum: </span><span class="si">%s</span><span class="s2">, ksize: </span><span class="si">%d</span><span class="s2">, scale: </span><span class="si">%d</span><span class="s2">, &quot;</span>
+</span><span id="__span-0-171"><a id="__codelineno-0-171" name="__codelineno-0-171"></a>        <span class="s2">&quot;track_abundance: </span><span class="si">%s</span><span class="s2">, type: </span><span class="si">%s</span><span class="s2">, length: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-172"><a id="__codelineno-0-172" name="__codelineno-0-172"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-173"><a id="__codelineno-0-173" name="__codelineno-0-173"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
+</span><span id="__span-0-174"><a id="__codelineno-0-174" name="__codelineno-0-174"></a>    <span class="p">)</span>
+</span><span id="__span-0-175"><a id="__codelineno-0-175" name="__codelineno-0-175"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Hashes sorted during initialization.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-176"><a id="__codelineno-0-176" name="__codelineno-0-176"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Sourmash signature loading completed successfully.&quot;</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5511,10 +5572,10 @@ <h3 id="snipe.api.SnipeSig.__init__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__ior__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__ior__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__ior__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__ior__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__ior__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -5547,30 +5608,30 @@ <h3 id="snipe.api.SnipeSig.__ior__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-749">749</a></span>
-<span class="normal"><a href="#__codelineno-0-750">750</a></span>
-<span class="normal"><a href="#__codelineno-0-751">751</a></span>
-<span class="normal"><a href="#__codelineno-0-752">752</a></span>
-<span class="normal"><a href="#__codelineno-0-753">753</a></span>
-<span class="normal"><a href="#__codelineno-0-754">754</a></span>
-<span class="normal"><a href="#__codelineno-0-755">755</a></span>
-<span class="normal"><a href="#__codelineno-0-756">756</a></span>
-<span class="normal"><a href="#__codelineno-0-757">757</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-757">757</a></span>
 <span class="normal"><a href="#__codelineno-0-758">758</a></span>
 <span class="normal"><a href="#__codelineno-0-759">759</a></span>
-<span class="normal"><a href="#__codelineno-0-760">760</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a><span class="k">def</span> <span class="fm">__ior__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a><span class="sd">    Implements the |= operator.</span>
-</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a><span class="sd">    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
-</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a><span class="sd">    modifying self in-place.</span>
-</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a>
-</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-756"><a id="__codelineno-0-756" name="__codelineno-0-756"></a><span class="sd">        SnipeSig: Updated self after union.</span>
-</span><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a>    <span class="n">union_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">union_sig</span><span class="p">)</span>
-</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a>    <span class="k">return</span> <span class="bp">self</span>
+<span class="normal"><a href="#__codelineno-0-760">760</a></span>
+<span class="normal"><a href="#__codelineno-0-761">761</a></span>
+<span class="normal"><a href="#__codelineno-0-762">762</a></span>
+<span class="normal"><a href="#__codelineno-0-763">763</a></span>
+<span class="normal"><a href="#__codelineno-0-764">764</a></span>
+<span class="normal"><a href="#__codelineno-0-765">765</a></span>
+<span class="normal"><a href="#__codelineno-0-766">766</a></span>
+<span class="normal"><a href="#__codelineno-0-767">767</a></span>
+<span class="normal"><a href="#__codelineno-0-768">768</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-757"><a id="__codelineno-0-757" name="__codelineno-0-757"></a><span class="k">def</span> <span class="fm">__ior__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-758"><a id="__codelineno-0-758" name="__codelineno-0-758"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-759"><a id="__codelineno-0-759" name="__codelineno-0-759"></a><span class="sd">    Implements the |= operator.</span>
+</span><span id="__span-0-760"><a id="__codelineno-0-760" name="__codelineno-0-760"></a><span class="sd">    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
+</span><span id="__span-0-761"><a id="__codelineno-0-761" name="__codelineno-0-761"></a><span class="sd">    modifying self in-place.</span>
+</span><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a>
+</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a><span class="sd">        SnipeSig: Updated self after union.</span>
+</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a>    <span class="n">union_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">union_sig</span><span class="p">)</span>
+</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a>    <span class="k">return</span> <span class="bp">self</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5580,10 +5641,10 @@ <h3 id="snipe.api.SnipeSig.__ior__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__isub__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__isub__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__isub__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__isub__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__isub__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -5639,36 +5700,36 @@ <h3 id="snipe.api.SnipeSig.__isub__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-773">773</a></span>
-<span class="normal"><a href="#__codelineno-0-774">774</a></span>
-<span class="normal"><a href="#__codelineno-0-775">775</a></span>
-<span class="normal"><a href="#__codelineno-0-776">776</a></span>
-<span class="normal"><a href="#__codelineno-0-777">777</a></span>
-<span class="normal"><a href="#__codelineno-0-778">778</a></span>
-<span class="normal"><a href="#__codelineno-0-779">779</a></span>
-<span class="normal"><a href="#__codelineno-0-780">780</a></span>
-<span class="normal"><a href="#__codelineno-0-781">781</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-781">781</a></span>
 <span class="normal"><a href="#__codelineno-0-782">782</a></span>
 <span class="normal"><a href="#__codelineno-0-783">783</a></span>
 <span class="normal"><a href="#__codelineno-0-784">784</a></span>
 <span class="normal"><a href="#__codelineno-0-785">785</a></span>
 <span class="normal"><a href="#__codelineno-0-786">786</a></span>
-<span class="normal"><a href="#__codelineno-0-787">787</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a><span class="k">def</span> <span class="fm">__isub__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a><span class="sd">    Implements the -= operator.</span>
-</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a><span class="sd">    Removes hashes present in other from self, keeping abundances from self,</span>
-</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a><span class="sd">    modifying self in-place.</span>
-</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a>
-</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-780"><a id="__codelineno-0-780" name="__codelineno-0-780"></a><span class="sd">        SnipeSig: Updated self after difference.</span>
-</span><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a>
-</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a><span class="sd">        RuntimeError: If zero hashes remain after difference.</span>
-</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a>    <span class="n">difference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">difference_sig</span><span class="p">)</span>
-</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a>    <span class="k">return</span> <span class="bp">self</span>
+<span class="normal"><a href="#__codelineno-0-787">787</a></span>
+<span class="normal"><a href="#__codelineno-0-788">788</a></span>
+<span class="normal"><a href="#__codelineno-0-789">789</a></span>
+<span class="normal"><a href="#__codelineno-0-790">790</a></span>
+<span class="normal"><a href="#__codelineno-0-791">791</a></span>
+<span class="normal"><a href="#__codelineno-0-792">792</a></span>
+<span class="normal"><a href="#__codelineno-0-793">793</a></span>
+<span class="normal"><a href="#__codelineno-0-794">794</a></span>
+<span class="normal"><a href="#__codelineno-0-795">795</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-781"><a id="__codelineno-0-781" name="__codelineno-0-781"></a><span class="k">def</span> <span class="fm">__isub__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-782"><a id="__codelineno-0-782" name="__codelineno-0-782"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-783"><a id="__codelineno-0-783" name="__codelineno-0-783"></a><span class="sd">    Implements the -= operator.</span>
+</span><span id="__span-0-784"><a id="__codelineno-0-784" name="__codelineno-0-784"></a><span class="sd">    Removes hashes present in other from self, keeping abundances from self,</span>
+</span><span id="__span-0-785"><a id="__codelineno-0-785" name="__codelineno-0-785"></a><span class="sd">    modifying self in-place.</span>
+</span><span id="__span-0-786"><a id="__codelineno-0-786" name="__codelineno-0-786"></a>
+</span><span id="__span-0-787"><a id="__codelineno-0-787" name="__codelineno-0-787"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-788"><a id="__codelineno-0-788" name="__codelineno-0-788"></a><span class="sd">        SnipeSig: Updated self after difference.</span>
+</span><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a>
+</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a><span class="sd">        RuntimeError: If zero hashes remain after difference.</span>
+</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>    <span class="n">difference_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">difference_sig</span><span class="p">)</span>
+</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a>    <span class="k">return</span> <span class="bp">self</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5678,10 +5739,10 @@ <h3 id="snipe.api.SnipeSig.__isub__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__iter__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__iter__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__iter__</span><span class="p">()</span></code>
 
-<a href="#snipe.api.SnipeSig.__iter__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__iter__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -5712,24 +5773,24 @@ <h3 id="snipe.api.SnipeSig.__iter__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-291">291</a></span>
-<span class="normal"><a href="#__codelineno-0-292">292</a></span>
-<span class="normal"><a href="#__codelineno-0-293">293</a></span>
-<span class="normal"><a href="#__codelineno-0-294">294</a></span>
-<span class="normal"><a href="#__codelineno-0-295">295</a></span>
-<span class="normal"><a href="#__codelineno-0-296">296</a></span>
-<span class="normal"><a href="#__codelineno-0-297">297</a></span>
-<span class="normal"><a href="#__codelineno-0-298">298</a></span>
-<span class="normal"><a href="#__codelineno-0-299">299</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a><span class="k">def</span> <span class="fm">__iter__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Iterator</span><span class="p">[</span><span class="nb">tuple</span><span class="p">]:</span>
-</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a><span class="sd">    Iterate over the hashes and their abundances.</span>
-</span><span id="__span-0-294"><a id="__codelineno-0-294" name="__codelineno-0-294"></a>
-</span><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a><span class="sd">    Yields:</span>
-</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="sd">        tuple: A tuple containing (hash, abundance).</span>
-</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-298"><a id="__codelineno-0-298" name="__codelineno-0-298"></a>    <span class="k">for</span> <span class="n">h</span><span class="p">,</span> <span class="n">a</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">):</span>
-</span><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a>        <span class="k">yield</span> <span class="p">(</span><span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-299">299</a></span>
+<span class="normal"><a href="#__codelineno-0-300">300</a></span>
+<span class="normal"><a href="#__codelineno-0-301">301</a></span>
+<span class="normal"><a href="#__codelineno-0-302">302</a></span>
+<span class="normal"><a href="#__codelineno-0-303">303</a></span>
+<span class="normal"><a href="#__codelineno-0-304">304</a></span>
+<span class="normal"><a href="#__codelineno-0-305">305</a></span>
+<span class="normal"><a href="#__codelineno-0-306">306</a></span>
+<span class="normal"><a href="#__codelineno-0-307">307</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-299"><a id="__codelineno-0-299" name="__codelineno-0-299"></a><span class="k">def</span> <span class="fm">__iter__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Iterator</span><span class="p">[</span><span class="nb">tuple</span><span class="p">]:</span>
+</span><span id="__span-0-300"><a id="__codelineno-0-300" name="__codelineno-0-300"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-301"><a id="__codelineno-0-301" name="__codelineno-0-301"></a><span class="sd">    Iterate over the hashes and their abundances.</span>
+</span><span id="__span-0-302"><a id="__codelineno-0-302" name="__codelineno-0-302"></a>
+</span><span id="__span-0-303"><a id="__codelineno-0-303" name="__codelineno-0-303"></a><span class="sd">    Yields:</span>
+</span><span id="__span-0-304"><a id="__codelineno-0-304" name="__codelineno-0-304"></a><span class="sd">        tuple: A tuple containing (hash, abundance).</span>
+</span><span id="__span-0-305"><a id="__codelineno-0-305" name="__codelineno-0-305"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-306"><a id="__codelineno-0-306" name="__codelineno-0-306"></a>    <span class="k">for</span> <span class="n">h</span><span class="p">,</span> <span class="n">a</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">):</span>
+</span><span id="__span-0-307"><a id="__codelineno-0-307" name="__codelineno-0-307"></a>        <span class="k">yield</span> <span class="p">(</span><span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5739,10 +5800,10 @@ <h3 id="snipe.api.SnipeSig.__iter__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__ixor__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__ixor__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__ixor__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__ixor__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__ixor__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -5797,34 +5858,34 @@ <h3 id="snipe.api.SnipeSig.__ixor__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-799">799</a></span>
-<span class="normal"><a href="#__codelineno-0-800">800</a></span>
-<span class="normal"><a href="#__codelineno-0-801">801</a></span>
-<span class="normal"><a href="#__codelineno-0-802">802</a></span>
-<span class="normal"><a href="#__codelineno-0-803">803</a></span>
-<span class="normal"><a href="#__codelineno-0-804">804</a></span>
-<span class="normal"><a href="#__codelineno-0-805">805</a></span>
-<span class="normal"><a href="#__codelineno-0-806">806</a></span>
-<span class="normal"><a href="#__codelineno-0-807">807</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-807">807</a></span>
 <span class="normal"><a href="#__codelineno-0-808">808</a></span>
 <span class="normal"><a href="#__codelineno-0-809">809</a></span>
 <span class="normal"><a href="#__codelineno-0-810">810</a></span>
 <span class="normal"><a href="#__codelineno-0-811">811</a></span>
-<span class="normal"><a href="#__codelineno-0-812">812</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a><span class="k">def</span> <span class="fm">__ixor__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a><span class="sd">    Implements the ^= operator.</span>
-</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a><span class="sd">    Keeps unique hashes from each signature with their respective abundances, modifying self in-place.</span>
-</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a>
-</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a><span class="sd">        SnipeSig: Updated self after symmetric difference.</span>
-</span><span id="__span-0-806"><a id="__codelineno-0-806" name="__codelineno-0-806"></a>
-</span><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a><span class="sd">        RuntimeError: If zero hashes remain after symmetric difference.</span>
-</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a>    <span class="n">symmetric_diff_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">symmetric_difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">symmetric_diff_sig</span><span class="p">)</span>
-</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a>    <span class="k">return</span> <span class="bp">self</span>
+<span class="normal"><a href="#__codelineno-0-812">812</a></span>
+<span class="normal"><a href="#__codelineno-0-813">813</a></span>
+<span class="normal"><a href="#__codelineno-0-814">814</a></span>
+<span class="normal"><a href="#__codelineno-0-815">815</a></span>
+<span class="normal"><a href="#__codelineno-0-816">816</a></span>
+<span class="normal"><a href="#__codelineno-0-817">817</a></span>
+<span class="normal"><a href="#__codelineno-0-818">818</a></span>
+<span class="normal"><a href="#__codelineno-0-819">819</a></span>
+<span class="normal"><a href="#__codelineno-0-820">820</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-807"><a id="__codelineno-0-807" name="__codelineno-0-807"></a><span class="k">def</span> <span class="fm">__ixor__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-808"><a id="__codelineno-0-808" name="__codelineno-0-808"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-809"><a id="__codelineno-0-809" name="__codelineno-0-809"></a><span class="sd">    Implements the ^= operator.</span>
+</span><span id="__span-0-810"><a id="__codelineno-0-810" name="__codelineno-0-810"></a><span class="sd">    Keeps unique hashes from each signature with their respective abundances, modifying self in-place.</span>
+</span><span id="__span-0-811"><a id="__codelineno-0-811" name="__codelineno-0-811"></a>
+</span><span id="__span-0-812"><a id="__codelineno-0-812" name="__codelineno-0-812"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-813"><a id="__codelineno-0-813" name="__codelineno-0-813"></a><span class="sd">        SnipeSig: Updated self after symmetric difference.</span>
+</span><span id="__span-0-814"><a id="__codelineno-0-814" name="__codelineno-0-814"></a>
+</span><span id="__span-0-815"><a id="__codelineno-0-815" name="__codelineno-0-815"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-816"><a id="__codelineno-0-816" name="__codelineno-0-816"></a><span class="sd">        RuntimeError: If zero hashes remain after symmetric difference.</span>
+</span><span id="__span-0-817"><a id="__codelineno-0-817" name="__codelineno-0-817"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-818"><a id="__codelineno-0-818" name="__codelineno-0-818"></a>    <span class="n">symmetric_diff_sig</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">symmetric_difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-819"><a id="__codelineno-0-819" name="__codelineno-0-819"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_update_from_union</span><span class="p">(</span><span class="n">symmetric_diff_sig</span><span class="p">)</span>
+</span><span id="__span-0-820"><a id="__codelineno-0-820" name="__codelineno-0-820"></a>    <span class="k">return</span> <span class="bp">self</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5834,10 +5895,10 @@ <h3 id="snipe.api.SnipeSig.__ixor__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__len__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__len__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__len__</span><span class="p">()</span></code>
 
-<a href="#snipe.api.SnipeSig.__len__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__len__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -5845,12 +5906,12 @@ <h3 id="snipe.api.SnipeSig.__len__" class="doc doc-heading">
         <p>Return the number of hashes in the signature.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-287">287</a></span>
-<span class="normal"><a href="#__codelineno-0-288">288</a></span>
-<span class="normal"><a href="#__codelineno-0-289">289</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a><span class="k">def</span> <span class="fm">__len__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
-</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the number of hashes in the signature.&quot;&quot;&quot;</span>
-</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>    <span class="k">return</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-295">295</a></span>
+<span class="normal"><a href="#__codelineno-0-296">296</a></span>
+<span class="normal"><a href="#__codelineno-0-297">297</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-295"><a id="__codelineno-0-295" name="__codelineno-0-295"></a><span class="k">def</span> <span class="fm">__len__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="__span-0-296"><a id="__codelineno-0-296" name="__codelineno-0-296"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Return the number of hashes in the signature.&quot;&quot;&quot;</span>
+</span><span id="__span-0-297"><a id="__codelineno-0-297" name="__codelineno-0-297"></a>    <span class="k">return</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5860,10 +5921,10 @@ <h3 id="snipe.api.SnipeSig.__len__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__or__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__or__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__or__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__or__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__or__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -5896,26 +5957,26 @@ <h3 id="snipe.api.SnipeSig.__or__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-738">738</a></span>
-<span class="normal"><a href="#__codelineno-0-739">739</a></span>
-<span class="normal"><a href="#__codelineno-0-740">740</a></span>
-<span class="normal"><a href="#__codelineno-0-741">741</a></span>
-<span class="normal"><a href="#__codelineno-0-742">742</a></span>
-<span class="normal"><a href="#__codelineno-0-743">743</a></span>
-<span class="normal"><a href="#__codelineno-0-744">744</a></span>
-<span class="normal"><a href="#__codelineno-0-745">745</a></span>
-<span class="normal"><a href="#__codelineno-0-746">746</a></span>
-<span class="normal"><a href="#__codelineno-0-747">747</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-738"><a id="__codelineno-0-738" name="__codelineno-0-738"></a><span class="k">def</span> <span class="fm">__or__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-739"><a id="__codelineno-0-739" name="__codelineno-0-739"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-740"><a id="__codelineno-0-740" name="__codelineno-0-740"></a><span class="sd">    Implements the | operator.</span>
-</span><span id="__span-0-741"><a id="__codelineno-0-741" name="__codelineno-0-741"></a><span class="sd">    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
-</span><span id="__span-0-742"><a id="__codelineno-0-742" name="__codelineno-0-742"></a><span class="sd">    returning a new signature.</span>
-</span><span id="__span-0-743"><a id="__codelineno-0-743" name="__codelineno-0-743"></a>
-</span><span id="__span-0-744"><a id="__codelineno-0-744" name="__codelineno-0-744"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-745"><a id="__codelineno-0-745" name="__codelineno-0-745"></a><span class="sd">        SnipeSig: Union of self and other.</span>
-</span><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-746">746</a></span>
+<span class="normal"><a href="#__codelineno-0-747">747</a></span>
+<span class="normal"><a href="#__codelineno-0-748">748</a></span>
+<span class="normal"><a href="#__codelineno-0-749">749</a></span>
+<span class="normal"><a href="#__codelineno-0-750">750</a></span>
+<span class="normal"><a href="#__codelineno-0-751">751</a></span>
+<span class="normal"><a href="#__codelineno-0-752">752</a></span>
+<span class="normal"><a href="#__codelineno-0-753">753</a></span>
+<span class="normal"><a href="#__codelineno-0-754">754</a></span>
+<span class="normal"><a href="#__codelineno-0-755">755</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-746"><a id="__codelineno-0-746" name="__codelineno-0-746"></a><span class="k">def</span> <span class="fm">__or__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-747"><a id="__codelineno-0-747" name="__codelineno-0-747"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-748"><a id="__codelineno-0-748" name="__codelineno-0-748"></a><span class="sd">    Implements the | operator.</span>
+</span><span id="__span-0-749"><a id="__codelineno-0-749" name="__codelineno-0-749"></a><span class="sd">    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,</span>
+</span><span id="__span-0-750"><a id="__codelineno-0-750" name="__codelineno-0-750"></a><span class="sd">    returning a new signature.</span>
+</span><span id="__span-0-751"><a id="__codelineno-0-751" name="__codelineno-0-751"></a>
+</span><span id="__span-0-752"><a id="__codelineno-0-752" name="__codelineno-0-752"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-753"><a id="__codelineno-0-753" name="__codelineno-0-753"></a><span class="sd">        SnipeSig: Union of self and other.</span>
+</span><span id="__span-0-754"><a id="__codelineno-0-754" name="__codelineno-0-754"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-755"><a id="__codelineno-0-755" name="__codelineno-0-755"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5925,10 +5986,10 @@ <h3 id="snipe.api.SnipeSig.__or__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__radd__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__radd__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__radd__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__radd__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__radd__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -5959,22 +6020,22 @@ <h3 id="snipe.api.SnipeSig.__radd__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1194">1194</a></span>
-<span class="normal"><a href="#__codelineno-0-1195">1195</a></span>
-<span class="normal"><a href="#__codelineno-0-1196">1196</a></span>
-<span class="normal"><a href="#__codelineno-0-1197">1197</a></span>
-<span class="normal"><a href="#__codelineno-0-1198">1198</a></span>
-<span class="normal"><a href="#__codelineno-0-1199">1199</a></span>
-<span class="normal"><a href="#__codelineno-0-1200">1200</a></span>
-<span class="normal"><a href="#__codelineno-0-1201">1201</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a><span class="k">def</span> <span class="fm">__radd__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a><span class="sd">    Implements the right-hand + operator to support sum().</span>
-</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a>
-</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a><span class="sd">        SnipeSig: Union of self and other.</span>
-</span><span id="__span-0-1200"><a id="__codelineno-0-1200" name="__codelineno-0-1200"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1201"><a id="__codelineno-0-1201" name="__codelineno-0-1201"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">__radd_sum__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1202">1202</a></span>
+<span class="normal"><a href="#__codelineno-0-1203">1203</a></span>
+<span class="normal"><a href="#__codelineno-0-1204">1204</a></span>
+<span class="normal"><a href="#__codelineno-0-1205">1205</a></span>
+<span class="normal"><a href="#__codelineno-0-1206">1206</a></span>
+<span class="normal"><a href="#__codelineno-0-1207">1207</a></span>
+<span class="normal"><a href="#__codelineno-0-1208">1208</a></span>
+<span class="normal"><a href="#__codelineno-0-1209">1209</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1202"><a id="__codelineno-0-1202" name="__codelineno-0-1202"></a><span class="k">def</span> <span class="fm">__radd__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-1203"><a id="__codelineno-0-1203" name="__codelineno-0-1203"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a><span class="sd">    Implements the right-hand + operator to support sum().</span>
+</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a>
+</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a><span class="sd">        SnipeSig: Union of self and other.</span>
+</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">__radd_sum__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -5984,10 +6045,10 @@ <h3 id="snipe.api.SnipeSig.__radd__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__radd_sum__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__radd_sum__" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">__radd_sum__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__radd_sum__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__radd_sum__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -6049,36 +6110,36 @@ <h3 id="snipe.api.SnipeSig.__radd_sum__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1204">1204</a></span>
-<span class="normal"><a href="#__codelineno-0-1205">1205</a></span>
-<span class="normal"><a href="#__codelineno-0-1206">1206</a></span>
-<span class="normal"><a href="#__codelineno-0-1207">1207</a></span>
-<span class="normal"><a href="#__codelineno-0-1208">1208</a></span>
-<span class="normal"><a href="#__codelineno-0-1209">1209</a></span>
-<span class="normal"><a href="#__codelineno-0-1210">1210</a></span>
-<span class="normal"><a href="#__codelineno-0-1211">1211</a></span>
-<span class="normal"><a href="#__codelineno-0-1212">1212</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1212">1212</a></span>
 <span class="normal"><a href="#__codelineno-0-1213">1213</a></span>
 <span class="normal"><a href="#__codelineno-0-1214">1214</a></span>
 <span class="normal"><a href="#__codelineno-0-1215">1215</a></span>
 <span class="normal"><a href="#__codelineno-0-1216">1216</a></span>
 <span class="normal"><a href="#__codelineno-0-1217">1217</a></span>
-<span class="normal"><a href="#__codelineno-0-1218">1218</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1204"><a id="__codelineno-0-1204" name="__codelineno-0-1204"></a><span class="k">def</span> <span class="nf">__radd_sum__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-1205"><a id="__codelineno-0-1205" name="__codelineno-0-1205"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1206"><a id="__codelineno-0-1206" name="__codelineno-0-1206"></a><span class="sd">    Internal helper method to support the sum() function.</span>
-</span><span id="__span-0-1207"><a id="__codelineno-0-1207" name="__codelineno-0-1207"></a>
-</span><span id="__span-0-1208"><a id="__codelineno-0-1208" name="__codelineno-0-1208"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1209"><a id="__codelineno-0-1209" name="__codelineno-0-1209"></a><span class="sd">        other (int or SnipeSig): The other object to add. If other is 0, return self.</span>
-</span><span id="__span-0-1210"><a id="__codelineno-0-1210" name="__codelineno-0-1210"></a>
-</span><span id="__span-0-1211"><a id="__codelineno-0-1211" name="__codelineno-0-1211"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a><span class="sd">        SnipeSig: The result of the addition.</span>
-</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a>    <span class="k">if</span> <span class="n">other</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a>        <span class="k">return</span> <span class="bp">self</span>
-</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
-</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a>        <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unsupported operand type(s) for +: &#39;SnipeSig&#39; and &#39;</span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">&#39;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1218">1218</a></span>
+<span class="normal"><a href="#__codelineno-0-1219">1219</a></span>
+<span class="normal"><a href="#__codelineno-0-1220">1220</a></span>
+<span class="normal"><a href="#__codelineno-0-1221">1221</a></span>
+<span class="normal"><a href="#__codelineno-0-1222">1222</a></span>
+<span class="normal"><a href="#__codelineno-0-1223">1223</a></span>
+<span class="normal"><a href="#__codelineno-0-1224">1224</a></span>
+<span class="normal"><a href="#__codelineno-0-1225">1225</a></span>
+<span class="normal"><a href="#__codelineno-0-1226">1226</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1212"><a id="__codelineno-0-1212" name="__codelineno-0-1212"></a><span class="k">def</span> <span class="nf">__radd_sum__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="n">Union</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-1213"><a id="__codelineno-0-1213" name="__codelineno-0-1213"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1214"><a id="__codelineno-0-1214" name="__codelineno-0-1214"></a><span class="sd">    Internal helper method to support the sum() function.</span>
+</span><span id="__span-0-1215"><a id="__codelineno-0-1215" name="__codelineno-0-1215"></a>
+</span><span id="__span-0-1216"><a id="__codelineno-0-1216" name="__codelineno-0-1216"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1217"><a id="__codelineno-0-1217" name="__codelineno-0-1217"></a><span class="sd">        other (int or SnipeSig): The other object to add. If other is 0, return self.</span>
+</span><span id="__span-0-1218"><a id="__codelineno-0-1218" name="__codelineno-0-1218"></a>
+</span><span id="__span-0-1219"><a id="__codelineno-0-1219" name="__codelineno-0-1219"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a><span class="sd">        SnipeSig: The result of the addition.</span>
+</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a>    <span class="k">if</span> <span class="n">other</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a>        <span class="k">return</span> <span class="bp">self</span>
+</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
+</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a>        <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Unsupported operand type(s) for +: &#39;SnipeSig&#39; and &#39;</span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">&#39;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6088,10 +6149,10 @@ <h3 id="snipe.api.SnipeSig.__radd_sum__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__sub__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__sub__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__sub__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__sub__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__sub__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -6124,26 +6185,26 @@ <h3 id="snipe.api.SnipeSig.__sub__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-762">762</a></span>
-<span class="normal"><a href="#__codelineno-0-763">763</a></span>
-<span class="normal"><a href="#__codelineno-0-764">764</a></span>
-<span class="normal"><a href="#__codelineno-0-765">765</a></span>
-<span class="normal"><a href="#__codelineno-0-766">766</a></span>
-<span class="normal"><a href="#__codelineno-0-767">767</a></span>
-<span class="normal"><a href="#__codelineno-0-768">768</a></span>
-<span class="normal"><a href="#__codelineno-0-769">769</a></span>
-<span class="normal"><a href="#__codelineno-0-770">770</a></span>
-<span class="normal"><a href="#__codelineno-0-771">771</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-762"><a id="__codelineno-0-762" name="__codelineno-0-762"></a><span class="k">def</span> <span class="fm">__sub__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-763"><a id="__codelineno-0-763" name="__codelineno-0-763"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-764"><a id="__codelineno-0-764" name="__codelineno-0-764"></a><span class="sd">    Implements the - operator.</span>
-</span><span id="__span-0-765"><a id="__codelineno-0-765" name="__codelineno-0-765"></a><span class="sd">    Removes hashes present in other from self, keeping abundances from self,</span>
-</span><span id="__span-0-766"><a id="__codelineno-0-766" name="__codelineno-0-766"></a><span class="sd">    returning a new signature.</span>
-</span><span id="__span-0-767"><a id="__codelineno-0-767" name="__codelineno-0-767"></a>
-</span><span id="__span-0-768"><a id="__codelineno-0-768" name="__codelineno-0-768"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-769"><a id="__codelineno-0-769" name="__codelineno-0-769"></a><span class="sd">        SnipeSig: Difference of self and other.</span>
-</span><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-770">770</a></span>
+<span class="normal"><a href="#__codelineno-0-771">771</a></span>
+<span class="normal"><a href="#__codelineno-0-772">772</a></span>
+<span class="normal"><a href="#__codelineno-0-773">773</a></span>
+<span class="normal"><a href="#__codelineno-0-774">774</a></span>
+<span class="normal"><a href="#__codelineno-0-775">775</a></span>
+<span class="normal"><a href="#__codelineno-0-776">776</a></span>
+<span class="normal"><a href="#__codelineno-0-777">777</a></span>
+<span class="normal"><a href="#__codelineno-0-778">778</a></span>
+<span class="normal"><a href="#__codelineno-0-779">779</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-770"><a id="__codelineno-0-770" name="__codelineno-0-770"></a><span class="k">def</span> <span class="fm">__sub__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-771"><a id="__codelineno-0-771" name="__codelineno-0-771"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-772"><a id="__codelineno-0-772" name="__codelineno-0-772"></a><span class="sd">    Implements the - operator.</span>
+</span><span id="__span-0-773"><a id="__codelineno-0-773" name="__codelineno-0-773"></a><span class="sd">    Removes hashes present in other from self, keeping abundances from self,</span>
+</span><span id="__span-0-774"><a id="__codelineno-0-774" name="__codelineno-0-774"></a><span class="sd">    returning a new signature.</span>
+</span><span id="__span-0-775"><a id="__codelineno-0-775" name="__codelineno-0-775"></a>
+</span><span id="__span-0-776"><a id="__codelineno-0-776" name="__codelineno-0-776"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-777"><a id="__codelineno-0-777" name="__codelineno-0-777"></a><span class="sd">        SnipeSig: Difference of self and other.</span>
+</span><span id="__span-0-778"><a id="__codelineno-0-778" name="__codelineno-0-778"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-779"><a id="__codelineno-0-779" name="__codelineno-0-779"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6153,10 +6214,10 @@ <h3 id="snipe.api.SnipeSig.__sub__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__verify_matching_ksize_scale" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__verify_matching_ksize_scale" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__verify_matching_ksize_scale" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__verify_matching_ksize_scale" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -6218,16 +6279,8 @@ <h3 id="snipe.api.SnipeSig.__verify_matching_ksize_scale" class="doc doc-heading
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-339">339</a></span>
-<span class="normal"><a href="#__codelineno-0-340">340</a></span>
-<span class="normal"><a href="#__codelineno-0-341">341</a></span>
-<span class="normal"><a href="#__codelineno-0-342">342</a></span>
-<span class="normal"><a href="#__codelineno-0-343">343</a></span>
-<span class="normal"><a href="#__codelineno-0-344">344</a></span>
-<span class="normal"><a href="#__codelineno-0-345">345</a></span>
-<span class="normal"><a href="#__codelineno-0-346">346</a></span>
-<span class="normal"><a href="#__codelineno-0-347">347</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-347">347</a></span>
 <span class="normal"><a href="#__codelineno-0-348">348</a></span>
 <span class="normal"><a href="#__codelineno-0-349">349</a></span>
 <span class="normal"><a href="#__codelineno-0-350">350</a></span>
@@ -6236,24 +6289,32 @@ <h3 id="snipe.api.SnipeSig.__verify_matching_ksize_scale" class="doc doc-heading
 <span class="normal"><a href="#__codelineno-0-353">353</a></span>
 <span class="normal"><a href="#__codelineno-0-354">354</a></span>
 <span class="normal"><a href="#__codelineno-0-355">355</a></span>
-<span class="normal"><a href="#__codelineno-0-356">356</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a><span class="k">def</span> <span class="nf">__verify_matching_ksize_scale</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
-</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a><span class="sd">    Verify that the ksize and scale match between two signatures.</span>
-</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>
-</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a><span class="sd">        other (SnipeSig): The other signature to compare.</span>
-</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>
-</span><span id="__span-0-346"><a id="__codelineno-0-346" name="__codelineno-0-346"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a><span class="sd">        ValueError: If ksize or scale do not match.</span>
-</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">!=</span> <span class="n">other</span><span class="o">.</span><span class="n">ksize</span><span class="p">:</span>
-</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>        <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;K-mer size does not match between the two signatures: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="si">}</span><span class="s2"> vs </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">.&quot;</span>
-</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">!=</span> <span class="n">other</span><span class="o">.</span><span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a>        <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Scale value does not match between the two signatures: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="si">}</span><span class="s2"> vs </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">.&quot;</span>
-</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-356">356</a></span>
+<span class="normal"><a href="#__codelineno-0-357">357</a></span>
+<span class="normal"><a href="#__codelineno-0-358">358</a></span>
+<span class="normal"><a href="#__codelineno-0-359">359</a></span>
+<span class="normal"><a href="#__codelineno-0-360">360</a></span>
+<span class="normal"><a href="#__codelineno-0-361">361</a></span>
+<span class="normal"><a href="#__codelineno-0-362">362</a></span>
+<span class="normal"><a href="#__codelineno-0-363">363</a></span>
+<span class="normal"><a href="#__codelineno-0-364">364</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-347"><a id="__codelineno-0-347" name="__codelineno-0-347"></a><span class="k">def</span> <span class="nf">__verify_matching_ksize_scale</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
+</span><span id="__span-0-348"><a id="__codelineno-0-348" name="__codelineno-0-348"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-349"><a id="__codelineno-0-349" name="__codelineno-0-349"></a><span class="sd">    Verify that the ksize and scale match between two signatures.</span>
+</span><span id="__span-0-350"><a id="__codelineno-0-350" name="__codelineno-0-350"></a>
+</span><span id="__span-0-351"><a id="__codelineno-0-351" name="__codelineno-0-351"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-352"><a id="__codelineno-0-352" name="__codelineno-0-352"></a><span class="sd">        other (SnipeSig): The other signature to compare.</span>
+</span><span id="__span-0-353"><a id="__codelineno-0-353" name="__codelineno-0-353"></a>
+</span><span id="__span-0-354"><a id="__codelineno-0-354" name="__codelineno-0-354"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-355"><a id="__codelineno-0-355" name="__codelineno-0-355"></a><span class="sd">        ValueError: If ksize or scale do not match.</span>
+</span><span id="__span-0-356"><a id="__codelineno-0-356" name="__codelineno-0-356"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-357"><a id="__codelineno-0-357" name="__codelineno-0-357"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span> <span class="o">!=</span> <span class="n">other</span><span class="o">.</span><span class="n">ksize</span><span class="p">:</span>
+</span><span id="__span-0-358"><a id="__codelineno-0-358" name="__codelineno-0-358"></a>        <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;K-mer size does not match between the two signatures: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="si">}</span><span class="s2"> vs </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">ksize</span><span class="si">}</span><span class="s2">.&quot;</span>
+</span><span id="__span-0-359"><a id="__codelineno-0-359" name="__codelineno-0-359"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-360"><a id="__codelineno-0-360" name="__codelineno-0-360"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-361"><a id="__codelineno-0-361" name="__codelineno-0-361"></a>    <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span> <span class="o">!=</span> <span class="n">other</span><span class="o">.</span><span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-362"><a id="__codelineno-0-362" name="__codelineno-0-362"></a>        <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Scale value does not match between the two signatures: </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="si">}</span><span class="s2"> vs </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">scale</span><span class="si">}</span><span class="s2">.&quot;</span>
+</span><span id="__span-0-363"><a id="__codelineno-0-363" name="__codelineno-0-363"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-364"><a id="__codelineno-0-364" name="__codelineno-0-364"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6263,10 +6324,10 @@ <h3 id="snipe.api.SnipeSig.__verify_matching_ksize_scale" class="doc doc-heading
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__verify_snipe_signature" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__verify_snipe_signature" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__verify_snipe_signature" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__verify_snipe_signature" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -6328,34 +6389,34 @@ <h3 id="snipe.api.SnipeSig.__verify_snipe_signature" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-324">324</a></span>
-<span class="normal"><a href="#__codelineno-0-325">325</a></span>
-<span class="normal"><a href="#__codelineno-0-326">326</a></span>
-<span class="normal"><a href="#__codelineno-0-327">327</a></span>
-<span class="normal"><a href="#__codelineno-0-328">328</a></span>
-<span class="normal"><a href="#__codelineno-0-329">329</a></span>
-<span class="normal"><a href="#__codelineno-0-330">330</a></span>
-<span class="normal"><a href="#__codelineno-0-331">331</a></span>
-<span class="normal"><a href="#__codelineno-0-332">332</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-332">332</a></span>
 <span class="normal"><a href="#__codelineno-0-333">333</a></span>
 <span class="normal"><a href="#__codelineno-0-334">334</a></span>
 <span class="normal"><a href="#__codelineno-0-335">335</a></span>
 <span class="normal"><a href="#__codelineno-0-336">336</a></span>
-<span class="normal"><a href="#__codelineno-0-337">337</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-324"><a id="__codelineno-0-324" name="__codelineno-0-324"></a><span class="k">def</span> <span class="nf">__verify_snipe_signature</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
-</span><span id="__span-0-325"><a id="__codelineno-0-325" name="__codelineno-0-325"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-326"><a id="__codelineno-0-326" name="__codelineno-0-326"></a><span class="sd">    Verify that the other object is a SnipeSig instance.</span>
-</span><span id="__span-0-327"><a id="__codelineno-0-327" name="__codelineno-0-327"></a>
-</span><span id="__span-0-328"><a id="__codelineno-0-328" name="__codelineno-0-328"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-329"><a id="__codelineno-0-329" name="__codelineno-0-329"></a><span class="sd">        other (SnipeSig): The other signature to verify.</span>
-</span><span id="__span-0-330"><a id="__codelineno-0-330" name="__codelineno-0-330"></a>
-</span><span id="__span-0-331"><a id="__codelineno-0-331" name="__codelineno-0-331"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="sd">        ValueError: If the other object is not a SnipeSig instance.</span>
-</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
-</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Provided sig (</span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">) is not a SnipeSig instance.&quot;</span>
-</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
-</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-337">337</a></span>
+<span class="normal"><a href="#__codelineno-0-338">338</a></span>
+<span class="normal"><a href="#__codelineno-0-339">339</a></span>
+<span class="normal"><a href="#__codelineno-0-340">340</a></span>
+<span class="normal"><a href="#__codelineno-0-341">341</a></span>
+<span class="normal"><a href="#__codelineno-0-342">342</a></span>
+<span class="normal"><a href="#__codelineno-0-343">343</a></span>
+<span class="normal"><a href="#__codelineno-0-344">344</a></span>
+<span class="normal"><a href="#__codelineno-0-345">345</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-332"><a id="__codelineno-0-332" name="__codelineno-0-332"></a><span class="k">def</span> <span class="nf">__verify_snipe_signature</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">):</span>
+</span><span id="__span-0-333"><a id="__codelineno-0-333" name="__codelineno-0-333"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-334"><a id="__codelineno-0-334" name="__codelineno-0-334"></a><span class="sd">    Verify that the other object is a SnipeSig instance.</span>
+</span><span id="__span-0-335"><a id="__codelineno-0-335" name="__codelineno-0-335"></a>
+</span><span id="__span-0-336"><a id="__codelineno-0-336" name="__codelineno-0-336"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-337"><a id="__codelineno-0-337" name="__codelineno-0-337"></a><span class="sd">        other (SnipeSig): The other signature to verify.</span>
+</span><span id="__span-0-338"><a id="__codelineno-0-338" name="__codelineno-0-338"></a>
+</span><span id="__span-0-339"><a id="__codelineno-0-339" name="__codelineno-0-339"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-340"><a id="__codelineno-0-340" name="__codelineno-0-340"></a><span class="sd">        ValueError: If the other object is not a SnipeSig instance.</span>
+</span><span id="__span-0-341"><a id="__codelineno-0-341" name="__codelineno-0-341"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-342"><a id="__codelineno-0-342" name="__codelineno-0-342"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">other</span><span class="p">,</span> <span class="n">SnipeSig</span><span class="p">):</span>
+</span><span id="__span-0-343"><a id="__codelineno-0-343" name="__codelineno-0-343"></a>        <span class="n">msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Provided sig (</span><span class="si">{</span><span class="nb">type</span><span class="p">(</span><span class="n">other</span><span class="p">)</span><span class="o">.</span><span class="vm">__name__</span><span class="si">}</span><span class="s2">) is not a SnipeSig instance.&quot;</span>
+</span><span id="__span-0-344"><a id="__codelineno-0-344" name="__codelineno-0-344"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
+</span><span id="__span-0-345"><a id="__codelineno-0-345" name="__codelineno-0-345"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="n">msg</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6365,10 +6426,10 @@ <h3 id="snipe.api.SnipeSig.__verify_snipe_signature" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.__xor__" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.__xor__" class="doc doc-heading">
             <code class="highlight language-python"><span class="fm">__xor__</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.__xor__" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.__xor__" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -6400,24 +6461,24 @@ <h3 id="snipe.api.SnipeSig.__xor__" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-789">789</a></span>
-<span class="normal"><a href="#__codelineno-0-790">790</a></span>
-<span class="normal"><a href="#__codelineno-0-791">791</a></span>
-<span class="normal"><a href="#__codelineno-0-792">792</a></span>
-<span class="normal"><a href="#__codelineno-0-793">793</a></span>
-<span class="normal"><a href="#__codelineno-0-794">794</a></span>
-<span class="normal"><a href="#__codelineno-0-795">795</a></span>
-<span class="normal"><a href="#__codelineno-0-796">796</a></span>
-<span class="normal"><a href="#__codelineno-0-797">797</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-789"><a id="__codelineno-0-789" name="__codelineno-0-789"></a><span class="k">def</span> <span class="fm">__xor__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-790"><a id="__codelineno-0-790" name="__codelineno-0-790"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-791"><a id="__codelineno-0-791" name="__codelineno-0-791"></a><span class="sd">    Implements the ^ operator.</span>
-</span><span id="__span-0-792"><a id="__codelineno-0-792" name="__codelineno-0-792"></a><span class="sd">    Keeps unique hashes from each signature with their respective abundances, returning a new signature.</span>
-</span><span id="__span-0-793"><a id="__codelineno-0-793" name="__codelineno-0-793"></a>
-</span><span id="__span-0-794"><a id="__codelineno-0-794" name="__codelineno-0-794"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-795"><a id="__codelineno-0-795" name="__codelineno-0-795"></a><span class="sd">        SnipeSig: Symmetric difference of self and other.</span>
-</span><span id="__span-0-796"><a id="__codelineno-0-796" name="__codelineno-0-796"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">symmetric_difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-797">797</a></span>
+<span class="normal"><a href="#__codelineno-0-798">798</a></span>
+<span class="normal"><a href="#__codelineno-0-799">799</a></span>
+<span class="normal"><a href="#__codelineno-0-800">800</a></span>
+<span class="normal"><a href="#__codelineno-0-801">801</a></span>
+<span class="normal"><a href="#__codelineno-0-802">802</a></span>
+<span class="normal"><a href="#__codelineno-0-803">803</a></span>
+<span class="normal"><a href="#__codelineno-0-804">804</a></span>
+<span class="normal"><a href="#__codelineno-0-805">805</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-797"><a id="__codelineno-0-797" name="__codelineno-0-797"></a><span class="k">def</span> <span class="fm">__xor__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-798"><a id="__codelineno-0-798" name="__codelineno-0-798"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-799"><a id="__codelineno-0-799" name="__codelineno-0-799"></a><span class="sd">    Implements the ^ operator.</span>
+</span><span id="__span-0-800"><a id="__codelineno-0-800" name="__codelineno-0-800"></a><span class="sd">    Keeps unique hashes from each signature with their respective abundances, returning a new signature.</span>
+</span><span id="__span-0-801"><a id="__codelineno-0-801" name="__codelineno-0-801"></a>
+</span><span id="__span-0-802"><a id="__codelineno-0-802" name="__codelineno-0-802"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-803"><a id="__codelineno-0-803" name="__codelineno-0-803"></a><span class="sd">        SnipeSig: Symmetric difference of self and other.</span>
+</span><span id="__span-0-804"><a id="__codelineno-0-804" name="__codelineno-0-804"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-805"><a id="__codelineno-0-805" name="__codelineno-0-805"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">symmetric_difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6427,14 +6488,14 @@ <h3 id="snipe.api.SnipeSig.__xor__" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.common_hashes" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.common_hashes" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">common_hashes</span><span class="p">(</span><span class="n">signatures</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s1">&#39;common_hashes_signature&#39;</span><span class="p">,</span> <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-classmethod"><code>classmethod</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.common_hashes" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.common_hashes" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -6471,16 +6532,8 @@ <h3 id="snipe.api.SnipeSig.common_hashes" class="doc doc-heading">
     - <code>ValueError</code>: If the signatures list is empty or if <code>ksize</code>/<code>scale</code> do not match across signatures.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1060">1060</a></span>
-<span class="normal"><a href="#__codelineno-0-1061">1061</a></span>
-<span class="normal"><a href="#__codelineno-0-1062">1062</a></span>
-<span class="normal"><a href="#__codelineno-0-1063">1063</a></span>
-<span class="normal"><a href="#__codelineno-0-1064">1064</a></span>
-<span class="normal"><a href="#__codelineno-0-1065">1065</a></span>
-<span class="normal"><a href="#__codelineno-0-1066">1066</a></span>
-<span class="normal"><a href="#__codelineno-0-1067">1067</a></span>
-<span class="normal"><a href="#__codelineno-0-1068">1068</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1068">1068</a></span>
 <span class="normal"><a href="#__codelineno-0-1069">1069</a></span>
 <span class="normal"><a href="#__codelineno-0-1070">1070</a></span>
 <span class="normal"><a href="#__codelineno-0-1071">1071</a></span>
@@ -6594,129 +6647,137 @@ <h3 id="snipe.api.SnipeSig.common_hashes" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1179">1179</a></span>
 <span class="normal"><a href="#__codelineno-0-1180">1180</a></span>
 <span class="normal"><a href="#__codelineno-0-1181">1181</a></span>
-<span class="normal"><a href="#__codelineno-0-1182">1182</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a><span class="nd">@classmethod</span>
-</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a><span class="k">def</span> <span class="nf">common_hashes</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">signatures</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="s1">&#39;SnipeSig&#39;</span><span class="p">],</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;common_hashes_signature&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>                  <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a><span class="sd">    Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing</span>
-</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a><span class="sd">    only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.</span>
-</span><span id="__span-0-1066"><a id="__codelineno-0-1066" name="__codelineno-0-1066"></a>
-</span><span id="__span-0-1067"><a id="__codelineno-0-1067" name="__codelineno-0-1067"></a><span class="sd">    This method uses a heap-based multi-way merge algorithm for efficient computation,</span>
-</span><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a><span class="sd">    especially when handling a large number of signatures with sorted hashes.</span>
-</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a>
-</span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a>
-</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="sd">    Given signatures \( A_1, A_2, \dots, A_n \) with hash sets \( H_1, H_2, \dots, H_n \),</span>
-</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">    the intersection signature \( C \) has:</span>
+<span class="normal"><a href="#__codelineno-0-1182">1182</a></span>
+<span class="normal"><a href="#__codelineno-0-1183">1183</a></span>
+<span class="normal"><a href="#__codelineno-0-1184">1184</a></span>
+<span class="normal"><a href="#__codelineno-0-1185">1185</a></span>
+<span class="normal"><a href="#__codelineno-0-1186">1186</a></span>
+<span class="normal"><a href="#__codelineno-0-1187">1187</a></span>
+<span class="normal"><a href="#__codelineno-0-1188">1188</a></span>
+<span class="normal"><a href="#__codelineno-0-1189">1189</a></span>
+<span class="normal"><a href="#__codelineno-0-1190">1190</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1068"><a id="__codelineno-0-1068" name="__codelineno-0-1068"></a><span class="nd">@classmethod</span>
+</span><span id="__span-0-1069"><a id="__codelineno-0-1069" name="__codelineno-0-1069"></a><span class="k">def</span> <span class="nf">common_hashes</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">signatures</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="s1">&#39;SnipeSig&#39;</span><span class="p">],</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;common_hashes_signature&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1070"><a id="__codelineno-0-1070" name="__codelineno-0-1070"></a>                  <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-1071"><a id="__codelineno-0-1071" name="__codelineno-0-1071"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1072"><a id="__codelineno-0-1072" name="__codelineno-0-1072"></a><span class="sd">    Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing</span>
+</span><span id="__span-0-1073"><a id="__codelineno-0-1073" name="__codelineno-0-1073"></a><span class="sd">    only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.</span>
 </span><span id="__span-0-1074"><a id="__codelineno-0-1074" name="__codelineno-0-1074"></a>
-</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">    - Hash set:</span>
-</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a><span class="sd">    H_C = \bigcap_{i=1}^{n} H_i</span>
-</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1075"><a id="__codelineno-0-1075" name="__codelineno-0-1075"></a><span class="sd">    This method uses a heap-based multi-way merge algorithm for efficient computation,</span>
+</span><span id="__span-0-1076"><a id="__codelineno-0-1076" name="__codelineno-0-1076"></a><span class="sd">    especially when handling a large number of signatures with sorted hashes.</span>
+</span><span id="__span-0-1077"><a id="__codelineno-0-1077" name="__codelineno-0-1077"></a>
+</span><span id="__span-0-1078"><a id="__codelineno-0-1078" name="__codelineno-0-1078"></a><span class="sd">    **Mathematical Explanation**:</span>
 </span><span id="__span-0-1079"><a id="__codelineno-0-1079" name="__codelineno-0-1079"></a>
-</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a><span class="sd">    - Abundance function:</span>
-</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a><span class="sd">    a_C(h) = \min_{i=1}^{n} a_i(h), \quad \text{for } h \in H_C</span>
-</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a>
-</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a><span class="sd">        - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to compute the intersection.</span>
-</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a><span class="sd">        - `name (str)`: Optional name for the resulting signature.</span>
-</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a><span class="sd">        - `filename (str)`: Optional filename for the resulting signature.</span>
-</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a><span class="sd">        - `enable_logging (bool)`: Flag to enable detailed logging.</span>
-</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a>
-</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the signatures.</span>
-</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a>
-</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a><span class="sd">        - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.</span>
-</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signatures provided for intersection.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a>
-</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a>    <span class="c1"># Verify that all signatures have the same ksize and scale</span>
-</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>    <span class="n">first_sig</span> <span class="o">=</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a>    <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
-</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a>    <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
-</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a>    <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">1</span><span class="p">:]:</span>
-</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>        <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same ksize and scale.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1080"><a id="__codelineno-0-1080" name="__codelineno-0-1080"></a><span class="sd">    Given signatures \( A_1, A_2, \dots, A_n \) with hash sets \( H_1, H_2, \dots, H_n \),</span>
+</span><span id="__span-0-1081"><a id="__codelineno-0-1081" name="__codelineno-0-1081"></a><span class="sd">    the intersection signature \( C \) has:</span>
+</span><span id="__span-0-1082"><a id="__codelineno-0-1082" name="__codelineno-0-1082"></a>
+</span><span id="__span-0-1083"><a id="__codelineno-0-1083" name="__codelineno-0-1083"></a><span class="sd">    - Hash set:</span>
+</span><span id="__span-0-1084"><a id="__codelineno-0-1084" name="__codelineno-0-1084"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1085"><a id="__codelineno-0-1085" name="__codelineno-0-1085"></a><span class="sd">    H_C = \bigcap_{i=1}^{n} H_i</span>
+</span><span id="__span-0-1086"><a id="__codelineno-0-1086" name="__codelineno-0-1086"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1087"><a id="__codelineno-0-1087" name="__codelineno-0-1087"></a>
+</span><span id="__span-0-1088"><a id="__codelineno-0-1088" name="__codelineno-0-1088"></a><span class="sd">    - Abundance function:</span>
+</span><span id="__span-0-1089"><a id="__codelineno-0-1089" name="__codelineno-0-1089"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1090"><a id="__codelineno-0-1090" name="__codelineno-0-1090"></a><span class="sd">    a_C(h) = \min_{i=1}^{n} a_i(h), \quad \text{for } h \in H_C</span>
+</span><span id="__span-0-1091"><a id="__codelineno-0-1091" name="__codelineno-0-1091"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1092"><a id="__codelineno-0-1092" name="__codelineno-0-1092"></a>
+</span><span id="__span-0-1093"><a id="__codelineno-0-1093" name="__codelineno-0-1093"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-1094"><a id="__codelineno-0-1094" name="__codelineno-0-1094"></a><span class="sd">        - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to compute the intersection.</span>
+</span><span id="__span-0-1095"><a id="__codelineno-0-1095" name="__codelineno-0-1095"></a><span class="sd">        - `name (str)`: Optional name for the resulting signature.</span>
+</span><span id="__span-0-1096"><a id="__codelineno-0-1096" name="__codelineno-0-1096"></a><span class="sd">        - `filename (str)`: Optional filename for the resulting signature.</span>
+</span><span id="__span-0-1097"><a id="__codelineno-0-1097" name="__codelineno-0-1097"></a><span class="sd">        - `enable_logging (bool)`: Flag to enable detailed logging.</span>
+</span><span id="__span-0-1098"><a id="__codelineno-0-1098" name="__codelineno-0-1098"></a>
+</span><span id="__span-0-1099"><a id="__codelineno-0-1099" name="__codelineno-0-1099"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-1100"><a id="__codelineno-0-1100" name="__codelineno-0-1100"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the signatures.</span>
+</span><span id="__span-0-1101"><a id="__codelineno-0-1101" name="__codelineno-0-1101"></a>
+</span><span id="__span-0-1102"><a id="__codelineno-0-1102" name="__codelineno-0-1102"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-1103"><a id="__codelineno-0-1103" name="__codelineno-0-1103"></a><span class="sd">        - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.</span>
+</span><span id="__span-0-1104"><a id="__codelineno-0-1104" name="__codelineno-0-1104"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1105"><a id="__codelineno-0-1105" name="__codelineno-0-1105"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-1106"><a id="__codelineno-0-1106" name="__codelineno-0-1106"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signatures provided for intersection.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-1107"><a id="__codelineno-0-1107" name="__codelineno-0-1107"></a>
-</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a>    <span class="n">num_signatures</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">signatures</span><span class="p">)</span>
-</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a>    <span class="n">iterators</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>    <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a>        <span class="n">it</span> <span class="o">=</span> <span class="nb">iter</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
-</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a>            <span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">it</span><span class="p">)</span>
-</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a>            <span class="n">iterators</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">))</span>
-</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a>        <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>            <span class="c1"># One of the signatures is empty; intersection is empty</span>
-</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>            <span class="k">return</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
-</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
-</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a>                <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a>                <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a>                <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
-</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a>                <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
-</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
-</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a>            <span class="p">)</span>
-</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a>
-</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a>    <span class="c1"># Initialize the heap with the first element from each iterator</span>
-</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>    <span class="n">heap</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a>    <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">iterators</span><span class="p">):</span>
-</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>        <span class="n">heap</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
-</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>    <span class="n">heapq</span><span class="o">.</span><span class="n">heapify</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a>
-</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a>    <span class="n">common_hashes</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a>    <span class="n">common_abundances</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a>
-</span><span id="__span-0-1136"><a id="__codelineno-0-1136" name="__codelineno-0-1136"></a>    <span class="k">while</span> <span class="n">heap</span><span class="p">:</span>
-</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a>        <span class="c1"># Pop all entries with the smallest hash</span>
-</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a>        <span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a>        <span class="n">same_hash_entries</span> <span class="o">=</span> <span class="p">[(</span><span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">)]</span>
+</span><span id="__span-0-1108"><a id="__codelineno-0-1108" name="__codelineno-0-1108"></a>    <span class="c1"># Verify that all signatures have the same ksize and scale</span>
+</span><span id="__span-0-1109"><a id="__codelineno-0-1109" name="__codelineno-0-1109"></a>    <span class="n">first_sig</span> <span class="o">=</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-1110"><a id="__codelineno-0-1110" name="__codelineno-0-1110"></a>    <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
+</span><span id="__span-0-1111"><a id="__codelineno-0-1111" name="__codelineno-0-1111"></a>    <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
+</span><span id="__span-0-1112"><a id="__codelineno-0-1112" name="__codelineno-0-1112"></a>    <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">1</span><span class="p">:]:</span>
+</span><span id="__span-0-1113"><a id="__codelineno-0-1113" name="__codelineno-0-1113"></a>        <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-1114"><a id="__codelineno-0-1114" name="__codelineno-0-1114"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same ksize and scale.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1115"><a id="__codelineno-0-1115" name="__codelineno-0-1115"></a>
+</span><span id="__span-0-1116"><a id="__codelineno-0-1116" name="__codelineno-0-1116"></a>    <span class="n">num_signatures</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">signatures</span><span class="p">)</span>
+</span><span id="__span-0-1117"><a id="__codelineno-0-1117" name="__codelineno-0-1117"></a>    <span class="n">iterators</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-1118"><a id="__codelineno-0-1118" name="__codelineno-0-1118"></a>    <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-1119"><a id="__codelineno-0-1119" name="__codelineno-0-1119"></a>        <span class="n">it</span> <span class="o">=</span> <span class="nb">iter</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
+</span><span id="__span-0-1120"><a id="__codelineno-0-1120" name="__codelineno-0-1120"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-1121"><a id="__codelineno-0-1121" name="__codelineno-0-1121"></a>            <span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">it</span><span class="p">)</span>
+</span><span id="__span-0-1122"><a id="__codelineno-0-1122" name="__codelineno-0-1122"></a>            <span class="n">iterators</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">))</span>
+</span><span id="__span-0-1123"><a id="__codelineno-0-1123" name="__codelineno-0-1123"></a>        <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-1124"><a id="__codelineno-0-1124" name="__codelineno-0-1124"></a>            <span class="c1"># One of the signatures is empty; intersection is empty</span>
+</span><span id="__span-0-1125"><a id="__codelineno-0-1125" name="__codelineno-0-1125"></a>            <span class="k">return</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-1126"><a id="__codelineno-0-1126" name="__codelineno-0-1126"></a>                <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
+</span><span id="__span-0-1127"><a id="__codelineno-0-1127" name="__codelineno-0-1127"></a>                <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
+</span><span id="__span-0-1128"><a id="__codelineno-0-1128" name="__codelineno-0-1128"></a>                <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-1129"><a id="__codelineno-0-1129" name="__codelineno-0-1129"></a>                <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-1130"><a id="__codelineno-0-1130" name="__codelineno-0-1130"></a>                <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
+</span><span id="__span-0-1131"><a id="__codelineno-0-1131" name="__codelineno-0-1131"></a>                <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-1132"><a id="__codelineno-0-1132" name="__codelineno-0-1132"></a>                <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
+</span><span id="__span-0-1133"><a id="__codelineno-0-1133" name="__codelineno-0-1133"></a>            <span class="p">)</span>
+</span><span id="__span-0-1134"><a id="__codelineno-0-1134" name="__codelineno-0-1134"></a>
+</span><span id="__span-0-1135"><a id="__codelineno-0-1135" name="__codelineno-0-1135"></a>    <span class="c1"># Initialize the heap with the first element from each iterator</span>
+</span><span id="__span-0-1136"><a id="__codelineno-0-1136" name="__codelineno-0-1136"></a>    <span class="n">heap</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-1137"><a id="__codelineno-0-1137" name="__codelineno-0-1137"></a>    <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">iterators</span><span class="p">):</span>
+</span><span id="__span-0-1138"><a id="__codelineno-0-1138" name="__codelineno-0-1138"></a>        <span class="n">heap</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
+</span><span id="__span-0-1139"><a id="__codelineno-0-1139" name="__codelineno-0-1139"></a>    <span class="n">heapq</span><span class="o">.</span><span class="n">heapify</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
 </span><span id="__span-0-1140"><a id="__codelineno-0-1140" name="__codelineno-0-1140"></a>
-</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a>        <span class="c1"># Collect all entries in the heap that have the same current_hash</span>
-</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a>        <span class="k">while</span> <span class="n">heap</span> <span class="ow">and</span> <span class="n">heap</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">current_hash</span><span class="p">:</span>
-</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a>            <span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a>            <span class="n">same_hash_entries</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span><span class="p">))</span>
-</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a>
-</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">same_hash_entries</span><span class="p">)</span> <span class="o">==</span> <span class="n">num_signatures</span><span class="p">:</span>
-</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a>            <span class="c1"># The current_hash is present in all signatures</span>
-</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a>            <span class="c1"># Take the minimum abundance across signatures</span>
-</span><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a>            <span class="n">min_abundance</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">entry</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="n">same_hash_entries</span><span class="p">)</span>
-</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a>            <span class="n">common_hashes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">current_hash</span><span class="p">)</span>
-</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a>            <span class="n">common_abundances</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">min_abundance</span><span class="p">)</span>
-</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a>
-</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a>        <span class="c1"># Push the next element from each iterator that had the current_hash</span>
-</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a>        <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="n">same_hash_entries</span><span class="p">:</span>
-</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a>            <span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">entry</span>
-</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a>                <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a>                <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">i</span><span class="p">))</span>
-</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a>                <span class="k">pass</span>  <span class="c1"># Iterator exhausted</span>
-</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a>
-</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a>    <span class="c1"># Convert the results to NumPy arrays</span>
-</span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">common_hashes</span><span class="p">:</span>
-</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a>        <span class="c1"># No common hashes found</span>
-</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a>        <span class="n">unique_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a>        <span class="n">unique_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>    <span class="k">else</span><span class="p">:</span>
-</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a>        <span class="n">unique_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">common_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a>        <span class="n">unique_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">common_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a>
-</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a>    <span class="c1"># Create a new SnipeSig instance from the common hashes and abundances</span>
-</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a>    <span class="n">common_signature</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes</span><span class="p">,</span>
-</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">unique_abundances</span><span class="p">,</span>
-</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>        <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>        <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>        <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
-</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>        <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
-</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
-</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>    <span class="p">)</span>
-</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>
-</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>    <span class="k">return</span> <span class="n">common_signature</span>
+</span><span id="__span-0-1141"><a id="__codelineno-0-1141" name="__codelineno-0-1141"></a>    <span class="n">common_hashes</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-1142"><a id="__codelineno-0-1142" name="__codelineno-0-1142"></a>    <span class="n">common_abundances</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-1143"><a id="__codelineno-0-1143" name="__codelineno-0-1143"></a>
+</span><span id="__span-0-1144"><a id="__codelineno-0-1144" name="__codelineno-0-1144"></a>    <span class="k">while</span> <span class="n">heap</span><span class="p">:</span>
+</span><span id="__span-0-1145"><a id="__codelineno-0-1145" name="__codelineno-0-1145"></a>        <span class="c1"># Pop all entries with the smallest hash</span>
+</span><span id="__span-0-1146"><a id="__codelineno-0-1146" name="__codelineno-0-1146"></a>        <span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-1147"><a id="__codelineno-0-1147" name="__codelineno-0-1147"></a>        <span class="n">same_hash_entries</span> <span class="o">=</span> <span class="p">[(</span><span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">)]</span>
+</span><span id="__span-0-1148"><a id="__codelineno-0-1148" name="__codelineno-0-1148"></a>
+</span><span id="__span-0-1149"><a id="__codelineno-0-1149" name="__codelineno-0-1149"></a>        <span class="c1"># Collect all entries in the heap that have the same current_hash</span>
+</span><span id="__span-0-1150"><a id="__codelineno-0-1150" name="__codelineno-0-1150"></a>        <span class="k">while</span> <span class="n">heap</span> <span class="ow">and</span> <span class="n">heap</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">current_hash</span><span class="p">:</span>
+</span><span id="__span-0-1151"><a id="__codelineno-0-1151" name="__codelineno-0-1151"></a>            <span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-1152"><a id="__codelineno-0-1152" name="__codelineno-0-1152"></a>            <span class="n">same_hash_entries</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span><span class="p">))</span>
+</span><span id="__span-0-1153"><a id="__codelineno-0-1153" name="__codelineno-0-1153"></a>
+</span><span id="__span-0-1154"><a id="__codelineno-0-1154" name="__codelineno-0-1154"></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">same_hash_entries</span><span class="p">)</span> <span class="o">==</span> <span class="n">num_signatures</span><span class="p">:</span>
+</span><span id="__span-0-1155"><a id="__codelineno-0-1155" name="__codelineno-0-1155"></a>            <span class="c1"># The current_hash is present in all signatures</span>
+</span><span id="__span-0-1156"><a id="__codelineno-0-1156" name="__codelineno-0-1156"></a>            <span class="c1"># Take the minimum abundance across signatures</span>
+</span><span id="__span-0-1157"><a id="__codelineno-0-1157" name="__codelineno-0-1157"></a>            <span class="n">min_abundance</span> <span class="o">=</span> <span class="nb">min</span><span class="p">(</span><span class="n">entry</span><span class="p">[</span><span class="mi">1</span><span class="p">]</span> <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="n">same_hash_entries</span><span class="p">)</span>
+</span><span id="__span-0-1158"><a id="__codelineno-0-1158" name="__codelineno-0-1158"></a>            <span class="n">common_hashes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">current_hash</span><span class="p">)</span>
+</span><span id="__span-0-1159"><a id="__codelineno-0-1159" name="__codelineno-0-1159"></a>            <span class="n">common_abundances</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">min_abundance</span><span class="p">)</span>
+</span><span id="__span-0-1160"><a id="__codelineno-0-1160" name="__codelineno-0-1160"></a>
+</span><span id="__span-0-1161"><a id="__codelineno-0-1161" name="__codelineno-0-1161"></a>        <span class="c1"># Push the next element from each iterator that had the current_hash</span>
+</span><span id="__span-0-1162"><a id="__codelineno-0-1162" name="__codelineno-0-1162"></a>        <span class="k">for</span> <span class="n">entry</span> <span class="ow">in</span> <span class="n">same_hash_entries</span><span class="p">:</span>
+</span><span id="__span-0-1163"><a id="__codelineno-0-1163" name="__codelineno-0-1163"></a>            <span class="n">h</span><span class="p">,</span> <span class="n">a</span><span class="p">,</span> <span class="n">i</span> <span class="o">=</span> <span class="n">entry</span>
+</span><span id="__span-0-1164"><a id="__codelineno-0-1164" name="__codelineno-0-1164"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-1165"><a id="__codelineno-0-1165" name="__codelineno-0-1165"></a>                <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">i</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="__span-0-1166"><a id="__codelineno-0-1166" name="__codelineno-0-1166"></a>                <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">i</span><span class="p">))</span>
+</span><span id="__span-0-1167"><a id="__codelineno-0-1167" name="__codelineno-0-1167"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-1168"><a id="__codelineno-0-1168" name="__codelineno-0-1168"></a>                <span class="k">pass</span>  <span class="c1"># Iterator exhausted</span>
+</span><span id="__span-0-1169"><a id="__codelineno-0-1169" name="__codelineno-0-1169"></a>
+</span><span id="__span-0-1170"><a id="__codelineno-0-1170" name="__codelineno-0-1170"></a>    <span class="c1"># Convert the results to NumPy arrays</span>
+</span><span id="__span-0-1171"><a id="__codelineno-0-1171" name="__codelineno-0-1171"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">common_hashes</span><span class="p">:</span>
+</span><span id="__span-0-1172"><a id="__codelineno-0-1172" name="__codelineno-0-1172"></a>        <span class="c1"># No common hashes found</span>
+</span><span id="__span-0-1173"><a id="__codelineno-0-1173" name="__codelineno-0-1173"></a>        <span class="n">unique_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-1174"><a id="__codelineno-0-1174" name="__codelineno-0-1174"></a>        <span class="n">unique_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-1175"><a id="__codelineno-0-1175" name="__codelineno-0-1175"></a>    <span class="k">else</span><span class="p">:</span>
+</span><span id="__span-0-1176"><a id="__codelineno-0-1176" name="__codelineno-0-1176"></a>        <span class="n">unique_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">common_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-1177"><a id="__codelineno-0-1177" name="__codelineno-0-1177"></a>        <span class="n">unique_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">common_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-1178"><a id="__codelineno-0-1178" name="__codelineno-0-1178"></a>
+</span><span id="__span-0-1179"><a id="__codelineno-0-1179" name="__codelineno-0-1179"></a>    <span class="c1"># Create a new SnipeSig instance from the common hashes and abundances</span>
+</span><span id="__span-0-1180"><a id="__codelineno-0-1180" name="__codelineno-0-1180"></a>    <span class="n">common_signature</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-1181"><a id="__codelineno-0-1181" name="__codelineno-0-1181"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes</span><span class="p">,</span>
+</span><span id="__span-0-1182"><a id="__codelineno-0-1182" name="__codelineno-0-1182"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">unique_abundances</span><span class="p">,</span>
+</span><span id="__span-0-1183"><a id="__codelineno-0-1183" name="__codelineno-0-1183"></a>        <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a>        <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a>        <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
+</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a>        <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
+</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a>    <span class="p">)</span>
+</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a>
+</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a>    <span class="k">return</span> <span class="n">common_signature</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6726,10 +6787,10 @@ <h3 id="snipe.api.SnipeSig.common_hashes" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.copy" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.copy" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">copy</span><span class="p">()</span></code>
 
-<a href="#snipe.api.SnipeSig.copy" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.copy" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -6760,22 +6821,22 @@ <h3 id="snipe.api.SnipeSig.copy" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1184">1184</a></span>
-<span class="normal"><a href="#__codelineno-0-1185">1185</a></span>
-<span class="normal"><a href="#__codelineno-0-1186">1186</a></span>
-<span class="normal"><a href="#__codelineno-0-1187">1187</a></span>
-<span class="normal"><a href="#__codelineno-0-1188">1188</a></span>
-<span class="normal"><a href="#__codelineno-0-1189">1189</a></span>
-<span class="normal"><a href="#__codelineno-0-1190">1190</a></span>
-<span class="normal"><a href="#__codelineno-0-1191">1191</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1184"><a id="__codelineno-0-1184" name="__codelineno-0-1184"></a><span class="k">def</span> <span class="nf">copy</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-1185"><a id="__codelineno-0-1185" name="__codelineno-0-1185"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1186"><a id="__codelineno-0-1186" name="__codelineno-0-1186"></a><span class="sd">    Create a copy of the current SnipeSig instance.</span>
-</span><span id="__span-0-1187"><a id="__codelineno-0-1187" name="__codelineno-0-1187"></a>
-</span><span id="__span-0-1188"><a id="__codelineno-0-1188" name="__codelineno-0-1188"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1189"><a id="__codelineno-0-1189" name="__codelineno-0-1189"></a><span class="sd">        SnipeSig: A new instance that is a copy of self.</span>
-</span><span id="__span-0-1190"><a id="__codelineno-0-1190" name="__codelineno-0-1190"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1191"><a id="__codelineno-0-1191" name="__codelineno-0-1191"></a>    <span class="k">return</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">export_to_string</span><span class="p">(),</span> <span class="n">sig_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sigtype</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1192">1192</a></span>
+<span class="normal"><a href="#__codelineno-0-1193">1193</a></span>
+<span class="normal"><a href="#__codelineno-0-1194">1194</a></span>
+<span class="normal"><a href="#__codelineno-0-1195">1195</a></span>
+<span class="normal"><a href="#__codelineno-0-1196">1196</a></span>
+<span class="normal"><a href="#__codelineno-0-1197">1197</a></span>
+<span class="normal"><a href="#__codelineno-0-1198">1198</a></span>
+<span class="normal"><a href="#__codelineno-0-1199">1199</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1192"><a id="__codelineno-0-1192" name="__codelineno-0-1192"></a><span class="k">def</span> <span class="nf">copy</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-1193"><a id="__codelineno-0-1193" name="__codelineno-0-1193"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1194"><a id="__codelineno-0-1194" name="__codelineno-0-1194"></a><span class="sd">    Create a copy of the current SnipeSig instance.</span>
+</span><span id="__span-0-1195"><a id="__codelineno-0-1195" name="__codelineno-0-1195"></a>
+</span><span id="__span-0-1196"><a id="__codelineno-0-1196" name="__codelineno-0-1196"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1197"><a id="__codelineno-0-1197" name="__codelineno-0-1197"></a><span class="sd">        SnipeSig: A new instance that is a copy of self.</span>
+</span><span id="__span-0-1198"><a id="__codelineno-0-1198" name="__codelineno-0-1198"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1199"><a id="__codelineno-0-1199" name="__codelineno-0-1199"></a>    <span class="k">return</span> <span class="n">SnipeSig</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">export_to_string</span><span class="p">(),</span> <span class="n">sig_type</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">sigtype</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6785,10 +6846,10 @@ <h3 id="snipe.api.SnipeSig.copy" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.count_singletons" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.count_singletons" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">count_singletons</span><span class="p">()</span></code>
 
-<a href="#snipe.api.SnipeSig.count_singletons" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.count_singletons" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -6842,36 +6903,36 @@ <h3 id="snipe.api.SnipeSig.count_singletons" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1325">1325</a></span>
-<span class="normal"><a href="#__codelineno-0-1326">1326</a></span>
-<span class="normal"><a href="#__codelineno-0-1327">1327</a></span>
-<span class="normal"><a href="#__codelineno-0-1328">1328</a></span>
-<span class="normal"><a href="#__codelineno-0-1329">1329</a></span>
-<span class="normal"><a href="#__codelineno-0-1330">1330</a></span>
-<span class="normal"><a href="#__codelineno-0-1331">1331</a></span>
-<span class="normal"><a href="#__codelineno-0-1332">1332</a></span>
-<span class="normal"><a href="#__codelineno-0-1333">1333</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1333">1333</a></span>
 <span class="normal"><a href="#__codelineno-0-1334">1334</a></span>
 <span class="normal"><a href="#__codelineno-0-1335">1335</a></span>
 <span class="normal"><a href="#__codelineno-0-1336">1336</a></span>
 <span class="normal"><a href="#__codelineno-0-1337">1337</a></span>
 <span class="normal"><a href="#__codelineno-0-1338">1338</a></span>
-<span class="normal"><a href="#__codelineno-0-1339">1339</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a><span class="k">def</span> <span class="nf">count_singletons</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
-</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a><span class="sd">    Return the number of hashes with abundance equal to 1.</span>
-</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a>
-</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a><span class="sd">        int: Number of singletons.</span>
-</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a>
-</span><span id="__span-0-1332"><a id="__codelineno-0-1332" name="__codelineno-0-1332"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a><span class="sd">        ValueError: If the signature does not track abundance.</span>
-</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;count singletons&quot;</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1339">1339</a></span>
+<span class="normal"><a href="#__codelineno-0-1340">1340</a></span>
+<span class="normal"><a href="#__codelineno-0-1341">1341</a></span>
+<span class="normal"><a href="#__codelineno-0-1342">1342</a></span>
+<span class="normal"><a href="#__codelineno-0-1343">1343</a></span>
+<span class="normal"><a href="#__codelineno-0-1344">1344</a></span>
+<span class="normal"><a href="#__codelineno-0-1345">1345</a></span>
+<span class="normal"><a href="#__codelineno-0-1346">1346</a></span>
+<span class="normal"><a href="#__codelineno-0-1347">1347</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1333"><a id="__codelineno-0-1333" name="__codelineno-0-1333"></a><span class="k">def</span> <span class="nf">count_singletons</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="__span-0-1334"><a id="__codelineno-0-1334" name="__codelineno-0-1334"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1335"><a id="__codelineno-0-1335" name="__codelineno-0-1335"></a><span class="sd">    Return the number of hashes with abundance equal to 1.</span>
 </span><span id="__span-0-1336"><a id="__codelineno-0-1336" name="__codelineno-0-1336"></a>
-</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a>    <span class="n">count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">==</span> <span class="mi">1</span><span class="p">)</span>
-</span><span id="__span-0-1338"><a id="__codelineno-0-1338" name="__codelineno-0-1338"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Number of singletons (abundance == 1): </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">count</span><span class="p">)</span>
-</span><span id="__span-0-1339"><a id="__codelineno-0-1339" name="__codelineno-0-1339"></a>    <span class="k">return</span> <span class="nb">int</span><span class="p">(</span><span class="n">count</span><span class="p">)</span>
+</span><span id="__span-0-1337"><a id="__codelineno-0-1337" name="__codelineno-0-1337"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1338"><a id="__codelineno-0-1338" name="__codelineno-0-1338"></a><span class="sd">        int: Number of singletons.</span>
+</span><span id="__span-0-1339"><a id="__codelineno-0-1339" name="__codelineno-0-1339"></a>
+</span><span id="__span-0-1340"><a id="__codelineno-0-1340" name="__codelineno-0-1340"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a><span class="sd">        ValueError: If the signature does not track abundance.</span>
+</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;count singletons&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1344"><a id="__codelineno-0-1344" name="__codelineno-0-1344"></a>
+</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a>    <span class="n">count</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">==</span> <span class="mi">1</span><span class="p">)</span>
+</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Number of singletons (abundance == 1): </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="n">count</span><span class="p">)</span>
+</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a>    <span class="k">return</span> <span class="nb">int</span><span class="p">(</span><span class="n">count</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -6881,14 +6942,14 @@ <h3 id="snipe.api.SnipeSig.count_singletons" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.create_from_hashes_abundances" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.create_from_hashes_abundances" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">create_from_hashes_abundances</span><span class="p">(</span><span class="n">hashes</span><span class="p">,</span> <span class="n">abundances</span><span class="p">,</span> <span class="n">ksize</span><span class="p">,</span> <span class="n">scale</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">)</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-classmethod"><code>classmethod</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.create_from_hashes_abundances" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.create_from_hashes_abundances" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -7062,16 +7123,8 @@ <h3 id="snipe.api.SnipeSig.create_from_hashes_abundances" class="doc doc-heading
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-839">839</a></span>
-<span class="normal"><a href="#__codelineno-0-840">840</a></span>
-<span class="normal"><a href="#__codelineno-0-841">841</a></span>
-<span class="normal"><a href="#__codelineno-0-842">842</a></span>
-<span class="normal"><a href="#__codelineno-0-843">843</a></span>
-<span class="normal"><a href="#__codelineno-0-844">844</a></span>
-<span class="normal"><a href="#__codelineno-0-845">845</a></span>
-<span class="normal"><a href="#__codelineno-0-846">846</a></span>
-<span class="normal"><a href="#__codelineno-0-847">847</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-847">847</a></span>
 <span class="normal"><a href="#__codelineno-0-848">848</a></span>
 <span class="normal"><a href="#__codelineno-0-849">849</a></span>
 <span class="normal"><a href="#__codelineno-0-850">850</a></span>
@@ -7087,31 +7140,39 @@ <h3 id="snipe.api.SnipeSig.create_from_hashes_abundances" class="doc doc-heading
 <span class="normal"><a href="#__codelineno-0-860">860</a></span>
 <span class="normal"><a href="#__codelineno-0-861">861</a></span>
 <span class="normal"><a href="#__codelineno-0-862">862</a></span>
-<span class="normal"><a href="#__codelineno-0-863">863</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-839"><a id="__codelineno-0-839" name="__codelineno-0-839"></a><span class="nd">@classmethod</span>
-</span><span id="__span-0-840"><a id="__codelineno-0-840" name="__codelineno-0-840"></a><span class="k">def</span> <span class="nf">create_from_hashes_abundances</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">hashes</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">abundances</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span>
-</span><span id="__span-0-841"><a id="__codelineno-0-841" name="__codelineno-0-841"></a>                                  <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-842"><a id="__codelineno-0-842" name="__codelineno-0-842"></a>                                  <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">:</span> <span class="n">SigType</span> <span class="o">=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-843"><a id="__codelineno-0-843" name="__codelineno-0-843"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-844"><a id="__codelineno-0-844" name="__codelineno-0-844"></a><span class="sd">    Internal method to create a SnipeSig instance from hashes and abundances.</span>
-</span><span id="__span-0-845"><a id="__codelineno-0-845" name="__codelineno-0-845"></a>
-</span><span id="__span-0-846"><a id="__codelineno-0-846" name="__codelineno-0-846"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a><span class="sd">        hashes (np.ndarray): Array of hash values.</span>
-</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a><span class="sd">        abundances (np.ndarray): Array of abundance values corresponding to the hashes.</span>
-</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a><span class="sd">        ksize (int): K-mer size.</span>
-</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a><span class="sd">        scale (int): Scale value.</span>
-</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a><span class="sd">        name (str): Optional name for the signature.</span>
-</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a><span class="sd">        filename (str): Optional filename for the signature.</span>
-</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a><span class="sd">        sig_type (SigType): Type of the signature.</span>
-</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a><span class="sd">        enable_logging (bool): Flag to enable logging.</span>
-</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a>
-</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a><span class="sd">        SnipeSig: A new SnipeSig instance.</span>
-</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a>    <span class="c1"># Create a mock sourmash signature object</span>
-</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a>    <span class="n">mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a>    <span class="n">mh</span><span class="o">.</span><span class="n">set_abundances</span><span class="p">(</span><span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">hashes</span><span class="p">,</span> <span class="n">abundances</span><span class="p">)))</span>
-</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a>    <span class="n">sig</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">name</span> <span class="ow">or</span> <span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">filename</span><span class="o">=</span><span class="n">filename</span> <span class="ow">or</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
-</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>    <span class="k">return</span> <span class="bp">cls</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">sig_type</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-863">863</a></span>
+<span class="normal"><a href="#__codelineno-0-864">864</a></span>
+<span class="normal"><a href="#__codelineno-0-865">865</a></span>
+<span class="normal"><a href="#__codelineno-0-866">866</a></span>
+<span class="normal"><a href="#__codelineno-0-867">867</a></span>
+<span class="normal"><a href="#__codelineno-0-868">868</a></span>
+<span class="normal"><a href="#__codelineno-0-869">869</a></span>
+<span class="normal"><a href="#__codelineno-0-870">870</a></span>
+<span class="normal"><a href="#__codelineno-0-871">871</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-847"><a id="__codelineno-0-847" name="__codelineno-0-847"></a><span class="nd">@classmethod</span>
+</span><span id="__span-0-848"><a id="__codelineno-0-848" name="__codelineno-0-848"></a><span class="k">def</span> <span class="nf">create_from_hashes_abundances</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">hashes</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span> <span class="n">abundances</span><span class="p">:</span> <span class="n">np</span><span class="o">.</span><span class="n">ndarray</span><span class="p">,</span>
+</span><span id="__span-0-849"><a id="__codelineno-0-849" name="__codelineno-0-849"></a>                                  <span class="n">ksize</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">scale</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-850"><a id="__codelineno-0-850" name="__codelineno-0-850"></a>                                  <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span> <span class="n">sig_type</span><span class="p">:</span> <span class="n">SigType</span> <span class="o">=</span> <span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-851"><a id="__codelineno-0-851" name="__codelineno-0-851"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-852"><a id="__codelineno-0-852" name="__codelineno-0-852"></a><span class="sd">    Internal method to create a SnipeSig instance from hashes and abundances.</span>
+</span><span id="__span-0-853"><a id="__codelineno-0-853" name="__codelineno-0-853"></a>
+</span><span id="__span-0-854"><a id="__codelineno-0-854" name="__codelineno-0-854"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-855"><a id="__codelineno-0-855" name="__codelineno-0-855"></a><span class="sd">        hashes (np.ndarray): Array of hash values.</span>
+</span><span id="__span-0-856"><a id="__codelineno-0-856" name="__codelineno-0-856"></a><span class="sd">        abundances (np.ndarray): Array of abundance values corresponding to the hashes.</span>
+</span><span id="__span-0-857"><a id="__codelineno-0-857" name="__codelineno-0-857"></a><span class="sd">        ksize (int): K-mer size.</span>
+</span><span id="__span-0-858"><a id="__codelineno-0-858" name="__codelineno-0-858"></a><span class="sd">        scale (int): Scale value.</span>
+</span><span id="__span-0-859"><a id="__codelineno-0-859" name="__codelineno-0-859"></a><span class="sd">        name (str): Optional name for the signature.</span>
+</span><span id="__span-0-860"><a id="__codelineno-0-860" name="__codelineno-0-860"></a><span class="sd">        filename (str): Optional filename for the signature.</span>
+</span><span id="__span-0-861"><a id="__codelineno-0-861" name="__codelineno-0-861"></a><span class="sd">        sig_type (SigType): Type of the signature.</span>
+</span><span id="__span-0-862"><a id="__codelineno-0-862" name="__codelineno-0-862"></a><span class="sd">        enable_logging (bool): Flag to enable logging.</span>
+</span><span id="__span-0-863"><a id="__codelineno-0-863" name="__codelineno-0-863"></a>
+</span><span id="__span-0-864"><a id="__codelineno-0-864" name="__codelineno-0-864"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-865"><a id="__codelineno-0-865" name="__codelineno-0-865"></a><span class="sd">        SnipeSig: A new SnipeSig instance.</span>
+</span><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a>    <span class="c1"># Create a mock sourmash signature object</span>
+</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>    <span class="n">mh</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">minhash</span><span class="o">.</span><span class="n">MinHash</span><span class="p">(</span><span class="n">n</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span> <span class="n">scaled</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span> <span class="n">track_abundance</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>    <span class="n">mh</span><span class="o">.</span><span class="n">set_abundances</span><span class="p">(</span><span class="nb">dict</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">hashes</span><span class="p">,</span> <span class="n">abundances</span><span class="p">)))</span>
+</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a>    <span class="n">sig</span> <span class="o">=</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">SourmashSignature</span><span class="p">(</span><span class="n">mh</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="n">name</span> <span class="ow">or</span> <span class="s2">&quot;&quot;</span><span class="p">,</span> <span class="n">filename</span><span class="o">=</span><span class="n">filename</span> <span class="ow">or</span> <span class="s2">&quot;&quot;</span><span class="p">)</span>
+</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a>    <span class="k">return</span> <span class="bp">cls</span><span class="p">(</span><span class="n">sourmash_sig</span><span class="o">=</span><span class="n">sig</span><span class="p">,</span> <span class="n">sig_type</span><span class="o">=</span><span class="n">sig_type</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7121,10 +7182,10 @@ <h3 id="snipe.api.SnipeSig.create_from_hashes_abundances" class="doc doc-heading
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.difference_sigs" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.difference_sigs" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.difference_sigs" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.difference_sigs" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -7158,16 +7219,8 @@ <h3 id="snipe.api.SnipeSig.difference_sigs" class="doc doc-heading">
     - <code>RuntimeError</code>: If zero hashes remain after difference.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-569">569</a></span>
-<span class="normal"><a href="#__codelineno-0-570">570</a></span>
-<span class="normal"><a href="#__codelineno-0-571">571</a></span>
-<span class="normal"><a href="#__codelineno-0-572">572</a></span>
-<span class="normal"><a href="#__codelineno-0-573">573</a></span>
-<span class="normal"><a href="#__codelineno-0-574">574</a></span>
-<span class="normal"><a href="#__codelineno-0-575">575</a></span>
-<span class="normal"><a href="#__codelineno-0-576">576</a></span>
-<span class="normal"><a href="#__codelineno-0-577">577</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-577">577</a></span>
 <span class="normal"><a href="#__codelineno-0-578">578</a></span>
 <span class="normal"><a href="#__codelineno-0-579">579</a></span>
 <span class="normal"><a href="#__codelineno-0-580">580</a></span>
@@ -7218,66 +7271,74 @@ <h3 id="snipe.api.SnipeSig.difference_sigs" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-625">625</a></span>
 <span class="normal"><a href="#__codelineno-0-626">626</a></span>
 <span class="normal"><a href="#__codelineno-0-627">627</a></span>
-<span class="normal"><a href="#__codelineno-0-628">628</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a><span class="k">def</span> <span class="nf">difference_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a><span class="sd">    Compute the difference of the current signature with another signature.</span>
-</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a>
-</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a><span class="sd">    This method removes hashes that are present in the other signature from self,</span>
-</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a><span class="sd">    keeping the abundances from self.</span>
-</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a>
-</span><span id="__span-0-576"><a id="__codelineno-0-576" name="__codelineno-0-576"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-577"><a id="__codelineno-0-577" name="__codelineno-0-577"></a>
-</span><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a><span class="sd">    Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
-</span><span id="__span-0-579"><a id="__codelineno-0-579" name="__codelineno-0-579"></a><span class="sd">    and abundance function \( a_A(h) \), the difference signature \( C \) has:</span>
+<span class="normal"><a href="#__codelineno-0-628">628</a></span>
+<span class="normal"><a href="#__codelineno-0-629">629</a></span>
+<span class="normal"><a href="#__codelineno-0-630">630</a></span>
+<span class="normal"><a href="#__codelineno-0-631">631</a></span>
+<span class="normal"><a href="#__codelineno-0-632">632</a></span>
+<span class="normal"><a href="#__codelineno-0-633">633</a></span>
+<span class="normal"><a href="#__codelineno-0-634">634</a></span>
+<span class="normal"><a href="#__codelineno-0-635">635</a></span>
+<span class="normal"><a href="#__codelineno-0-636">636</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-577"><a id="__codelineno-0-577" name="__codelineno-0-577"></a><span class="k">def</span> <span class="nf">difference_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-578"><a id="__codelineno-0-578" name="__codelineno-0-578"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-579"><a id="__codelineno-0-579" name="__codelineno-0-579"></a><span class="sd">    Compute the difference of the current signature with another signature.</span>
 </span><span id="__span-0-580"><a id="__codelineno-0-580" name="__codelineno-0-580"></a>
-</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a><span class="sd">    - Hash set:</span>
-</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a><span class="sd">    $$</span>
-</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a><span class="sd">    H_C = H_A \setminus H_B</span>
-</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a><span class="sd">    $$</span>
+</span><span id="__span-0-581"><a id="__codelineno-0-581" name="__codelineno-0-581"></a><span class="sd">    This method removes hashes that are present in the other signature from self,</span>
+</span><span id="__span-0-582"><a id="__codelineno-0-582" name="__codelineno-0-582"></a><span class="sd">    keeping the abundances from self.</span>
+</span><span id="__span-0-583"><a id="__codelineno-0-583" name="__codelineno-0-583"></a>
+</span><span id="__span-0-584"><a id="__codelineno-0-584" name="__codelineno-0-584"></a><span class="sd">    **Mathematical Explanation**:</span>
 </span><span id="__span-0-585"><a id="__codelineno-0-585" name="__codelineno-0-585"></a>
-</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a><span class="sd">    - Abundance function:</span>
-</span><span id="__span-0-587"><a id="__codelineno-0-587" name="__codelineno-0-587"></a><span class="sd">    $$</span>
-</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a><span class="sd">    a_C(h) = a_A(h), \quad \text{for } h \in H_C</span>
-</span><span id="__span-0-589"><a id="__codelineno-0-589" name="__codelineno-0-589"></a><span class="sd">    $$</span>
-</span><span id="__span-0-590"><a id="__codelineno-0-590" name="__codelineno-0-590"></a>
-</span><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a><span class="sd">        - `other (SnipeSig)`: Another `SnipeSig` instance to subtract from the current signature.</span>
+</span><span id="__span-0-586"><a id="__codelineno-0-586" name="__codelineno-0-586"></a><span class="sd">    Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
+</span><span id="__span-0-587"><a id="__codelineno-0-587" name="__codelineno-0-587"></a><span class="sd">    and abundance function \( a_A(h) \), the difference signature \( C \) has:</span>
+</span><span id="__span-0-588"><a id="__codelineno-0-588" name="__codelineno-0-588"></a>
+</span><span id="__span-0-589"><a id="__codelineno-0-589" name="__codelineno-0-589"></a><span class="sd">    - Hash set:</span>
+</span><span id="__span-0-590"><a id="__codelineno-0-590" name="__codelineno-0-590"></a><span class="sd">    $$</span>
+</span><span id="__span-0-591"><a id="__codelineno-0-591" name="__codelineno-0-591"></a><span class="sd">    H_C = H_A \setminus H_B</span>
+</span><span id="__span-0-592"><a id="__codelineno-0-592" name="__codelineno-0-592"></a><span class="sd">    $$</span>
 </span><span id="__span-0-593"><a id="__codelineno-0-593" name="__codelineno-0-593"></a>
-</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the difference of the two signatures.</span>
-</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a>
-</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a><span class="sd">        - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
-</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a><span class="sd">        - `RuntimeError`: If zero hashes remain after difference.</span>
-</span><span id="__span-0-600"><a id="__codelineno-0-600" name="__codelineno-0-600"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-602"><a id="__codelineno-0-602" name="__codelineno-0-602"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a>
-</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Differencing signatures.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a>
-</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a>    <span class="c1"># Use numpy&#39;s setdiff1d function</span>
-</span><span id="__span-0-607"><a id="__codelineno-0-607" name="__codelineno-0-607"></a>    <span class="n">diff_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-608"><a id="__codelineno-0-608" name="__codelineno-0-608"></a>
-</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a>    <span class="k">if</span> <span class="n">diff_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a>        <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Difference operation resulted in zero hashes, which is not allowed for </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">.&quot;</span>
-</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a>
-</span><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a>    <span class="c1"># Get the indices of the hashes in self</span>
-</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">diff_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a>    <span class="n">diff_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
+</span><span id="__span-0-594"><a id="__codelineno-0-594" name="__codelineno-0-594"></a><span class="sd">    - Abundance function:</span>
+</span><span id="__span-0-595"><a id="__codelineno-0-595" name="__codelineno-0-595"></a><span class="sd">    $$</span>
+</span><span id="__span-0-596"><a id="__codelineno-0-596" name="__codelineno-0-596"></a><span class="sd">    a_C(h) = a_A(h), \quad \text{for } h \in H_C</span>
+</span><span id="__span-0-597"><a id="__codelineno-0-597" name="__codelineno-0-597"></a><span class="sd">    $$</span>
+</span><span id="__span-0-598"><a id="__codelineno-0-598" name="__codelineno-0-598"></a>
+</span><span id="__span-0-599"><a id="__codelineno-0-599" name="__codelineno-0-599"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-600"><a id="__codelineno-0-600" name="__codelineno-0-600"></a><span class="sd">        - `other (SnipeSig)`: Another `SnipeSig` instance to subtract from the current signature.</span>
+</span><span id="__span-0-601"><a id="__codelineno-0-601" name="__codelineno-0-601"></a>
+</span><span id="__span-0-602"><a id="__codelineno-0-602" name="__codelineno-0-602"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-603"><a id="__codelineno-0-603" name="__codelineno-0-603"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the difference of the two signatures.</span>
+</span><span id="__span-0-604"><a id="__codelineno-0-604" name="__codelineno-0-604"></a>
+</span><span id="__span-0-605"><a id="__codelineno-0-605" name="__codelineno-0-605"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-606"><a id="__codelineno-0-606" name="__codelineno-0-606"></a><span class="sd">        - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
+</span><span id="__span-0-607"><a id="__codelineno-0-607" name="__codelineno-0-607"></a><span class="sd">        - `RuntimeError`: If zero hashes remain after difference.</span>
+</span><span id="__span-0-608"><a id="__codelineno-0-608" name="__codelineno-0-608"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-609"><a id="__codelineno-0-609" name="__codelineno-0-609"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-610"><a id="__codelineno-0-610" name="__codelineno-0-610"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-611"><a id="__codelineno-0-611" name="__codelineno-0-611"></a>
+</span><span id="__span-0-612"><a id="__codelineno-0-612" name="__codelineno-0-612"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Differencing signatures.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-613"><a id="__codelineno-0-613" name="__codelineno-0-613"></a>
+</span><span id="__span-0-614"><a id="__codelineno-0-614" name="__codelineno-0-614"></a>    <span class="c1"># Use numpy&#39;s setdiff1d function</span>
+</span><span id="__span-0-615"><a id="__codelineno-0-615" name="__codelineno-0-615"></a>    <span class="n">diff_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
 </span><span id="__span-0-616"><a id="__codelineno-0-616" name="__codelineno-0-616"></a>
-</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Difference operation completed. Remaining hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">diff_hashes</span><span class="p">))</span>
-</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a>
-</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a>    <span class="c1"># Create a new SnipeSig instance</span>
-</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">diff_hashes</span><span class="p">,</span>
-</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">diff_abundances</span><span class="p">,</span>
-</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a>        <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a>        <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a>        <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_difference_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a>        <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a>    <span class="p">)</span>
+</span><span id="__span-0-617"><a id="__codelineno-0-617" name="__codelineno-0-617"></a>    <span class="k">if</span> <span class="n">diff_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-618"><a id="__codelineno-0-618" name="__codelineno-0-618"></a>        <span class="n">_e_msg</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;Difference operation resulted in zero hashes, which is not allowed for </span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2"> and </span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">.&quot;</span>
+</span><span id="__span-0-619"><a id="__codelineno-0-619" name="__codelineno-0-619"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">warning</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-620"><a id="__codelineno-0-620" name="__codelineno-0-620"></a>
+</span><span id="__span-0-621"><a id="__codelineno-0-621" name="__codelineno-0-621"></a>    <span class="c1"># Get the indices of the hashes in self</span>
+</span><span id="__span-0-622"><a id="__codelineno-0-622" name="__codelineno-0-622"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">diff_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-623"><a id="__codelineno-0-623" name="__codelineno-0-623"></a>    <span class="n">diff_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask</span><span class="p">]</span>
+</span><span id="__span-0-624"><a id="__codelineno-0-624" name="__codelineno-0-624"></a>
+</span><span id="__span-0-625"><a id="__codelineno-0-625" name="__codelineno-0-625"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Difference operation completed. Remaining hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">diff_hashes</span><span class="p">))</span>
+</span><span id="__span-0-626"><a id="__codelineno-0-626" name="__codelineno-0-626"></a>
+</span><span id="__span-0-627"><a id="__codelineno-0-627" name="__codelineno-0-627"></a>    <span class="c1"># Create a new SnipeSig instance</span>
+</span><span id="__span-0-628"><a id="__codelineno-0-628" name="__codelineno-0-628"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-629"><a id="__codelineno-0-629" name="__codelineno-0-629"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">diff_hashes</span><span class="p">,</span>
+</span><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">diff_abundances</span><span class="p">,</span>
+</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a>        <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-632"><a id="__codelineno-0-632" name="__codelineno-0-632"></a>        <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a>        <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_difference_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a>        <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7287,10 +7348,10 @@ <h3 id="snipe.api.SnipeSig.difference_sigs" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.export" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.export" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">export</span><span class="p">(</span><span class="n">path</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.export" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.export" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -7329,26 +7390,26 @@ <h3 id="snipe.api.SnipeSig.export" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-480">480</a></span>
-<span class="normal"><a href="#__codelineno-0-481">481</a></span>
-<span class="normal"><a href="#__codelineno-0-482">482</a></span>
-<span class="normal"><a href="#__codelineno-0-483">483</a></span>
-<span class="normal"><a href="#__codelineno-0-484">484</a></span>
-<span class="normal"><a href="#__codelineno-0-485">485</a></span>
-<span class="normal"><a href="#__codelineno-0-486">486</a></span>
-<span class="normal"><a href="#__codelineno-0-487">487</a></span>
-<span class="normal"><a href="#__codelineno-0-488">488</a></span>
-<span class="normal"><a href="#__codelineno-0-489">489</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-480"><a id="__codelineno-0-480" name="__codelineno-0-480"></a><span class="k">def</span> <span class="nf">export</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">path</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
-</span><span id="__span-0-481"><a id="__codelineno-0-481" name="__codelineno-0-481"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-482"><a id="__codelineno-0-482" name="__codelineno-0-482"></a><span class="sd">    Export the signature to a file.</span>
-</span><span id="__span-0-483"><a id="__codelineno-0-483" name="__codelineno-0-483"></a>
-</span><span id="__span-0-484"><a id="__codelineno-0-484" name="__codelineno-0-484"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-485"><a id="__codelineno-0-485" name="__codelineno-0-485"></a><span class="sd">        path (str): The path to save the signature to.</span>
-</span><span id="__span-0-486"><a id="__codelineno-0-486" name="__codelineno-0-486"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-487"><a id="__codelineno-0-487" name="__codelineno-0-487"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_convert_to_sourmash_signature</span><span class="p">()</span>
-</span><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">path</span><span class="p">),</span> <span class="s2">&quot;wb&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">fp</span><span class="p">:</span>
-</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a>        <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">save_signatures_to_json</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span><span class="p">],</span> <span class="n">fp</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-488">488</a></span>
+<span class="normal"><a href="#__codelineno-0-489">489</a></span>
+<span class="normal"><a href="#__codelineno-0-490">490</a></span>
+<span class="normal"><a href="#__codelineno-0-491">491</a></span>
+<span class="normal"><a href="#__codelineno-0-492">492</a></span>
+<span class="normal"><a href="#__codelineno-0-493">493</a></span>
+<span class="normal"><a href="#__codelineno-0-494">494</a></span>
+<span class="normal"><a href="#__codelineno-0-495">495</a></span>
+<span class="normal"><a href="#__codelineno-0-496">496</a></span>
+<span class="normal"><a href="#__codelineno-0-497">497</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-488"><a id="__codelineno-0-488" name="__codelineno-0-488"></a><span class="k">def</span> <span class="nf">export</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">path</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="__span-0-489"><a id="__codelineno-0-489" name="__codelineno-0-489"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-490"><a id="__codelineno-0-490" name="__codelineno-0-490"></a><span class="sd">    Export the signature to a file.</span>
+</span><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a>
+</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a><span class="sd">        path (str): The path to save the signature to.</span>
+</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_convert_to_sourmash_signature</span><span class="p">()</span>
+</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a>    <span class="k">with</span> <span class="nb">open</span><span class="p">(</span><span class="nb">str</span><span class="p">(</span><span class="n">path</span><span class="p">),</span> <span class="s2">&quot;wb&quot;</span><span class="p">)</span> <span class="k">as</span> <span class="n">fp</span><span class="p">:</span>
+</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a>        <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">save_signatures_to_json</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span><span class="p">],</span> <span class="n">fp</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7358,10 +7419,10 @@ <h3 id="snipe.api.SnipeSig.export" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.export_to_string" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.export_to_string" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">export_to_string</span><span class="p">()</span></code>
 
-<a href="#snipe.api.SnipeSig.export_to_string" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.export_to_string" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -7391,24 +7452,24 @@ <h3 id="snipe.api.SnipeSig.export_to_string" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-491">491</a></span>
-<span class="normal"><a href="#__codelineno-0-492">492</a></span>
-<span class="normal"><a href="#__codelineno-0-493">493</a></span>
-<span class="normal"><a href="#__codelineno-0-494">494</a></span>
-<span class="normal"><a href="#__codelineno-0-495">495</a></span>
-<span class="normal"><a href="#__codelineno-0-496">496</a></span>
-<span class="normal"><a href="#__codelineno-0-497">497</a></span>
-<span class="normal"><a href="#__codelineno-0-498">498</a></span>
-<span class="normal"><a href="#__codelineno-0-499">499</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-491"><a id="__codelineno-0-491" name="__codelineno-0-491"></a><span class="k">def</span> <span class="nf">export_to_string</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-492"><a id="__codelineno-0-492" name="__codelineno-0-492"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-493"><a id="__codelineno-0-493" name="__codelineno-0-493"></a><span class="sd">    Export the signature to a JSON string.</span>
-</span><span id="__span-0-494"><a id="__codelineno-0-494" name="__codelineno-0-494"></a>
-</span><span id="__span-0-495"><a id="__codelineno-0-495" name="__codelineno-0-495"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-496"><a id="__codelineno-0-496" name="__codelineno-0-496"></a><span class="sd">        str: JSON string representation of the signature.</span>
-</span><span id="__span-0-497"><a id="__codelineno-0-497" name="__codelineno-0-497"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-498"><a id="__codelineno-0-498" name="__codelineno-0-498"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_convert_to_sourmash_signature</span><span class="p">()</span>
-</span><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a>    <span class="k">return</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">save_signatures_to_json</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span><span class="p">])</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="s1">&#39;utf-8&#39;</span><span class="p">)</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-499">499</a></span>
+<span class="normal"><a href="#__codelineno-0-500">500</a></span>
+<span class="normal"><a href="#__codelineno-0-501">501</a></span>
+<span class="normal"><a href="#__codelineno-0-502">502</a></span>
+<span class="normal"><a href="#__codelineno-0-503">503</a></span>
+<span class="normal"><a href="#__codelineno-0-504">504</a></span>
+<span class="normal"><a href="#__codelineno-0-505">505</a></span>
+<span class="normal"><a href="#__codelineno-0-506">506</a></span>
+<span class="normal"><a href="#__codelineno-0-507">507</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-499"><a id="__codelineno-0-499" name="__codelineno-0-499"></a><span class="k">def</span> <span class="nf">export_to_string</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-500"><a id="__codelineno-0-500" name="__codelineno-0-500"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a><span class="sd">    Export the signature to a JSON string.</span>
+</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a>
+</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a><span class="sd">        str: JSON string representation of the signature.</span>
+</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_convert_to_sourmash_signature</span><span class="p">()</span>
+</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a>    <span class="k">return</span> <span class="n">sourmash</span><span class="o">.</span><span class="n">signature</span><span class="o">.</span><span class="n">save_signatures_to_json</span><span class="p">([</span><span class="bp">self</span><span class="o">.</span><span class="n">sourmash_sig</span><span class="p">])</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="s1">&#39;utf-8&#39;</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7418,10 +7479,10 @@ <h3 id="snipe.api.SnipeSig.export_to_string" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.get_info" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.get_info" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">get_info</span><span class="p">()</span></code>
 
-<a href="#snipe.api.SnipeSig.get_info" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.get_info" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -7452,16 +7513,8 @@ <h3 id="snipe.api.SnipeSig.get_info" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-268">268</a></span>
-<span class="normal"><a href="#__codelineno-0-269">269</a></span>
-<span class="normal"><a href="#__codelineno-0-270">270</a></span>
-<span class="normal"><a href="#__codelineno-0-271">271</a></span>
-<span class="normal"><a href="#__codelineno-0-272">272</a></span>
-<span class="normal"><a href="#__codelineno-0-273">273</a></span>
-<span class="normal"><a href="#__codelineno-0-274">274</a></span>
-<span class="normal"><a href="#__codelineno-0-275">275</a></span>
-<span class="normal"><a href="#__codelineno-0-276">276</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-276">276</a></span>
 <span class="normal"><a href="#__codelineno-0-277">277</a></span>
 <span class="normal"><a href="#__codelineno-0-278">278</a></span>
 <span class="normal"><a href="#__codelineno-0-279">279</a></span>
@@ -7470,24 +7523,32 @@ <h3 id="snipe.api.SnipeSig.get_info" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-282">282</a></span>
 <span class="normal"><a href="#__codelineno-0-283">283</a></span>
 <span class="normal"><a href="#__codelineno-0-284">284</a></span>
-<span class="normal"><a href="#__codelineno-0-285">285</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-268"><a id="__codelineno-0-268" name="__codelineno-0-268"></a><span class="k">def</span> <span class="nf">get_info</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
-</span><span id="__span-0-269"><a id="__codelineno-0-269" name="__codelineno-0-269"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-270"><a id="__codelineno-0-270" name="__codelineno-0-270"></a><span class="sd">    Get information about the signature.</span>
-</span><span id="__span-0-271"><a id="__codelineno-0-271" name="__codelineno-0-271"></a>
-</span><span id="__span-0-272"><a id="__codelineno-0-272" name="__codelineno-0-272"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-273"><a id="__codelineno-0-273" name="__codelineno-0-273"></a><span class="sd">        dict: A dictionary containing signature information.</span>
-</span><span id="__span-0-274"><a id="__codelineno-0-274" name="__codelineno-0-274"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-275"><a id="__codelineno-0-275" name="__codelineno-0-275"></a>    <span class="n">info</span> <span class="o">=</span> <span class="p">{</span>
-</span><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a>        <span class="s2">&quot;name&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span>
-</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a>        <span class="s2">&quot;filename&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">,</span>
-</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a>        <span class="s2">&quot;md5sum&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span><span class="p">,</span>
-</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>        <span class="s2">&quot;ksize&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a>        <span class="s2">&quot;scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a>        <span class="s2">&quot;track_abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">,</span>
-</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a>        <span class="s2">&quot;sigtype&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="p">,</span>
-</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>        <span class="s2">&quot;num_hashes&quot;</span><span class="p">:</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
-</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>    <span class="p">}</span>
-</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>    <span class="k">return</span> <span class="n">info</span>
+<span class="normal"><a href="#__codelineno-0-285">285</a></span>
+<span class="normal"><a href="#__codelineno-0-286">286</a></span>
+<span class="normal"><a href="#__codelineno-0-287">287</a></span>
+<span class="normal"><a href="#__codelineno-0-288">288</a></span>
+<span class="normal"><a href="#__codelineno-0-289">289</a></span>
+<span class="normal"><a href="#__codelineno-0-290">290</a></span>
+<span class="normal"><a href="#__codelineno-0-291">291</a></span>
+<span class="normal"><a href="#__codelineno-0-292">292</a></span>
+<span class="normal"><a href="#__codelineno-0-293">293</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-276"><a id="__codelineno-0-276" name="__codelineno-0-276"></a><span class="k">def</span> <span class="nf">get_info</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">:</span>
+</span><span id="__span-0-277"><a id="__codelineno-0-277" name="__codelineno-0-277"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-278"><a id="__codelineno-0-278" name="__codelineno-0-278"></a><span class="sd">    Get information about the signature.</span>
+</span><span id="__span-0-279"><a id="__codelineno-0-279" name="__codelineno-0-279"></a>
+</span><span id="__span-0-280"><a id="__codelineno-0-280" name="__codelineno-0-280"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-281"><a id="__codelineno-0-281" name="__codelineno-0-281"></a><span class="sd">        dict: A dictionary containing signature information.</span>
+</span><span id="__span-0-282"><a id="__codelineno-0-282" name="__codelineno-0-282"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-283"><a id="__codelineno-0-283" name="__codelineno-0-283"></a>    <span class="n">info</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="__span-0-284"><a id="__codelineno-0-284" name="__codelineno-0-284"></a>        <span class="s2">&quot;name&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="p">,</span>
+</span><span id="__span-0-285"><a id="__codelineno-0-285" name="__codelineno-0-285"></a>        <span class="s2">&quot;filename&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_filename</span><span class="p">,</span>
+</span><span id="__span-0-286"><a id="__codelineno-0-286" name="__codelineno-0-286"></a>        <span class="s2">&quot;md5sum&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_md5sum</span><span class="p">,</span>
+</span><span id="__span-0-287"><a id="__codelineno-0-287" name="__codelineno-0-287"></a>        <span class="s2">&quot;ksize&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-288"><a id="__codelineno-0-288" name="__codelineno-0-288"></a>        <span class="s2">&quot;scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-289"><a id="__codelineno-0-289" name="__codelineno-0-289"></a>        <span class="s2">&quot;track_abundance&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_track_abundance</span><span class="p">,</span>
+</span><span id="__span-0-290"><a id="__codelineno-0-290" name="__codelineno-0-290"></a>        <span class="s2">&quot;sigtype&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">_type</span><span class="p">,</span>
+</span><span id="__span-0-291"><a id="__codelineno-0-291" name="__codelineno-0-291"></a>        <span class="s2">&quot;num_hashes&quot;</span><span class="p">:</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">)</span>
+</span><span id="__span-0-292"><a id="__codelineno-0-292" name="__codelineno-0-292"></a>    <span class="p">}</span>
+</span><span id="__span-0-293"><a id="__codelineno-0-293" name="__codelineno-0-293"></a>    <span class="k">return</span> <span class="n">info</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7497,10 +7558,10 @@ <h3 id="snipe.api.SnipeSig.get_info" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.get_name" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.get_name" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">get_name</span><span class="p">()</span></code>
 
-<a href="#snipe.api.SnipeSig.get_name" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.get_name" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -7508,12 +7569,12 @@ <h3 id="snipe.api.SnipeSig.get_name" class="doc doc-heading">
         <p>Get the name of the signature.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-256">256</a></span>
-<span class="normal"><a href="#__codelineno-0-257">257</a></span>
-<span class="normal"><a href="#__codelineno-0-258">258</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-256"><a id="__codelineno-0-256" name="__codelineno-0-256"></a><span class="k">def</span> <span class="nf">get_name</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
-</span><span id="__span-0-257"><a id="__codelineno-0-257" name="__codelineno-0-257"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Get the name of the signature.&quot;&quot;&quot;</span>
-</span><span id="__span-0-258"><a id="__codelineno-0-258" name="__codelineno-0-258"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-264">264</a></span>
+<span class="normal"><a href="#__codelineno-0-265">265</a></span>
+<span class="normal"><a href="#__codelineno-0-266">266</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-264"><a id="__codelineno-0-264" name="__codelineno-0-264"></a><span class="k">def</span> <span class="nf">get_name</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">str</span><span class="p">:</span>
+</span><span id="__span-0-265"><a id="__codelineno-0-265" name="__codelineno-0-265"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;Get the name of the signature.&quot;&quot;&quot;</span>
+</span><span id="__span-0-266"><a id="__codelineno-0-266" name="__codelineno-0-266"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">_name</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7523,14 +7584,14 @@ <h3 id="snipe.api.SnipeSig.get_name" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.get_unique_signatures" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.get_unique_signatures" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">get_unique_signatures</span><span class="p">(</span><span class="n">signatures</span><span class="p">)</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-staticmethod"><code>staticmethod</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.get_unique_signatures" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.get_unique_signatures" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -7616,16 +7677,8 @@ <h3 id="snipe.api.SnipeSig.get_unique_signatures" class="doc doc-heading">
     </table>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-992"> 992</a></span>
-<span class="normal"><a href="#__codelineno-0-993"> 993</a></span>
-<span class="normal"><a href="#__codelineno-0-994"> 994</a></span>
-<span class="normal"><a href="#__codelineno-0-995"> 995</a></span>
-<span class="normal"><a href="#__codelineno-0-996"> 996</a></span>
-<span class="normal"><a href="#__codelineno-0-997"> 997</a></span>
-<span class="normal"><a href="#__codelineno-0-998"> 998</a></span>
-<span class="normal"><a href="#__codelineno-0-999"> 999</a></span>
-<span class="normal"><a href="#__codelineno-0-1000">1000</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1000">1000</a></span>
 <span class="normal"><a href="#__codelineno-0-1001">1001</a></span>
 <span class="normal"><a href="#__codelineno-0-1002">1002</a></span>
 <span class="normal"><a href="#__codelineno-0-1003">1003</a></span>
@@ -7682,72 +7735,80 @@ <h3 id="snipe.api.SnipeSig.get_unique_signatures" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1054">1054</a></span>
 <span class="normal"><a href="#__codelineno-0-1055">1055</a></span>
 <span class="normal"><a href="#__codelineno-0-1056">1056</a></span>
-<span class="normal"><a href="#__codelineno-0-1057">1057</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a><span class="nd">@staticmethod</span>
-</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a><span class="k">def</span> <span class="nf">get_unique_signatures</span><span class="p">(</span><span class="n">signatures</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">]:</span>
-</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a><span class="sd">    Extract unique signatures from a dictionary of SnipeSig instances.</span>
-</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>
-</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a><span class="sd">    For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.</span>
-</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>
-</span><span id="__span-0-999"><a id="__codelineno-0-999" name="__codelineno-0-999"></a><span class="sd">    Parameters:</span>
-</span><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a><span class="sd">        signatures (Dict[str, SnipeSig]): A dictionary mapping signature names to SnipeSig instances.</span>
-</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a>
-</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a><span class="sd">    Returns:</span>
-</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a><span class="sd">        Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.</span>
+<span class="normal"><a href="#__codelineno-0-1057">1057</a></span>
+<span class="normal"><a href="#__codelineno-0-1058">1058</a></span>
+<span class="normal"><a href="#__codelineno-0-1059">1059</a></span>
+<span class="normal"><a href="#__codelineno-0-1060">1060</a></span>
+<span class="normal"><a href="#__codelineno-0-1061">1061</a></span>
+<span class="normal"><a href="#__codelineno-0-1062">1062</a></span>
+<span class="normal"><a href="#__codelineno-0-1063">1063</a></span>
+<span class="normal"><a href="#__codelineno-0-1064">1064</a></span>
+<span class="normal"><a href="#__codelineno-0-1065">1065</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1000"><a id="__codelineno-0-1000" name="__codelineno-0-1000"></a><span class="nd">@staticmethod</span>
+</span><span id="__span-0-1001"><a id="__codelineno-0-1001" name="__codelineno-0-1001"></a><span class="k">def</span> <span class="nf">get_unique_signatures</span><span class="p">(</span><span class="n">signatures</span><span class="p">:</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">])</span> <span class="o">-&gt;</span> <span class="n">Dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">]:</span>
+</span><span id="__span-0-1002"><a id="__codelineno-0-1002" name="__codelineno-0-1002"></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1003"><a id="__codelineno-0-1003" name="__codelineno-0-1003"></a><span class="sd">    Extract unique signatures from a dictionary of SnipeSig instances.</span>
 </span><span id="__span-0-1004"><a id="__codelineno-0-1004" name="__codelineno-0-1004"></a>
-</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a><span class="sd">    Raises:</span>
-</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a><span class="sd">        ValueError: If the input dictionary is empty or if signatures have mismatched ksize/scale.</span>
-</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;The input signatures dictionary is empty.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a>
-</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a>    <span class="c1"># Extract ksize and scale from the first signature</span>
-</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>    <span class="n">first_name</span><span class="p">,</span> <span class="n">first_sig</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">()))</span>
-</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a>    <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
-</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a>    <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
-</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a>
-</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>    <span class="c1"># Verify that all signatures have the same ksize and scale</span>
-</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>    <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>        <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Signature &#39;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&#39; has mismatched ksize or scale.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>
-</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>    <span class="c1"># Aggregate all hashes from all signatures</span>
-</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>    <span class="n">all_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span> <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">values</span><span class="p">()])</span>
+</span><span id="__span-0-1005"><a id="__codelineno-0-1005" name="__codelineno-0-1005"></a><span class="sd">    For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.</span>
+</span><span id="__span-0-1006"><a id="__codelineno-0-1006" name="__codelineno-0-1006"></a>
+</span><span id="__span-0-1007"><a id="__codelineno-0-1007" name="__codelineno-0-1007"></a><span class="sd">    Parameters:</span>
+</span><span id="__span-0-1008"><a id="__codelineno-0-1008" name="__codelineno-0-1008"></a><span class="sd">        signatures (Dict[str, SnipeSig]): A dictionary mapping signature names to SnipeSig instances.</span>
+</span><span id="__span-0-1009"><a id="__codelineno-0-1009" name="__codelineno-0-1009"></a>
+</span><span id="__span-0-1010"><a id="__codelineno-0-1010" name="__codelineno-0-1010"></a><span class="sd">    Returns:</span>
+</span><span id="__span-0-1011"><a id="__codelineno-0-1011" name="__codelineno-0-1011"></a><span class="sd">        Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.</span>
+</span><span id="__span-0-1012"><a id="__codelineno-0-1012" name="__codelineno-0-1012"></a>
+</span><span id="__span-0-1013"><a id="__codelineno-0-1013" name="__codelineno-0-1013"></a><span class="sd">    Raises:</span>
+</span><span id="__span-0-1014"><a id="__codelineno-0-1014" name="__codelineno-0-1014"></a><span class="sd">        ValueError: If the input dictionary is empty or if signatures have mismatched ksize/scale.</span>
+</span><span id="__span-0-1015"><a id="__codelineno-0-1015" name="__codelineno-0-1015"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1016"><a id="__codelineno-0-1016" name="__codelineno-0-1016"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-1017"><a id="__codelineno-0-1017" name="__codelineno-0-1017"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;The input signatures dictionary is empty.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1018"><a id="__codelineno-0-1018" name="__codelineno-0-1018"></a>
+</span><span id="__span-0-1019"><a id="__codelineno-0-1019" name="__codelineno-0-1019"></a>    <span class="c1"># Extract ksize and scale from the first signature</span>
+</span><span id="__span-0-1020"><a id="__codelineno-0-1020" name="__codelineno-0-1020"></a>    <span class="n">first_name</span><span class="p">,</span> <span class="n">first_sig</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">()))</span>
+</span><span id="__span-0-1021"><a id="__codelineno-0-1021" name="__codelineno-0-1021"></a>    <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
+</span><span id="__span-0-1022"><a id="__codelineno-0-1022" name="__codelineno-0-1022"></a>    <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
 </span><span id="__span-0-1023"><a id="__codelineno-0-1023" name="__codelineno-0-1023"></a>
-</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>    <span class="c1"># Count the occurrences of each hash</span>
-</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>    <span class="n">unique_hashes</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">all_hashes</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>
-</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>    <span class="c1"># Identify hashes that are unique across all signatures (count == 1)</span>
-</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>    <span class="n">unique_across_all</span> <span class="o">=</span> <span class="n">unique_hashes</span><span class="p">[</span><span class="n">counts</span> <span class="o">==</span> <span class="mi">1</span><span class="p">]</span>
-</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>
-</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>    <span class="c1"># Convert to a set for faster membership testing</span>
-</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a>    <span class="n">unique_set</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique_across_all</span><span class="p">)</span>
-</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a>
-</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a>    <span class="n">unique_signatures</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="__span-0-1024"><a id="__codelineno-0-1024" name="__codelineno-0-1024"></a>    <span class="c1"># Verify that all signatures have the same ksize and scale</span>
+</span><span id="__span-0-1025"><a id="__codelineno-0-1025" name="__codelineno-0-1025"></a>    <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1026"><a id="__codelineno-0-1026" name="__codelineno-0-1026"></a>        <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-1027"><a id="__codelineno-0-1027" name="__codelineno-0-1027"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Signature &#39;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&#39; has mismatched ksize or scale.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1028"><a id="__codelineno-0-1028" name="__codelineno-0-1028"></a>
+</span><span id="__span-0-1029"><a id="__codelineno-0-1029" name="__codelineno-0-1029"></a>    <span class="c1"># Aggregate all hashes from all signatures</span>
+</span><span id="__span-0-1030"><a id="__codelineno-0-1030" name="__codelineno-0-1030"></a>    <span class="n">all_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">([</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span> <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">values</span><span class="p">()])</span>
+</span><span id="__span-0-1031"><a id="__codelineno-0-1031" name="__codelineno-0-1031"></a>
+</span><span id="__span-0-1032"><a id="__codelineno-0-1032" name="__codelineno-0-1032"></a>    <span class="c1"># Count the occurrences of each hash</span>
+</span><span id="__span-0-1033"><a id="__codelineno-0-1033" name="__codelineno-0-1033"></a>    <span class="n">unique_hashes</span><span class="p">,</span> <span class="n">counts</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">all_hashes</span><span class="p">,</span> <span class="n">return_counts</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
 </span><span id="__span-0-1034"><a id="__codelineno-0-1034" name="__codelineno-0-1034"></a>
-</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>    <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
-</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>        <span class="c1"># Find hashes in the current signature that are unique across all signatures</span>
-</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>        <span class="n">mask_unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="nb">list</span><span class="p">(</span><span class="n">unique_set</span><span class="p">))</span>
-</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>
-</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>        <span class="c1"># Extract unique hashes and their abundances</span>
-</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>        <span class="n">unique_hashes_sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">[</span><span class="n">mask_unique</span><span class="p">]</span>
-</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>        <span class="n">unique_abundances_sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">[</span><span class="n">mask_unique</span><span class="p">]</span>
+</span><span id="__span-0-1035"><a id="__codelineno-0-1035" name="__codelineno-0-1035"></a>    <span class="c1"># Identify hashes that are unique across all signatures (count == 1)</span>
+</span><span id="__span-0-1036"><a id="__codelineno-0-1036" name="__codelineno-0-1036"></a>    <span class="n">unique_across_all</span> <span class="o">=</span> <span class="n">unique_hashes</span><span class="p">[</span><span class="n">counts</span> <span class="o">==</span> <span class="mi">1</span><span class="p">]</span>
+</span><span id="__span-0-1037"><a id="__codelineno-0-1037" name="__codelineno-0-1037"></a>
+</span><span id="__span-0-1038"><a id="__codelineno-0-1038" name="__codelineno-0-1038"></a>    <span class="c1"># Convert to a set for faster membership testing</span>
+</span><span id="__span-0-1039"><a id="__codelineno-0-1039" name="__codelineno-0-1039"></a>    <span class="n">unique_set</span> <span class="o">=</span> <span class="nb">set</span><span class="p">(</span><span class="n">unique_across_all</span><span class="p">)</span>
+</span><span id="__span-0-1040"><a id="__codelineno-0-1040" name="__codelineno-0-1040"></a>
+</span><span id="__span-0-1041"><a id="__codelineno-0-1041" name="__codelineno-0-1041"></a>    <span class="n">unique_signatures</span> <span class="o">=</span> <span class="p">{}</span>
 </span><span id="__span-0-1042"><a id="__codelineno-0-1042" name="__codelineno-0-1042"></a>
-</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>        <span class="c1"># Create a new SnipeSig instance with the unique hashes and abundances</span>
-</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>        <span class="n">unique_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes_sig</span><span class="p">,</span>
-</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">unique_abundances_sig</span><span class="p">,</span>
-</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a>            <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a>            <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">_unique&quot;</span><span class="p">,</span>
-</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>  <span class="c1"># Set to True if you want logging for the new signatures</span>
-</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>            <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span>  <span class="c1"># Adjust sig_type as needed</span>
-</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a>        <span class="p">)</span>
-</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a>
-</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a>        <span class="n">unique_signatures</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">unique_sig</span>
-</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>
-</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a>    <span class="k">return</span> <span class="n">unique_signatures</span>
+</span><span id="__span-0-1043"><a id="__codelineno-0-1043" name="__codelineno-0-1043"></a>    <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="__span-0-1044"><a id="__codelineno-0-1044" name="__codelineno-0-1044"></a>        <span class="c1"># Find hashes in the current signature that are unique across all signatures</span>
+</span><span id="__span-0-1045"><a id="__codelineno-0-1045" name="__codelineno-0-1045"></a>        <span class="n">mask_unique</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="nb">list</span><span class="p">(</span><span class="n">unique_set</span><span class="p">))</span>
+</span><span id="__span-0-1046"><a id="__codelineno-0-1046" name="__codelineno-0-1046"></a>
+</span><span id="__span-0-1047"><a id="__codelineno-0-1047" name="__codelineno-0-1047"></a>        <span class="c1"># Extract unique hashes and their abundances</span>
+</span><span id="__span-0-1048"><a id="__codelineno-0-1048" name="__codelineno-0-1048"></a>        <span class="n">unique_hashes_sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">[</span><span class="n">mask_unique</span><span class="p">]</span>
+</span><span id="__span-0-1049"><a id="__codelineno-0-1049" name="__codelineno-0-1049"></a>        <span class="n">unique_abundances_sig</span> <span class="o">=</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">[</span><span class="n">mask_unique</span><span class="p">]</span>
+</span><span id="__span-0-1050"><a id="__codelineno-0-1050" name="__codelineno-0-1050"></a>
+</span><span id="__span-0-1051"><a id="__codelineno-0-1051" name="__codelineno-0-1051"></a>        <span class="c1"># Create a new SnipeSig instance with the unique hashes and abundances</span>
+</span><span id="__span-0-1052"><a id="__codelineno-0-1052" name="__codelineno-0-1052"></a>        <span class="n">unique_sig</span> <span class="o">=</span> <span class="n">SnipeSig</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-1053"><a id="__codelineno-0-1053" name="__codelineno-0-1053"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes_sig</span><span class="p">,</span>
+</span><span id="__span-0-1054"><a id="__codelineno-0-1054" name="__codelineno-0-1054"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">unique_abundances_sig</span><span class="p">,</span>
+</span><span id="__span-0-1055"><a id="__codelineno-0-1055" name="__codelineno-0-1055"></a>            <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-1056"><a id="__codelineno-0-1056" name="__codelineno-0-1056"></a>            <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-1057"><a id="__codelineno-0-1057" name="__codelineno-0-1057"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">_unique&quot;</span><span class="p">,</span>
+</span><span id="__span-0-1058"><a id="__codelineno-0-1058" name="__codelineno-0-1058"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-1059"><a id="__codelineno-0-1059" name="__codelineno-0-1059"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>  <span class="c1"># Set to True if you want logging for the new signatures</span>
+</span><span id="__span-0-1060"><a id="__codelineno-0-1060" name="__codelineno-0-1060"></a>            <span class="n">sig_type</span><span class="o">=</span><span class="n">SigType</span><span class="o">.</span><span class="n">SAMPLE</span>  <span class="c1"># Adjust sig_type as needed</span>
+</span><span id="__span-0-1061"><a id="__codelineno-0-1061" name="__codelineno-0-1061"></a>        <span class="p">)</span>
+</span><span id="__span-0-1062"><a id="__codelineno-0-1062" name="__codelineno-0-1062"></a>
+</span><span id="__span-0-1063"><a id="__codelineno-0-1063" name="__codelineno-0-1063"></a>        <span class="n">unique_signatures</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">=</span> <span class="n">unique_sig</span>
+</span><span id="__span-0-1064"><a id="__codelineno-0-1064" name="__codelineno-0-1064"></a>
+</span><span id="__span-0-1065"><a id="__codelineno-0-1065" name="__codelineno-0-1065"></a>    <span class="k">return</span> <span class="n">unique_signatures</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7757,10 +7818,10 @@ <h3 id="snipe.api.SnipeSig.get_unique_signatures" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.intersection_sigs" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.intersection_sigs" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">intersection_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.intersection_sigs" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.intersection_sigs" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -7792,16 +7853,8 @@ <h3 id="snipe.api.SnipeSig.intersection_sigs" class="doc doc-heading">
     - <code>ValueError</code>: If <code>ksize</code> or <code>scale</code> do not match between signatures.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-501">501</a></span>
-<span class="normal"><a href="#__codelineno-0-502">502</a></span>
-<span class="normal"><a href="#__codelineno-0-503">503</a></span>
-<span class="normal"><a href="#__codelineno-0-504">504</a></span>
-<span class="normal"><a href="#__codelineno-0-505">505</a></span>
-<span class="normal"><a href="#__codelineno-0-506">506</a></span>
-<span class="normal"><a href="#__codelineno-0-507">507</a></span>
-<span class="normal"><a href="#__codelineno-0-508">508</a></span>
-<span class="normal"><a href="#__codelineno-0-509">509</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-509">509</a></span>
 <span class="normal"><a href="#__codelineno-0-510">510</a></span>
 <span class="normal"><a href="#__codelineno-0-511">511</a></span>
 <span class="normal"><a href="#__codelineno-0-512">512</a></span>
@@ -7859,73 +7912,81 @@ <h3 id="snipe.api.SnipeSig.intersection_sigs" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-564">564</a></span>
 <span class="normal"><a href="#__codelineno-0-565">565</a></span>
 <span class="normal"><a href="#__codelineno-0-566">566</a></span>
-<span class="normal"><a href="#__codelineno-0-567">567</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-501"><a id="__codelineno-0-501" name="__codelineno-0-501"></a><span class="k">def</span> <span class="nf">intersection_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-502"><a id="__codelineno-0-502" name="__codelineno-0-502"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-503"><a id="__codelineno-0-503" name="__codelineno-0-503"></a><span class="sd">    Compute the intersection of the current signature with another signature.</span>
-</span><span id="__span-0-504"><a id="__codelineno-0-504" name="__codelineno-0-504"></a>
-</span><span id="__span-0-505"><a id="__codelineno-0-505" name="__codelineno-0-505"></a><span class="sd">    This method keeps only the hashes that are common to both signatures, and retains the abundances from self.</span>
-</span><span id="__span-0-506"><a id="__codelineno-0-506" name="__codelineno-0-506"></a>
-</span><span id="__span-0-507"><a id="__codelineno-0-507" name="__codelineno-0-507"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-508"><a id="__codelineno-0-508" name="__codelineno-0-508"></a>
-</span><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a><span class="sd">    Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
-</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a><span class="sd">    and abundance functions \( a_A(h) \) and \( a_B(h) \), the intersection signature \( C \) has:</span>
-</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a>
-</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a><span class="sd">    - Hash set:</span>
-</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a><span class="sd">    $$</span>
-</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a><span class="sd">    H_C = H_A \cap H_B</span>
-</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a><span class="sd">    $$</span>
+<span class="normal"><a href="#__codelineno-0-567">567</a></span>
+<span class="normal"><a href="#__codelineno-0-568">568</a></span>
+<span class="normal"><a href="#__codelineno-0-569">569</a></span>
+<span class="normal"><a href="#__codelineno-0-570">570</a></span>
+<span class="normal"><a href="#__codelineno-0-571">571</a></span>
+<span class="normal"><a href="#__codelineno-0-572">572</a></span>
+<span class="normal"><a href="#__codelineno-0-573">573</a></span>
+<span class="normal"><a href="#__codelineno-0-574">574</a></span>
+<span class="normal"><a href="#__codelineno-0-575">575</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-509"><a id="__codelineno-0-509" name="__codelineno-0-509"></a><span class="k">def</span> <span class="nf">intersection_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-510"><a id="__codelineno-0-510" name="__codelineno-0-510"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-511"><a id="__codelineno-0-511" name="__codelineno-0-511"></a><span class="sd">    Compute the intersection of the current signature with another signature.</span>
+</span><span id="__span-0-512"><a id="__codelineno-0-512" name="__codelineno-0-512"></a>
+</span><span id="__span-0-513"><a id="__codelineno-0-513" name="__codelineno-0-513"></a><span class="sd">    This method keeps only the hashes that are common to both signatures, and retains the abundances from self.</span>
+</span><span id="__span-0-514"><a id="__codelineno-0-514" name="__codelineno-0-514"></a>
+</span><span id="__span-0-515"><a id="__codelineno-0-515" name="__codelineno-0-515"></a><span class="sd">    **Mathematical Explanation**:</span>
 </span><span id="__span-0-516"><a id="__codelineno-0-516" name="__codelineno-0-516"></a>
-</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a><span class="sd">    - Abundance function:</span>
-</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a><span class="sd">    $$</span>
-</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a><span class="sd">    a_C(h) = a_A(h), \quad \text{for } h \in H_C</span>
-</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a><span class="sd">    $$</span>
-</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a>
-</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a><span class="sd">        - `other (SnipeSig)`: Another `SnipeSig` instance to intersect with.</span>
+</span><span id="__span-0-517"><a id="__codelineno-0-517" name="__codelineno-0-517"></a><span class="sd">    Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
+</span><span id="__span-0-518"><a id="__codelineno-0-518" name="__codelineno-0-518"></a><span class="sd">    and abundance functions \( a_A(h) \) and \( a_B(h) \), the intersection signature \( C \) has:</span>
+</span><span id="__span-0-519"><a id="__codelineno-0-519" name="__codelineno-0-519"></a>
+</span><span id="__span-0-520"><a id="__codelineno-0-520" name="__codelineno-0-520"></a><span class="sd">    - Hash set:</span>
+</span><span id="__span-0-521"><a id="__codelineno-0-521" name="__codelineno-0-521"></a><span class="sd">    $$</span>
+</span><span id="__span-0-522"><a id="__codelineno-0-522" name="__codelineno-0-522"></a><span class="sd">    H_C = H_A \cap H_B</span>
+</span><span id="__span-0-523"><a id="__codelineno-0-523" name="__codelineno-0-523"></a><span class="sd">    $$</span>
 </span><span id="__span-0-524"><a id="__codelineno-0-524" name="__codelineno-0-524"></a>
-</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the two signatures.</span>
-</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a>
-</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a><span class="sd">        - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
-</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a>
-</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersecting signatures.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-525"><a id="__codelineno-0-525" name="__codelineno-0-525"></a><span class="sd">    - Abundance function:</span>
+</span><span id="__span-0-526"><a id="__codelineno-0-526" name="__codelineno-0-526"></a><span class="sd">    $$</span>
+</span><span id="__span-0-527"><a id="__codelineno-0-527" name="__codelineno-0-527"></a><span class="sd">    a_C(h) = a_A(h), \quad \text{for } h \in H_C</span>
+</span><span id="__span-0-528"><a id="__codelineno-0-528" name="__codelineno-0-528"></a><span class="sd">    $$</span>
+</span><span id="__span-0-529"><a id="__codelineno-0-529" name="__codelineno-0-529"></a>
+</span><span id="__span-0-530"><a id="__codelineno-0-530" name="__codelineno-0-530"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-531"><a id="__codelineno-0-531" name="__codelineno-0-531"></a><span class="sd">        - `other (SnipeSig)`: Another `SnipeSig` instance to intersect with.</span>
+</span><span id="__span-0-532"><a id="__codelineno-0-532" name="__codelineno-0-532"></a>
+</span><span id="__span-0-533"><a id="__codelineno-0-533" name="__codelineno-0-533"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-534"><a id="__codelineno-0-534" name="__codelineno-0-534"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the two signatures.</span>
 </span><span id="__span-0-535"><a id="__codelineno-0-535" name="__codelineno-0-535"></a>
-</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a>    <span class="c1"># Use numpy&#39;s intersect1d function</span>
-</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a>    <span class="n">common_hashes</span><span class="p">,</span> <span class="n">self_indices</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">intersect1d</span><span class="p">(</span>
-</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">return_indices</span><span class="o">=</span><span class="kc">True</span>
-</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>    <span class="p">)</span>
-</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>
-</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>    <span class="k">if</span> <span class="n">common_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No common hashes found. Returning an empty signature.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
-</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
-</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_intersection_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>        <span class="p">)</span>
-</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>
-</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>    <span class="c1"># Get the abundances from self</span>
-</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>    <span class="n">common_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">self_indices</span><span class="p">]</span>
-</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>
-</span><span id="__span-0-556"><a id="__codelineno-0-556" name="__codelineno-0-556"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersection operation completed. Total common hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">common_hashes</span><span class="p">))</span>
-</span><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a>
-</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a>    <span class="c1"># Create a new SnipeSig instance</span>
-</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">common_hashes</span><span class="p">,</span>
-</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">common_abundances</span><span class="p">,</span>
-</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a>        <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a>        <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a>        <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_intersection_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>        <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-566"><a id="__codelineno-0-566" name="__codelineno-0-566"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-567"><a id="__codelineno-0-567" name="__codelineno-0-567"></a>    <span class="p">)</span>
+</span><span id="__span-0-536"><a id="__codelineno-0-536" name="__codelineno-0-536"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-537"><a id="__codelineno-0-537" name="__codelineno-0-537"></a><span class="sd">        - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
+</span><span id="__span-0-538"><a id="__codelineno-0-538" name="__codelineno-0-538"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-539"><a id="__codelineno-0-539" name="__codelineno-0-539"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-540"><a id="__codelineno-0-540" name="__codelineno-0-540"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-541"><a id="__codelineno-0-541" name="__codelineno-0-541"></a>
+</span><span id="__span-0-542"><a id="__codelineno-0-542" name="__codelineno-0-542"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersecting signatures.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-543"><a id="__codelineno-0-543" name="__codelineno-0-543"></a>
+</span><span id="__span-0-544"><a id="__codelineno-0-544" name="__codelineno-0-544"></a>    <span class="c1"># Use numpy&#39;s intersect1d function</span>
+</span><span id="__span-0-545"><a id="__codelineno-0-545" name="__codelineno-0-545"></a>    <span class="n">common_hashes</span><span class="p">,</span> <span class="n">self_indices</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">intersect1d</span><span class="p">(</span>
+</span><span id="__span-0-546"><a id="__codelineno-0-546" name="__codelineno-0-546"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">return_indices</span><span class="o">=</span><span class="kc">True</span>
+</span><span id="__span-0-547"><a id="__codelineno-0-547" name="__codelineno-0-547"></a>    <span class="p">)</span>
+</span><span id="__span-0-548"><a id="__codelineno-0-548" name="__codelineno-0-548"></a>
+</span><span id="__span-0-549"><a id="__codelineno-0-549" name="__codelineno-0-549"></a>    <span class="k">if</span> <span class="n">common_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-550"><a id="__codelineno-0-550" name="__codelineno-0-550"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No common hashes found. Returning an empty signature.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-551"><a id="__codelineno-0-551" name="__codelineno-0-551"></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-552"><a id="__codelineno-0-552" name="__codelineno-0-552"></a>            <span class="n">hashes</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">),</span>
+</span><span id="__span-0-553"><a id="__codelineno-0-553" name="__codelineno-0-553"></a>            <span class="n">abundances</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([],</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">),</span>
+</span><span id="__span-0-554"><a id="__codelineno-0-554" name="__codelineno-0-554"></a>            <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-555"><a id="__codelineno-0-555" name="__codelineno-0-555"></a>            <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-556"><a id="__codelineno-0-556" name="__codelineno-0-556"></a>            <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_intersection_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-557"><a id="__codelineno-0-557" name="__codelineno-0-557"></a>            <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-558"><a id="__codelineno-0-558" name="__codelineno-0-558"></a>            <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-559"><a id="__codelineno-0-559" name="__codelineno-0-559"></a>        <span class="p">)</span>
+</span><span id="__span-0-560"><a id="__codelineno-0-560" name="__codelineno-0-560"></a>
+</span><span id="__span-0-561"><a id="__codelineno-0-561" name="__codelineno-0-561"></a>    <span class="c1"># Get the abundances from self</span>
+</span><span id="__span-0-562"><a id="__codelineno-0-562" name="__codelineno-0-562"></a>    <span class="n">common_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">self_indices</span><span class="p">]</span>
+</span><span id="__span-0-563"><a id="__codelineno-0-563" name="__codelineno-0-563"></a>
+</span><span id="__span-0-564"><a id="__codelineno-0-564" name="__codelineno-0-564"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Intersection operation completed. Total common hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">common_hashes</span><span class="p">))</span>
+</span><span id="__span-0-565"><a id="__codelineno-0-565" name="__codelineno-0-565"></a>
+</span><span id="__span-0-566"><a id="__codelineno-0-566" name="__codelineno-0-566"></a>    <span class="c1"># Create a new SnipeSig instance</span>
+</span><span id="__span-0-567"><a id="__codelineno-0-567" name="__codelineno-0-567"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-568"><a id="__codelineno-0-568" name="__codelineno-0-568"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">common_hashes</span><span class="p">,</span>
+</span><span id="__span-0-569"><a id="__codelineno-0-569" name="__codelineno-0-569"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">common_abundances</span><span class="p">,</span>
+</span><span id="__span-0-570"><a id="__codelineno-0-570" name="__codelineno-0-570"></a>        <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-571"><a id="__codelineno-0-571" name="__codelineno-0-571"></a>        <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-572"><a id="__codelineno-0-572" name="__codelineno-0-572"></a>        <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_intersection_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-573"><a id="__codelineno-0-573" name="__codelineno-0-573"></a>        <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-574"><a id="__codelineno-0-574" name="__codelineno-0-574"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-575"><a id="__codelineno-0-575" name="__codelineno-0-575"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -7935,10 +7996,10 @@ <h3 id="snipe.api.SnipeSig.intersection_sigs" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.keep_max_abundance" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.keep_max_abundance" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">keep_max_abundance</span><span class="p">(</span><span class="n">max_abundance</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.keep_max_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.keep_max_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -7956,16 +8017,8 @@ <h3 id="snipe.api.SnipeSig.keep_max_abundance" class="doc doc-heading">
     - <code>ValueError</code>: If the signature does not track abundance or if <code>max_abundance</code> is invalid.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1270">1270</a></span>
-<span class="normal"><a href="#__codelineno-0-1271">1271</a></span>
-<span class="normal"><a href="#__codelineno-0-1272">1272</a></span>
-<span class="normal"><a href="#__codelineno-0-1273">1273</a></span>
-<span class="normal"><a href="#__codelineno-0-1274">1274</a></span>
-<span class="normal"><a href="#__codelineno-0-1275">1275</a></span>
-<span class="normal"><a href="#__codelineno-0-1276">1276</a></span>
-<span class="normal"><a href="#__codelineno-0-1277">1277</a></span>
-<span class="normal"><a href="#__codelineno-0-1278">1278</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1278">1278</a></span>
 <span class="normal"><a href="#__codelineno-0-1279">1279</a></span>
 <span class="normal"><a href="#__codelineno-0-1280">1280</a></span>
 <span class="normal"><a href="#__codelineno-0-1281">1281</a></span>
@@ -7980,30 +8033,38 @@ <h3 id="snipe.api.SnipeSig.keep_max_abundance" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1290">1290</a></span>
 <span class="normal"><a href="#__codelineno-0-1291">1291</a></span>
 <span class="normal"><a href="#__codelineno-0-1292">1292</a></span>
-<span class="normal"><a href="#__codelineno-0-1293">1293</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a><span class="k">def</span> <span class="nf">keep_max_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">max_abundance</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
-</span><span id="__span-0-1271"><a id="__codelineno-0-1271" name="__codelineno-0-1271"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a><span class="sd">    Keep only hashes with abundances less than or equal to a maximum threshold.</span>
-</span><span id="__span-0-1273"><a id="__codelineno-0-1273" name="__codelineno-0-1273"></a>
-</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a><span class="sd">    This method removes hashes whose abundances are greater than the specified `max_abundance`.</span>
-</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a>
-</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-1277"><a id="__codelineno-0-1277" name="__codelineno-0-1277"></a>
-</span><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a><span class="sd">    The updated hash set \( H&#39; \) is:</span>
-</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a><span class="sd">    H&#39; = \{ h \in H \mid a(h) \leq \text{max\_abundance} \}</span>
-</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a>
-</span><span id="__span-0-1283"><a id="__codelineno-0-1283" name="__codelineno-0-1283"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a><span class="sd">        - `max_abundance (int)`: The maximum abundance threshold.</span>
+<span class="normal"><a href="#__codelineno-0-1293">1293</a></span>
+<span class="normal"><a href="#__codelineno-0-1294">1294</a></span>
+<span class="normal"><a href="#__codelineno-0-1295">1295</a></span>
+<span class="normal"><a href="#__codelineno-0-1296">1296</a></span>
+<span class="normal"><a href="#__codelineno-0-1297">1297</a></span>
+<span class="normal"><a href="#__codelineno-0-1298">1298</a></span>
+<span class="normal"><a href="#__codelineno-0-1299">1299</a></span>
+<span class="normal"><a href="#__codelineno-0-1300">1300</a></span>
+<span class="normal"><a href="#__codelineno-0-1301">1301</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1278"><a id="__codelineno-0-1278" name="__codelineno-0-1278"></a><span class="k">def</span> <span class="nf">keep_max_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">max_abundance</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
+</span><span id="__span-0-1279"><a id="__codelineno-0-1279" name="__codelineno-0-1279"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1280"><a id="__codelineno-0-1280" name="__codelineno-0-1280"></a><span class="sd">    Keep only hashes with abundances less than or equal to a maximum threshold.</span>
+</span><span id="__span-0-1281"><a id="__codelineno-0-1281" name="__codelineno-0-1281"></a>
+</span><span id="__span-0-1282"><a id="__codelineno-0-1282" name="__codelineno-0-1282"></a><span class="sd">    This method removes hashes whose abundances are greater than the specified `max_abundance`.</span>
+</span><span id="__span-0-1283"><a id="__codelineno-0-1283" name="__codelineno-0-1283"></a>
+</span><span id="__span-0-1284"><a id="__codelineno-0-1284" name="__codelineno-0-1284"></a><span class="sd">    **Mathematical Explanation**:</span>
 </span><span id="__span-0-1285"><a id="__codelineno-0-1285" name="__codelineno-0-1285"></a>
-</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a><span class="sd">        - `ValueError`: If the signature does not track abundance or if `max_abundance` is invalid.</span>
-</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">max_abundance</span><span class="p">,</span> <span class="s2">&quot;keep maximum abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1286"><a id="__codelineno-0-1286" name="__codelineno-0-1286"></a><span class="sd">    The updated hash set \( H&#39; \) is:</span>
+</span><span id="__span-0-1287"><a id="__codelineno-0-1287" name="__codelineno-0-1287"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1288"><a id="__codelineno-0-1288" name="__codelineno-0-1288"></a><span class="sd">    H&#39; = \{ h \in H \mid a(h) \leq \text{max\_abundance} \}</span>
+</span><span id="__span-0-1289"><a id="__codelineno-0-1289" name="__codelineno-0-1289"></a><span class="sd">    $$</span>
 </span><span id="__span-0-1290"><a id="__codelineno-0-1290" name="__codelineno-0-1290"></a>
-</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&lt;=</span> <span class="n">max_abundance</span>
-</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
-</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Kept hashes with abundance &lt;= </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">max_abundance</span><span class="p">)</span>
+</span><span id="__span-0-1291"><a id="__codelineno-0-1291" name="__codelineno-0-1291"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-1292"><a id="__codelineno-0-1292" name="__codelineno-0-1292"></a><span class="sd">        - `max_abundance (int)`: The maximum abundance threshold.</span>
+</span><span id="__span-0-1293"><a id="__codelineno-0-1293" name="__codelineno-0-1293"></a>
+</span><span id="__span-0-1294"><a id="__codelineno-0-1294" name="__codelineno-0-1294"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a><span class="sd">        - `ValueError`: If the signature does not track abundance or if `max_abundance` is invalid.</span>
+</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">max_abundance</span><span class="p">,</span> <span class="s2">&quot;keep maximum abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1298"><a id="__codelineno-0-1298" name="__codelineno-0-1298"></a>
+</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&lt;=</span> <span class="n">max_abundance</span>
+</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
+</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Kept hashes with abundance &lt;= </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">max_abundance</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8013,10 +8074,10 @@ <h3 id="snipe.api.SnipeSig.keep_max_abundance" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.keep_min_abundance" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.keep_min_abundance" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">keep_min_abundance</span><span class="p">(</span><span class="n">min_abundance</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.keep_min_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.keep_min_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -8034,16 +8095,8 @@ <h3 id="snipe.api.SnipeSig.keep_min_abundance" class="doc doc-heading">
     - <code>ValueError</code>: If the signature does not track abundance or if <code>min_abundance</code> is invalid.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1245">1245</a></span>
-<span class="normal"><a href="#__codelineno-0-1246">1246</a></span>
-<span class="normal"><a href="#__codelineno-0-1247">1247</a></span>
-<span class="normal"><a href="#__codelineno-0-1248">1248</a></span>
-<span class="normal"><a href="#__codelineno-0-1249">1249</a></span>
-<span class="normal"><a href="#__codelineno-0-1250">1250</a></span>
-<span class="normal"><a href="#__codelineno-0-1251">1251</a></span>
-<span class="normal"><a href="#__codelineno-0-1252">1252</a></span>
-<span class="normal"><a href="#__codelineno-0-1253">1253</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1253">1253</a></span>
 <span class="normal"><a href="#__codelineno-0-1254">1254</a></span>
 <span class="normal"><a href="#__codelineno-0-1255">1255</a></span>
 <span class="normal"><a href="#__codelineno-0-1256">1256</a></span>
@@ -8058,30 +8111,38 @@ <h3 id="snipe.api.SnipeSig.keep_min_abundance" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1265">1265</a></span>
 <span class="normal"><a href="#__codelineno-0-1266">1266</a></span>
 <span class="normal"><a href="#__codelineno-0-1267">1267</a></span>
-<span class="normal"><a href="#__codelineno-0-1268">1268</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a><span class="k">def</span> <span class="nf">keep_min_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">min_abundance</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
-</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a><span class="sd">    Keep only hashes with abundances greater than or equal to a minimum threshold.</span>
-</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>
-</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a><span class="sd">    This method removes hashes whose abundances are less than the specified `min_abundance`.</span>
-</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a>
-</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-1252"><a id="__codelineno-0-1252" name="__codelineno-0-1252"></a>
-</span><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a><span class="sd">    The updated hash set \( H&#39; \) is:</span>
-</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a><span class="sd">    H&#39; = \{ h \in H \mid a(h) \geq \text{min\_abundance} \}</span>
-</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a>
-</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a><span class="sd">        - `min_abundance (int)`: The minimum abundance threshold.</span>
+<span class="normal"><a href="#__codelineno-0-1268">1268</a></span>
+<span class="normal"><a href="#__codelineno-0-1269">1269</a></span>
+<span class="normal"><a href="#__codelineno-0-1270">1270</a></span>
+<span class="normal"><a href="#__codelineno-0-1271">1271</a></span>
+<span class="normal"><a href="#__codelineno-0-1272">1272</a></span>
+<span class="normal"><a href="#__codelineno-0-1273">1273</a></span>
+<span class="normal"><a href="#__codelineno-0-1274">1274</a></span>
+<span class="normal"><a href="#__codelineno-0-1275">1275</a></span>
+<span class="normal"><a href="#__codelineno-0-1276">1276</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1253"><a id="__codelineno-0-1253" name="__codelineno-0-1253"></a><span class="k">def</span> <span class="nf">keep_min_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">min_abundance</span><span class="p">:</span> <span class="nb">int</span><span class="p">):</span>
+</span><span id="__span-0-1254"><a id="__codelineno-0-1254" name="__codelineno-0-1254"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1255"><a id="__codelineno-0-1255" name="__codelineno-0-1255"></a><span class="sd">    Keep only hashes with abundances greater than or equal to a minimum threshold.</span>
+</span><span id="__span-0-1256"><a id="__codelineno-0-1256" name="__codelineno-0-1256"></a>
+</span><span id="__span-0-1257"><a id="__codelineno-0-1257" name="__codelineno-0-1257"></a><span class="sd">    This method removes hashes whose abundances are less than the specified `min_abundance`.</span>
+</span><span id="__span-0-1258"><a id="__codelineno-0-1258" name="__codelineno-0-1258"></a>
+</span><span id="__span-0-1259"><a id="__codelineno-0-1259" name="__codelineno-0-1259"></a><span class="sd">    **Mathematical Explanation**:</span>
 </span><span id="__span-0-1260"><a id="__codelineno-0-1260" name="__codelineno-0-1260"></a>
-</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a><span class="sd">        - `ValueError`: If the signature does not track abundance or if `min_abundance` is invalid.</span>
-</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">min_abundance</span><span class="p">,</span> <span class="s2">&quot;keep minimum abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1261"><a id="__codelineno-0-1261" name="__codelineno-0-1261"></a><span class="sd">    The updated hash set \( H&#39; \) is:</span>
+</span><span id="__span-0-1262"><a id="__codelineno-0-1262" name="__codelineno-0-1262"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1263"><a id="__codelineno-0-1263" name="__codelineno-0-1263"></a><span class="sd">    H&#39; = \{ h \in H \mid a(h) \geq \text{min\_abundance} \}</span>
+</span><span id="__span-0-1264"><a id="__codelineno-0-1264" name="__codelineno-0-1264"></a><span class="sd">    $$</span>
 </span><span id="__span-0-1265"><a id="__codelineno-0-1265" name="__codelineno-0-1265"></a>
-</span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&gt;=</span> <span class="n">min_abundance</span>
-</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
-</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Kept hashes with abundance &gt;= </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">min_abundance</span><span class="p">)</span>
+</span><span id="__span-0-1266"><a id="__codelineno-0-1266" name="__codelineno-0-1266"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-1267"><a id="__codelineno-0-1267" name="__codelineno-0-1267"></a><span class="sd">        - `min_abundance (int)`: The minimum abundance threshold.</span>
+</span><span id="__span-0-1268"><a id="__codelineno-0-1268" name="__codelineno-0-1268"></a>
+</span><span id="__span-0-1269"><a id="__codelineno-0-1269" name="__codelineno-0-1269"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-1270"><a id="__codelineno-0-1270" name="__codelineno-0-1270"></a><span class="sd">        - `ValueError`: If the signature does not track abundance or if `min_abundance` is invalid.</span>
+</span><span id="__span-0-1271"><a id="__codelineno-0-1271" name="__codelineno-0-1271"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1272"><a id="__codelineno-0-1272" name="__codelineno-0-1272"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">min_abundance</span><span class="p">,</span> <span class="s2">&quot;keep minimum abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1273"><a id="__codelineno-0-1273" name="__codelineno-0-1273"></a>
+</span><span id="__span-0-1274"><a id="__codelineno-0-1274" name="__codelineno-0-1274"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&gt;=</span> <span class="n">min_abundance</span>
+</span><span id="__span-0-1275"><a id="__codelineno-0-1275" name="__codelineno-0-1275"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
+</span><span id="__span-0-1276"><a id="__codelineno-0-1276" name="__codelineno-0-1276"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Kept hashes with abundance &gt;= </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">min_abundance</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8091,10 +8152,10 @@ <h3 id="snipe.api.SnipeSig.keep_min_abundance" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.reset_abundance" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.reset_abundance" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">reset_abundance</span><span class="p">(</span><span class="n">new_abundance</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.reset_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.reset_abundance" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -8112,16 +8173,8 @@ <h3 id="snipe.api.SnipeSig.reset_abundance" class="doc doc-heading">
     - <code>ValueError</code>: If the signature does not track abundance or if <code>new_abundance</code> is invalid.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1220">1220</a></span>
-<span class="normal"><a href="#__codelineno-0-1221">1221</a></span>
-<span class="normal"><a href="#__codelineno-0-1222">1222</a></span>
-<span class="normal"><a href="#__codelineno-0-1223">1223</a></span>
-<span class="normal"><a href="#__codelineno-0-1224">1224</a></span>
-<span class="normal"><a href="#__codelineno-0-1225">1225</a></span>
-<span class="normal"><a href="#__codelineno-0-1226">1226</a></span>
-<span class="normal"><a href="#__codelineno-0-1227">1227</a></span>
-<span class="normal"><a href="#__codelineno-0-1228">1228</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1228">1228</a></span>
 <span class="normal"><a href="#__codelineno-0-1229">1229</a></span>
 <span class="normal"><a href="#__codelineno-0-1230">1230</a></span>
 <span class="normal"><a href="#__codelineno-0-1231">1231</a></span>
@@ -8136,30 +8189,38 @@ <h3 id="snipe.api.SnipeSig.reset_abundance" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1240">1240</a></span>
 <span class="normal"><a href="#__codelineno-0-1241">1241</a></span>
 <span class="normal"><a href="#__codelineno-0-1242">1242</a></span>
-<span class="normal"><a href="#__codelineno-0-1243">1243</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1220"><a id="__codelineno-0-1220" name="__codelineno-0-1220"></a><span class="k">def</span> <span class="nf">reset_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">new_abundance</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span><span class="p">):</span>
-</span><span id="__span-0-1221"><a id="__codelineno-0-1221" name="__codelineno-0-1221"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1222"><a id="__codelineno-0-1222" name="__codelineno-0-1222"></a><span class="sd">    Reset all abundances to a specified value.</span>
-</span><span id="__span-0-1223"><a id="__codelineno-0-1223" name="__codelineno-0-1223"></a>
-</span><span id="__span-0-1224"><a id="__codelineno-0-1224" name="__codelineno-0-1224"></a><span class="sd">    This method sets the abundance of every hash in the signature to the specified `new_abundance` value.</span>
-</span><span id="__span-0-1225"><a id="__codelineno-0-1225" name="__codelineno-0-1225"></a>
-</span><span id="__span-0-1226"><a id="__codelineno-0-1226" name="__codelineno-0-1226"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-1227"><a id="__codelineno-0-1227" name="__codelineno-0-1227"></a>
-</span><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a><span class="sd">    For each hash \( h \) in the signature, the abundance function is updated to:</span>
-</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a><span class="sd">    a(h) = \text{new\_abundance}</span>
-</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a>
-</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a><span class="sd">        - `new_abundance (int)`: The new abundance value to set for all hashes. Default is 1.</span>
+<span class="normal"><a href="#__codelineno-0-1243">1243</a></span>
+<span class="normal"><a href="#__codelineno-0-1244">1244</a></span>
+<span class="normal"><a href="#__codelineno-0-1245">1245</a></span>
+<span class="normal"><a href="#__codelineno-0-1246">1246</a></span>
+<span class="normal"><a href="#__codelineno-0-1247">1247</a></span>
+<span class="normal"><a href="#__codelineno-0-1248">1248</a></span>
+<span class="normal"><a href="#__codelineno-0-1249">1249</a></span>
+<span class="normal"><a href="#__codelineno-0-1250">1250</a></span>
+<span class="normal"><a href="#__codelineno-0-1251">1251</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1228"><a id="__codelineno-0-1228" name="__codelineno-0-1228"></a><span class="k">def</span> <span class="nf">reset_abundance</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">new_abundance</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">1</span><span class="p">):</span>
+</span><span id="__span-0-1229"><a id="__codelineno-0-1229" name="__codelineno-0-1229"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1230"><a id="__codelineno-0-1230" name="__codelineno-0-1230"></a><span class="sd">    Reset all abundances to a specified value.</span>
+</span><span id="__span-0-1231"><a id="__codelineno-0-1231" name="__codelineno-0-1231"></a>
+</span><span id="__span-0-1232"><a id="__codelineno-0-1232" name="__codelineno-0-1232"></a><span class="sd">    This method sets the abundance of every hash in the signature to the specified `new_abundance` value.</span>
+</span><span id="__span-0-1233"><a id="__codelineno-0-1233" name="__codelineno-0-1233"></a>
+</span><span id="__span-0-1234"><a id="__codelineno-0-1234" name="__codelineno-0-1234"></a><span class="sd">    **Mathematical Explanation**:</span>
 </span><span id="__span-0-1235"><a id="__codelineno-0-1235" name="__codelineno-0-1235"></a>
-</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a><span class="sd">        - `ValueError`: If the signature does not track abundance or if `new_abundance` is invalid.</span>
-</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a>
-</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">new_abundance</span><span class="p">,</span> <span class="s2">&quot;reset abundance&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a>
-</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[:]</span> <span class="o">=</span> <span class="n">new_abundance</span>
-</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Reset all abundances to </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">new_abundance</span><span class="p">)</span>
+</span><span id="__span-0-1236"><a id="__codelineno-0-1236" name="__codelineno-0-1236"></a><span class="sd">    For each hash \( h \) in the signature, the abundance function is updated to:</span>
+</span><span id="__span-0-1237"><a id="__codelineno-0-1237" name="__codelineno-0-1237"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1238"><a id="__codelineno-0-1238" name="__codelineno-0-1238"></a><span class="sd">    a(h) = \text{new\_abundance}</span>
+</span><span id="__span-0-1239"><a id="__codelineno-0-1239" name="__codelineno-0-1239"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1240"><a id="__codelineno-0-1240" name="__codelineno-0-1240"></a>
+</span><span id="__span-0-1241"><a id="__codelineno-0-1241" name="__codelineno-0-1241"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-1242"><a id="__codelineno-0-1242" name="__codelineno-0-1242"></a><span class="sd">        - `new_abundance (int)`: The new abundance value to set for all hashes. Default is 1.</span>
+</span><span id="__span-0-1243"><a id="__codelineno-0-1243" name="__codelineno-0-1243"></a>
+</span><span id="__span-0-1244"><a id="__codelineno-0-1244" name="__codelineno-0-1244"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-1245"><a id="__codelineno-0-1245" name="__codelineno-0-1245"></a><span class="sd">        - `ValueError`: If the signature does not track abundance or if `new_abundance` is invalid.</span>
+</span><span id="__span-0-1246"><a id="__codelineno-0-1246" name="__codelineno-0-1246"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1247"><a id="__codelineno-0-1247" name="__codelineno-0-1247"></a>
+</span><span id="__span-0-1248"><a id="__codelineno-0-1248" name="__codelineno-0-1248"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="n">new_abundance</span><span class="p">,</span> <span class="s2">&quot;reset abundance&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1249"><a id="__codelineno-0-1249" name="__codelineno-0-1249"></a>
+</span><span id="__span-0-1250"><a id="__codelineno-0-1250" name="__codelineno-0-1250"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[:]</span> <span class="o">=</span> <span class="n">new_abundance</span>
+</span><span id="__span-0-1251"><a id="__codelineno-0-1251" name="__codelineno-0-1251"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Reset all abundances to </span><span class="si">%d</span><span class="s2">.&quot;</span><span class="p">,</span> <span class="n">new_abundance</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8169,14 +8230,14 @@ <h3 id="snipe.api.SnipeSig.reset_abundance" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.sum_signatures" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.sum_signatures" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">sum_signatures</span><span class="p">(</span><span class="n">signatures</span><span class="p">,</span> <span class="n">name</span><span class="o">=</span><span class="s1">&#39;summed_signature&#39;</span><span class="p">,</span> <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="o">=</span><span class="kc">False</span><span class="p">)</span></code>
 
   <span class="doc doc-labels">
       <small class="doc doc-label doc-label-classmethod"><code>classmethod</code></small>
   </span>
 
-<a href="#snipe.api.SnipeSig.sum_signatures" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.sum_signatures" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -8217,16 +8278,8 @@ <h3 id="snipe.api.SnipeSig.sum_signatures" class="doc doc-heading">
     - <code>RuntimeError</code>: If an error occurs during the summation process.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-866">866</a></span>
-<span class="normal"><a href="#__codelineno-0-867">867</a></span>
-<span class="normal"><a href="#__codelineno-0-868">868</a></span>
-<span class="normal"><a href="#__codelineno-0-869">869</a></span>
-<span class="normal"><a href="#__codelineno-0-870">870</a></span>
-<span class="normal"><a href="#__codelineno-0-871">871</a></span>
-<span class="normal"><a href="#__codelineno-0-872">872</a></span>
-<span class="normal"><a href="#__codelineno-0-873">873</a></span>
-<span class="normal"><a href="#__codelineno-0-874">874</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-874">874</a></span>
 <span class="normal"><a href="#__codelineno-0-875">875</a></span>
 <span class="normal"><a href="#__codelineno-0-876">876</a></span>
 <span class="normal"><a href="#__codelineno-0-877">877</a></span>
@@ -8342,131 +8395,139 @@ <h3 id="snipe.api.SnipeSig.sum_signatures" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-987">987</a></span>
 <span class="normal"><a href="#__codelineno-0-988">988</a></span>
 <span class="normal"><a href="#__codelineno-0-989">989</a></span>
-<span class="normal"><a href="#__codelineno-0-990">990</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-866"><a id="__codelineno-0-866" name="__codelineno-0-866"></a><span class="nd">@classmethod</span>
-</span><span id="__span-0-867"><a id="__codelineno-0-867" name="__codelineno-0-867"></a><span class="k">def</span> <span class="nf">sum_signatures</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">signatures</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="s1">&#39;SnipeSig&#39;</span><span class="p">],</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;summed_signature&quot;</span><span class="p">,</span>
-</span><span id="__span-0-868"><a id="__codelineno-0-868" name="__codelineno-0-868"></a>                   <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-869"><a id="__codelineno-0-869" name="__codelineno-0-869"></a>
-</span><span id="__span-0-870"><a id="__codelineno-0-870" name="__codelineno-0-870"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-871"><a id="__codelineno-0-871" name="__codelineno-0-871"></a><span class="sd">    Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap.</span>
-</span><span id="__span-0-872"><a id="__codelineno-0-872" name="__codelineno-0-872"></a><span class="sd">    This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.</span>
-</span><span id="__span-0-873"><a id="__codelineno-0-873" name="__codelineno-0-873"></a>
-</span><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a><span class="sd">    $$</span>
-</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a><span class="sd">    \text{Sum}(A_1, A_2, \dots, A_n) = \bigcup_{i=1}^{n} A_i</span>
-</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a><span class="sd">    $$</span>
+<span class="normal"><a href="#__codelineno-0-990">990</a></span>
+<span class="normal"><a href="#__codelineno-0-991">991</a></span>
+<span class="normal"><a href="#__codelineno-0-992">992</a></span>
+<span class="normal"><a href="#__codelineno-0-993">993</a></span>
+<span class="normal"><a href="#__codelineno-0-994">994</a></span>
+<span class="normal"><a href="#__codelineno-0-995">995</a></span>
+<span class="normal"><a href="#__codelineno-0-996">996</a></span>
+<span class="normal"><a href="#__codelineno-0-997">997</a></span>
+<span class="normal"><a href="#__codelineno-0-998">998</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-874"><a id="__codelineno-0-874" name="__codelineno-0-874"></a><span class="nd">@classmethod</span>
+</span><span id="__span-0-875"><a id="__codelineno-0-875" name="__codelineno-0-875"></a><span class="k">def</span> <span class="nf">sum_signatures</span><span class="p">(</span><span class="bp">cls</span><span class="p">,</span> <span class="n">signatures</span><span class="p">:</span> <span class="n">List</span><span class="p">[</span><span class="s1">&#39;SnipeSig&#39;</span><span class="p">],</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="s2">&quot;summed_signature&quot;</span><span class="p">,</span>
+</span><span id="__span-0-876"><a id="__codelineno-0-876" name="__codelineno-0-876"></a>                   <span class="n">filename</span><span class="p">:</span> <span class="nb">str</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span> <span class="n">enable_logging</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
 </span><span id="__span-0-877"><a id="__codelineno-0-877" name="__codelineno-0-877"></a>
-</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a><span class="sd">    For each hash \( h \), its total abundance is:</span>
-</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a><span class="sd">    $$</span>
-</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a><span class="sd">    \text{abundance}(h) = \sum_{i=1}^{n} \text{abundance}_i(h)</span>
-</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a><span class="sd">    $$</span>
-</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a>
-</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a>
-</span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a><span class="sd">    - **Union of Signatures**:</span>
-</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a><span class="sd">        The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.</span>
-</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a>
-</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a><span class="sd">    - **Total Abundance Calculation**:</span>
-</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a><span class="sd">        For each unique hash \( h \), the total abundance is the sum of its abundances across all signatures where it appears.</span>
+</span><span id="__span-0-878"><a id="__codelineno-0-878" name="__codelineno-0-878"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-879"><a id="__codelineno-0-879" name="__codelineno-0-879"></a><span class="sd">    Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap.</span>
+</span><span id="__span-0-880"><a id="__codelineno-0-880" name="__codelineno-0-880"></a><span class="sd">    This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.</span>
+</span><span id="__span-0-881"><a id="__codelineno-0-881" name="__codelineno-0-881"></a>
+</span><span id="__span-0-882"><a id="__codelineno-0-882" name="__codelineno-0-882"></a><span class="sd">    $$</span>
+</span><span id="__span-0-883"><a id="__codelineno-0-883" name="__codelineno-0-883"></a><span class="sd">    \text{Sum}(A_1, A_2, \dots, A_n) = \bigcup_{i=1}^{n} A_i</span>
+</span><span id="__span-0-884"><a id="__codelineno-0-884" name="__codelineno-0-884"></a><span class="sd">    $$</span>
+</span><span id="__span-0-885"><a id="__codelineno-0-885" name="__codelineno-0-885"></a>
+</span><span id="__span-0-886"><a id="__codelineno-0-886" name="__codelineno-0-886"></a><span class="sd">    For each hash \( h \), its total abundance is:</span>
+</span><span id="__span-0-887"><a id="__codelineno-0-887" name="__codelineno-0-887"></a><span class="sd">    $$</span>
+</span><span id="__span-0-888"><a id="__codelineno-0-888" name="__codelineno-0-888"></a><span class="sd">    \text{abundance}(h) = \sum_{i=1}^{n} \text{abundance}_i(h)</span>
+</span><span id="__span-0-889"><a id="__codelineno-0-889" name="__codelineno-0-889"></a><span class="sd">    $$</span>
 </span><span id="__span-0-890"><a id="__codelineno-0-890" name="__codelineno-0-890"></a>
-</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a><span class="sd">    - **Algorithm Efficiency**:</span>
-</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a><span class="sd">        By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.</span>
-</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a>
-</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a><span class="sd">        - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to sum.</span>
-</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a><span class="sd">        - `name (str)`: Optional name for the resulting signature.</span>
-</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a><span class="sd">        - `filename (str)`: Optional filename for the resulting signature.</span>
-</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a><span class="sd">        - `enable_logging (bool)`: Flag to enable detailed logging.</span>
-</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a>
-</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the sum of the signatures.</span>
-</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a>
-</span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a><span class="sd">        - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.</span>
-</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a><span class="sd">        - `RuntimeError`: If an error occurs during the summation process.</span>
-</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signatures provided for summation.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a>
-</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>    <span class="c1"># Verify that all signatures have the same ksize, scale, and track_abundance</span>
-</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a>    <span class="n">first_sig</span> <span class="o">=</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
-</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a>    <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
-</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a>    <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
-</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a>    <span class="n">track_abundance</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">track_abundance</span>
-</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>
-</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>    <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">1</span><span class="p">:]:</span>
-</span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>        <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
-</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same ksize and scale.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>        <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">track_abundance</span> <span class="o">!=</span> <span class="n">track_abundance</span><span class="p">:</span>
-</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same track_abundance setting.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>
-</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>    <span class="c1"># Initialize iterators for each signature&#39;s hashes and abundances</span>
-</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>    <span class="n">iterators</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>    <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">:</span>
-</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>        <span class="n">it</span> <span class="o">=</span> <span class="nb">iter</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
-</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>            <span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">it</span><span class="p">)</span>
-</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>            <span class="n">iterators</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">))</span>
-</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>        <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>            <span class="k">continue</span>  <span class="c1"># Skip empty signatures</span>
-</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>
-</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">iterators</span><span class="p">:</span>
-</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All provided signatures are empty.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>
-</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>    <span class="c1"># Initialize the heap with the first element from each iterator</span>
-</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>    <span class="n">heap</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>    <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">iterators</span><span class="p">):</span>
-</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>        <span class="n">heap</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
-</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>    <span class="n">heapq</span><span class="o">.</span><span class="n">heapify</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>
-</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>    <span class="c1"># Prepare lists to collect the summed hashes and abundances</span>
-</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>    <span class="n">summed_hashes</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="p">[]</span>
-</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>
-</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>    <span class="k">while</span> <span class="n">heap</span><span class="p">:</span>
-</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>        <span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>        <span class="c1"># Initialize total abundance for the current_hash</span>
-</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>        <span class="n">total_abundance</span> <span class="o">=</span> <span class="n">current_abundance</span>
-</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>
-</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>        <span class="c1"># Check if the next element in the heap has the same hash</span>
-</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>        <span class="k">while</span> <span class="n">heap</span> <span class="ow">and</span> <span class="n">heap</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">current_hash</span><span class="p">:</span>
-</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>            <span class="n">_</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">same_idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
-</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>            <span class="n">total_abundance</span> <span class="o">+=</span> <span class="n">abundance</span>
-</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>            <span class="c1"># Push the next element from the same iterator</span>
-</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>            <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>                <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">same_idx</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="__span-0-957"><a id="__codelineno-0-957" name="__codelineno-0-957"></a>                <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">same_idx</span><span class="p">))</span>
-</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a>                <span class="k">pass</span>  <span class="c1"># No more elements in this iterator</span>
-</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>
-</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a>        <span class="c1"># Append the summed hash and abundance</span>
-</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>        <span class="n">summed_hashes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">current_hash</span><span class="p">)</span>
-</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>        <span class="n">summed_abundances</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">total_abundance</span><span class="p">)</span>
-</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>
-</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>        <span class="c1"># Push the next element from the current iterator</span>
-</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>        <span class="k">try</span><span class="p">:</span>
-</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>            <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">idx</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
-</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>            <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
-</span><span id="__span-0-969"><a id="__codelineno-0-969" name="__codelineno-0-969"></a>        <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
-</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a>            <span class="k">pass</span>  <span class="c1"># No more elements in this iterator</span>
-</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a>
-</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a>    <span class="c1"># Convert the results to NumPy arrays for efficient storage and processing</span>
-</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a>    <span class="n">summed_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">summed_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
-</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a>
-</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>    <span class="c1"># Handle potential overflow by capping at the maximum value of uint32</span>
-</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">iinfo</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">)</span>
-</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>
-</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>    <span class="c1"># Create a new SnipeSig instance from the summed hashes and abundances</span>
-</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>    <span class="n">summed_signature</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">summed_hashes</span><span class="p">,</span>
-</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">summed_abundances</span><span class="p">,</span>
-</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>        <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
-</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>        <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
-</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>        <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
-</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>        <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
-</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
-</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>    <span class="p">)</span>
-</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>
-</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>    <span class="k">return</span> <span class="n">summed_signature</span>
+</span><span id="__span-0-891"><a id="__codelineno-0-891" name="__codelineno-0-891"></a><span class="sd">    **Mathematical Explanation**:</span>
+</span><span id="__span-0-892"><a id="__codelineno-0-892" name="__codelineno-0-892"></a>
+</span><span id="__span-0-893"><a id="__codelineno-0-893" name="__codelineno-0-893"></a><span class="sd">    - **Union of Signatures**:</span>
+</span><span id="__span-0-894"><a id="__codelineno-0-894" name="__codelineno-0-894"></a><span class="sd">        The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.</span>
+</span><span id="__span-0-895"><a id="__codelineno-0-895" name="__codelineno-0-895"></a>
+</span><span id="__span-0-896"><a id="__codelineno-0-896" name="__codelineno-0-896"></a><span class="sd">    - **Total Abundance Calculation**:</span>
+</span><span id="__span-0-897"><a id="__codelineno-0-897" name="__codelineno-0-897"></a><span class="sd">        For each unique hash \( h \), the total abundance is the sum of its abundances across all signatures where it appears.</span>
+</span><span id="__span-0-898"><a id="__codelineno-0-898" name="__codelineno-0-898"></a>
+</span><span id="__span-0-899"><a id="__codelineno-0-899" name="__codelineno-0-899"></a><span class="sd">    - **Algorithm Efficiency**:</span>
+</span><span id="__span-0-900"><a id="__codelineno-0-900" name="__codelineno-0-900"></a><span class="sd">        By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.</span>
+</span><span id="__span-0-901"><a id="__codelineno-0-901" name="__codelineno-0-901"></a>
+</span><span id="__span-0-902"><a id="__codelineno-0-902" name="__codelineno-0-902"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-903"><a id="__codelineno-0-903" name="__codelineno-0-903"></a><span class="sd">        - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to sum.</span>
+</span><span id="__span-0-904"><a id="__codelineno-0-904" name="__codelineno-0-904"></a><span class="sd">        - `name (str)`: Optional name for the resulting signature.</span>
+</span><span id="__span-0-905"><a id="__codelineno-0-905" name="__codelineno-0-905"></a><span class="sd">        - `filename (str)`: Optional filename for the resulting signature.</span>
+</span><span id="__span-0-906"><a id="__codelineno-0-906" name="__codelineno-0-906"></a><span class="sd">        - `enable_logging (bool)`: Flag to enable detailed logging.</span>
+</span><span id="__span-0-907"><a id="__codelineno-0-907" name="__codelineno-0-907"></a>
+</span><span id="__span-0-908"><a id="__codelineno-0-908" name="__codelineno-0-908"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-909"><a id="__codelineno-0-909" name="__codelineno-0-909"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the sum of the signatures.</span>
+</span><span id="__span-0-910"><a id="__codelineno-0-910" name="__codelineno-0-910"></a>
+</span><span id="__span-0-911"><a id="__codelineno-0-911" name="__codelineno-0-911"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-912"><a id="__codelineno-0-912" name="__codelineno-0-912"></a><span class="sd">        - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.</span>
+</span><span id="__span-0-913"><a id="__codelineno-0-913" name="__codelineno-0-913"></a><span class="sd">        - `RuntimeError`: If an error occurs during the summation process.</span>
+</span><span id="__span-0-914"><a id="__codelineno-0-914" name="__codelineno-0-914"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-915"><a id="__codelineno-0-915" name="__codelineno-0-915"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-916"><a id="__codelineno-0-916" name="__codelineno-0-916"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;No signatures provided for summation.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-917"><a id="__codelineno-0-917" name="__codelineno-0-917"></a>
+</span><span id="__span-0-918"><a id="__codelineno-0-918" name="__codelineno-0-918"></a>    <span class="c1"># Verify that all signatures have the same ksize, scale, and track_abundance</span>
+</span><span id="__span-0-919"><a id="__codelineno-0-919" name="__codelineno-0-919"></a>    <span class="n">first_sig</span> <span class="o">=</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="__span-0-920"><a id="__codelineno-0-920" name="__codelineno-0-920"></a>    <span class="n">ksize</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">ksize</span>
+</span><span id="__span-0-921"><a id="__codelineno-0-921" name="__codelineno-0-921"></a>    <span class="n">scale</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">scale</span>
+</span><span id="__span-0-922"><a id="__codelineno-0-922" name="__codelineno-0-922"></a>    <span class="n">track_abundance</span> <span class="o">=</span> <span class="n">first_sig</span><span class="o">.</span><span class="n">track_abundance</span>
+</span><span id="__span-0-923"><a id="__codelineno-0-923" name="__codelineno-0-923"></a>
+</span><span id="__span-0-924"><a id="__codelineno-0-924" name="__codelineno-0-924"></a>    <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">[</span><span class="mi">1</span><span class="p">:]:</span>
+</span><span id="__span-0-925"><a id="__codelineno-0-925" name="__codelineno-0-925"></a>        <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">ksize</span> <span class="o">!=</span> <span class="n">ksize</span> <span class="ow">or</span> <span class="n">sig</span><span class="o">.</span><span class="n">scale</span> <span class="o">!=</span> <span class="n">scale</span><span class="p">:</span>
+</span><span id="__span-0-926"><a id="__codelineno-0-926" name="__codelineno-0-926"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same ksize and scale.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-927"><a id="__codelineno-0-927" name="__codelineno-0-927"></a>        <span class="k">if</span> <span class="n">sig</span><span class="o">.</span><span class="n">track_abundance</span> <span class="o">!=</span> <span class="n">track_abundance</span><span class="p">:</span>
+</span><span id="__span-0-928"><a id="__codelineno-0-928" name="__codelineno-0-928"></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All signatures must have the same track_abundance setting.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-929"><a id="__codelineno-0-929" name="__codelineno-0-929"></a>
+</span><span id="__span-0-930"><a id="__codelineno-0-930" name="__codelineno-0-930"></a>    <span class="c1"># Initialize iterators for each signature&#39;s hashes and abundances</span>
+</span><span id="__span-0-931"><a id="__codelineno-0-931" name="__codelineno-0-931"></a>    <span class="n">iterators</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-932"><a id="__codelineno-0-932" name="__codelineno-0-932"></a>    <span class="k">for</span> <span class="n">sig</span> <span class="ow">in</span> <span class="n">signatures</span><span class="p">:</span>
+</span><span id="__span-0-933"><a id="__codelineno-0-933" name="__codelineno-0-933"></a>        <span class="n">it</span> <span class="o">=</span> <span class="nb">iter</span><span class="p">(</span><span class="nb">zip</span><span class="p">(</span><span class="n">sig</span><span class="o">.</span><span class="n">hashes</span><span class="p">,</span> <span class="n">sig</span><span class="o">.</span><span class="n">abundances</span><span class="p">))</span>
+</span><span id="__span-0-934"><a id="__codelineno-0-934" name="__codelineno-0-934"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-935"><a id="__codelineno-0-935" name="__codelineno-0-935"></a>            <span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">it</span><span class="p">)</span>
+</span><span id="__span-0-936"><a id="__codelineno-0-936" name="__codelineno-0-936"></a>            <span class="n">iterators</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">first_hash</span><span class="p">,</span> <span class="n">first_abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">))</span>
+</span><span id="__span-0-937"><a id="__codelineno-0-937" name="__codelineno-0-937"></a>        <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-938"><a id="__codelineno-0-938" name="__codelineno-0-938"></a>            <span class="k">continue</span>  <span class="c1"># Skip empty signatures</span>
+</span><span id="__span-0-939"><a id="__codelineno-0-939" name="__codelineno-0-939"></a>
+</span><span id="__span-0-940"><a id="__codelineno-0-940" name="__codelineno-0-940"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">iterators</span><span class="p">:</span>
+</span><span id="__span-0-941"><a id="__codelineno-0-941" name="__codelineno-0-941"></a>        <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;All provided signatures are empty.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-942"><a id="__codelineno-0-942" name="__codelineno-0-942"></a>
+</span><span id="__span-0-943"><a id="__codelineno-0-943" name="__codelineno-0-943"></a>    <span class="c1"># Initialize the heap with the first element from each iterator</span>
+</span><span id="__span-0-944"><a id="__codelineno-0-944" name="__codelineno-0-944"></a>    <span class="n">heap</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-945"><a id="__codelineno-0-945" name="__codelineno-0-945"></a>    <span class="k">for</span> <span class="n">idx</span><span class="p">,</span> <span class="p">(</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">it</span><span class="p">)</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">iterators</span><span class="p">):</span>
+</span><span id="__span-0-946"><a id="__codelineno-0-946" name="__codelineno-0-946"></a>        <span class="n">heap</span><span class="o">.</span><span class="n">append</span><span class="p">((</span><span class="n">hash_val</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
+</span><span id="__span-0-947"><a id="__codelineno-0-947" name="__codelineno-0-947"></a>    <span class="n">heapq</span><span class="o">.</span><span class="n">heapify</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-948"><a id="__codelineno-0-948" name="__codelineno-0-948"></a>
+</span><span id="__span-0-949"><a id="__codelineno-0-949" name="__codelineno-0-949"></a>    <span class="c1"># Prepare lists to collect the summed hashes and abundances</span>
+</span><span id="__span-0-950"><a id="__codelineno-0-950" name="__codelineno-0-950"></a>    <span class="n">summed_hashes</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-951"><a id="__codelineno-0-951" name="__codelineno-0-951"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="__span-0-952"><a id="__codelineno-0-952" name="__codelineno-0-952"></a>
+</span><span id="__span-0-953"><a id="__codelineno-0-953" name="__codelineno-0-953"></a>    <span class="k">while</span> <span class="n">heap</span><span class="p">:</span>
+</span><span id="__span-0-954"><a id="__codelineno-0-954" name="__codelineno-0-954"></a>        <span class="n">current_hash</span><span class="p">,</span> <span class="n">current_abundance</span><span class="p">,</span> <span class="n">idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-955"><a id="__codelineno-0-955" name="__codelineno-0-955"></a>        <span class="c1"># Initialize total abundance for the current_hash</span>
+</span><span id="__span-0-956"><a id="__codelineno-0-956" name="__codelineno-0-956"></a>        <span class="n">total_abundance</span> <span class="o">=</span> <span class="n">current_abundance</span>
+</span><span id="__span-0-957"><a id="__codelineno-0-957" name="__codelineno-0-957"></a>
+</span><span id="__span-0-958"><a id="__codelineno-0-958" name="__codelineno-0-958"></a>        <span class="c1"># Check if the next element in the heap has the same hash</span>
+</span><span id="__span-0-959"><a id="__codelineno-0-959" name="__codelineno-0-959"></a>        <span class="k">while</span> <span class="n">heap</span> <span class="ow">and</span> <span class="n">heap</span><span class="p">[</span><span class="mi">0</span><span class="p">][</span><span class="mi">0</span><span class="p">]</span> <span class="o">==</span> <span class="n">current_hash</span><span class="p">:</span>
+</span><span id="__span-0-960"><a id="__codelineno-0-960" name="__codelineno-0-960"></a>            <span class="n">_</span><span class="p">,</span> <span class="n">abundance</span><span class="p">,</span> <span class="n">same_idx</span> <span class="o">=</span> <span class="n">heapq</span><span class="o">.</span><span class="n">heappop</span><span class="p">(</span><span class="n">heap</span><span class="p">)</span>
+</span><span id="__span-0-961"><a id="__codelineno-0-961" name="__codelineno-0-961"></a>            <span class="n">total_abundance</span> <span class="o">+=</span> <span class="n">abundance</span>
+</span><span id="__span-0-962"><a id="__codelineno-0-962" name="__codelineno-0-962"></a>            <span class="c1"># Push the next element from the same iterator</span>
+</span><span id="__span-0-963"><a id="__codelineno-0-963" name="__codelineno-0-963"></a>            <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-964"><a id="__codelineno-0-964" name="__codelineno-0-964"></a>                <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">same_idx</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="__span-0-965"><a id="__codelineno-0-965" name="__codelineno-0-965"></a>                <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">same_idx</span><span class="p">))</span>
+</span><span id="__span-0-966"><a id="__codelineno-0-966" name="__codelineno-0-966"></a>            <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-967"><a id="__codelineno-0-967" name="__codelineno-0-967"></a>                <span class="k">pass</span>  <span class="c1"># No more elements in this iterator</span>
+</span><span id="__span-0-968"><a id="__codelineno-0-968" name="__codelineno-0-968"></a>
+</span><span id="__span-0-969"><a id="__codelineno-0-969" name="__codelineno-0-969"></a>        <span class="c1"># Append the summed hash and abundance</span>
+</span><span id="__span-0-970"><a id="__codelineno-0-970" name="__codelineno-0-970"></a>        <span class="n">summed_hashes</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">current_hash</span><span class="p">)</span>
+</span><span id="__span-0-971"><a id="__codelineno-0-971" name="__codelineno-0-971"></a>        <span class="n">summed_abundances</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">total_abundance</span><span class="p">)</span>
+</span><span id="__span-0-972"><a id="__codelineno-0-972" name="__codelineno-0-972"></a>
+</span><span id="__span-0-973"><a id="__codelineno-0-973" name="__codelineno-0-973"></a>        <span class="c1"># Push the next element from the current iterator</span>
+</span><span id="__span-0-974"><a id="__codelineno-0-974" name="__codelineno-0-974"></a>        <span class="k">try</span><span class="p">:</span>
+</span><span id="__span-0-975"><a id="__codelineno-0-975" name="__codelineno-0-975"></a>            <span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="n">iterators</span><span class="p">[</span><span class="n">idx</span><span class="p">][</span><span class="mi">2</span><span class="p">])</span>
+</span><span id="__span-0-976"><a id="__codelineno-0-976" name="__codelineno-0-976"></a>            <span class="n">heapq</span><span class="o">.</span><span class="n">heappush</span><span class="p">(</span><span class="n">heap</span><span class="p">,</span> <span class="p">(</span><span class="n">next_hash</span><span class="p">,</span> <span class="n">next_abundance</span><span class="p">,</span> <span class="n">idx</span><span class="p">))</span>
+</span><span id="__span-0-977"><a id="__codelineno-0-977" name="__codelineno-0-977"></a>        <span class="k">except</span> <span class="ne">StopIteration</span><span class="p">:</span>
+</span><span id="__span-0-978"><a id="__codelineno-0-978" name="__codelineno-0-978"></a>            <span class="k">pass</span>  <span class="c1"># No more elements in this iterator</span>
+</span><span id="__span-0-979"><a id="__codelineno-0-979" name="__codelineno-0-979"></a>
+</span><span id="__span-0-980"><a id="__codelineno-0-980" name="__codelineno-0-980"></a>    <span class="c1"># Convert the results to NumPy arrays for efficient storage and processing</span>
+</span><span id="__span-0-981"><a id="__codelineno-0-981" name="__codelineno-0-981"></a>    <span class="n">summed_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">summed_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint64</span><span class="p">)</span>
+</span><span id="__span-0-982"><a id="__codelineno-0-982" name="__codelineno-0-982"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-983"><a id="__codelineno-0-983" name="__codelineno-0-983"></a>
+</span><span id="__span-0-984"><a id="__codelineno-0-984" name="__codelineno-0-984"></a>    <span class="c1"># Handle potential overflow by capping at the maximum value of uint32</span>
+</span><span id="__span-0-985"><a id="__codelineno-0-985" name="__codelineno-0-985"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">iinfo</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">)</span>
+</span><span id="__span-0-986"><a id="__codelineno-0-986" name="__codelineno-0-986"></a>
+</span><span id="__span-0-987"><a id="__codelineno-0-987" name="__codelineno-0-987"></a>    <span class="c1"># Create a new SnipeSig instance from the summed hashes and abundances</span>
+</span><span id="__span-0-988"><a id="__codelineno-0-988" name="__codelineno-0-988"></a>    <span class="n">summed_signature</span> <span class="o">=</span> <span class="bp">cls</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-989"><a id="__codelineno-0-989" name="__codelineno-0-989"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">summed_hashes</span><span class="p">,</span>
+</span><span id="__span-0-990"><a id="__codelineno-0-990" name="__codelineno-0-990"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">summed_abundances</span><span class="p">,</span>
+</span><span id="__span-0-991"><a id="__codelineno-0-991" name="__codelineno-0-991"></a>        <span class="n">ksize</span><span class="o">=</span><span class="n">ksize</span><span class="p">,</span>
+</span><span id="__span-0-992"><a id="__codelineno-0-992" name="__codelineno-0-992"></a>        <span class="n">scale</span><span class="o">=</span><span class="n">scale</span><span class="p">,</span>
+</span><span id="__span-0-993"><a id="__codelineno-0-993" name="__codelineno-0-993"></a>        <span class="n">name</span><span class="o">=</span><span class="n">name</span><span class="p">,</span>
+</span><span id="__span-0-994"><a id="__codelineno-0-994" name="__codelineno-0-994"></a>        <span class="n">filename</span><span class="o">=</span><span class="n">filename</span><span class="p">,</span>
+</span><span id="__span-0-995"><a id="__codelineno-0-995" name="__codelineno-0-995"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="n">enable_logging</span>
+</span><span id="__span-0-996"><a id="__codelineno-0-996" name="__codelineno-0-996"></a>    <span class="p">)</span>
+</span><span id="__span-0-997"><a id="__codelineno-0-997" name="__codelineno-0-997"></a>
+</span><span id="__span-0-998"><a id="__codelineno-0-998" name="__codelineno-0-998"></a>    <span class="k">return</span> <span class="n">summed_signature</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8476,10 +8537,10 @@ <h3 id="snipe.api.SnipeSig.sum_signatures" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.symmetric_difference_sigs" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.symmetric_difference_sigs" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">symmetric_difference_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.symmetric_difference_sigs" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.symmetric_difference_sigs" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -8516,16 +8577,8 @@ <h3 id="snipe.api.SnipeSig.symmetric_difference_sigs" class="doc doc-heading">
     - <code>RuntimeError</code>: If zero hashes remain after symmetric difference.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-630">630</a></span>
-<span class="normal"><a href="#__codelineno-0-631">631</a></span>
-<span class="normal"><a href="#__codelineno-0-632">632</a></span>
-<span class="normal"><a href="#__codelineno-0-633">633</a></span>
-<span class="normal"><a href="#__codelineno-0-634">634</a></span>
-<span class="normal"><a href="#__codelineno-0-635">635</a></span>
-<span class="normal"><a href="#__codelineno-0-636">636</a></span>
-<span class="normal"><a href="#__codelineno-0-637">637</a></span>
-<span class="normal"><a href="#__codelineno-0-638">638</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-638">638</a></span>
 <span class="normal"><a href="#__codelineno-0-639">639</a></span>
 <span class="normal"><a href="#__codelineno-0-640">640</a></span>
 <span class="normal"><a href="#__codelineno-0-641">641</a></span>
@@ -8598,88 +8651,96 @@ <h3 id="snipe.api.SnipeSig.symmetric_difference_sigs" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-708">708</a></span>
 <span class="normal"><a href="#__codelineno-0-709">709</a></span>
 <span class="normal"><a href="#__codelineno-0-710">710</a></span>
-<span class="normal"><a href="#__codelineno-0-711">711</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-630"><a id="__codelineno-0-630" name="__codelineno-0-630"></a><span class="k">def</span> <span class="nf">symmetric_difference_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-631"><a id="__codelineno-0-631" name="__codelineno-0-631"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-632"><a id="__codelineno-0-632" name="__codelineno-0-632"></a><span class="sd">    Compute the symmetric difference of the current signature with another signature.</span>
-</span><span id="__span-0-633"><a id="__codelineno-0-633" name="__codelineno-0-633"></a>
-</span><span id="__span-0-634"><a id="__codelineno-0-634" name="__codelineno-0-634"></a><span class="sd">    This method retains hashes that are unique to each signature, with their respective abundances.</span>
-</span><span id="__span-0-635"><a id="__codelineno-0-635" name="__codelineno-0-635"></a>
-</span><span id="__span-0-636"><a id="__codelineno-0-636" name="__codelineno-0-636"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-637"><a id="__codelineno-0-637" name="__codelineno-0-637"></a>
-</span><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a><span class="sd">    Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
-</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a><span class="sd">    and abundance functions \( a_A(h) \) and \( a_B(h) \), the symmetric difference signature \( C \) has:</span>
-</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a>
-</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a><span class="sd">    - Hash set:</span>
-</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a><span class="sd">    $$</span>
-</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a><span class="sd">    H_C = (H_A \setminus H_B) \cup (H_B \setminus H_A)</span>
-</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a><span class="sd">    $$</span>
+<span class="normal"><a href="#__codelineno-0-711">711</a></span>
+<span class="normal"><a href="#__codelineno-0-712">712</a></span>
+<span class="normal"><a href="#__codelineno-0-713">713</a></span>
+<span class="normal"><a href="#__codelineno-0-714">714</a></span>
+<span class="normal"><a href="#__codelineno-0-715">715</a></span>
+<span class="normal"><a href="#__codelineno-0-716">716</a></span>
+<span class="normal"><a href="#__codelineno-0-717">717</a></span>
+<span class="normal"><a href="#__codelineno-0-718">718</a></span>
+<span class="normal"><a href="#__codelineno-0-719">719</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-638"><a id="__codelineno-0-638" name="__codelineno-0-638"></a><span class="k">def</span> <span class="nf">symmetric_difference_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-639"><a id="__codelineno-0-639" name="__codelineno-0-639"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-640"><a id="__codelineno-0-640" name="__codelineno-0-640"></a><span class="sd">    Compute the symmetric difference of the current signature with another signature.</span>
+</span><span id="__span-0-641"><a id="__codelineno-0-641" name="__codelineno-0-641"></a>
+</span><span id="__span-0-642"><a id="__codelineno-0-642" name="__codelineno-0-642"></a><span class="sd">    This method retains hashes that are unique to each signature, with their respective abundances.</span>
+</span><span id="__span-0-643"><a id="__codelineno-0-643" name="__codelineno-0-643"></a>
+</span><span id="__span-0-644"><a id="__codelineno-0-644" name="__codelineno-0-644"></a><span class="sd">    **Mathematical Explanation**:</span>
 </span><span id="__span-0-645"><a id="__codelineno-0-645" name="__codelineno-0-645"></a>
-</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a><span class="sd">    - Abundance function:</span>
-</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a><span class="sd">    $$</span>
-</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a><span class="sd">    a_C(h) =</span>
-</span><span id="__span-0-649"><a id="__codelineno-0-649" name="__codelineno-0-649"></a><span class="sd">    \begin{cases}</span>
-</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a><span class="sd">    a_A(h), &amp; \text{for } h \in H_A \setminus H_B \\</span>
-</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a><span class="sd">    a_B(h), &amp; \text{for } h \in H_B \setminus H_A \\</span>
-</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a><span class="sd">    \end{cases}</span>
-</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a><span class="sd">    $$</span>
-</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a>
-</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="sd">    **Parameters**:</span>
-</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a><span class="sd">        - `other (SnipeSig)`: Another `SnipeSig` instance to compute the symmetric difference with.</span>
-</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a>
-</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a><span class="sd">    **Returns**:</span>
-</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the symmetric difference of the two signatures.</span>
-</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a>
-</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a><span class="sd">        - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
-</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a><span class="sd">        - `RuntimeError`: If zero hashes remain after symmetric difference.</span>
-</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a>
-</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Computing symmetric difference of signatures.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a>
-</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a>    <span class="c1"># Hashes unique to self and other</span>
-</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a>    <span class="n">unique_self_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a>    <span class="n">unique_other_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>
-</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>    <span class="c1"># Abundances for unique hashes</span>
-</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>    <span class="n">mask_self</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">unique_self_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>    <span class="n">unique_self_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask_self</span><span class="p">]</span>
+</span><span id="__span-0-646"><a id="__codelineno-0-646" name="__codelineno-0-646"></a><span class="sd">    Let \( A \) and \( B \) be two signatures with sets of hashes \( H_A \) and \( H_B \),</span>
+</span><span id="__span-0-647"><a id="__codelineno-0-647" name="__codelineno-0-647"></a><span class="sd">    and abundance functions \( a_A(h) \) and \( a_B(h) \), the symmetric difference signature \( C \) has:</span>
+</span><span id="__span-0-648"><a id="__codelineno-0-648" name="__codelineno-0-648"></a>
+</span><span id="__span-0-649"><a id="__codelineno-0-649" name="__codelineno-0-649"></a><span class="sd">    - Hash set:</span>
+</span><span id="__span-0-650"><a id="__codelineno-0-650" name="__codelineno-0-650"></a><span class="sd">    $$</span>
+</span><span id="__span-0-651"><a id="__codelineno-0-651" name="__codelineno-0-651"></a><span class="sd">    H_C = (H_A \setminus H_B) \cup (H_B \setminus H_A)</span>
+</span><span id="__span-0-652"><a id="__codelineno-0-652" name="__codelineno-0-652"></a><span class="sd">    $$</span>
+</span><span id="__span-0-653"><a id="__codelineno-0-653" name="__codelineno-0-653"></a>
+</span><span id="__span-0-654"><a id="__codelineno-0-654" name="__codelineno-0-654"></a><span class="sd">    - Abundance function:</span>
+</span><span id="__span-0-655"><a id="__codelineno-0-655" name="__codelineno-0-655"></a><span class="sd">    $$</span>
+</span><span id="__span-0-656"><a id="__codelineno-0-656" name="__codelineno-0-656"></a><span class="sd">    a_C(h) =</span>
+</span><span id="__span-0-657"><a id="__codelineno-0-657" name="__codelineno-0-657"></a><span class="sd">    \begin{cases}</span>
+</span><span id="__span-0-658"><a id="__codelineno-0-658" name="__codelineno-0-658"></a><span class="sd">    a_A(h), &amp; \text{for } h \in H_A \setminus H_B \\</span>
+</span><span id="__span-0-659"><a id="__codelineno-0-659" name="__codelineno-0-659"></a><span class="sd">    a_B(h), &amp; \text{for } h \in H_B \setminus H_A \\</span>
+</span><span id="__span-0-660"><a id="__codelineno-0-660" name="__codelineno-0-660"></a><span class="sd">    \end{cases}</span>
+</span><span id="__span-0-661"><a id="__codelineno-0-661" name="__codelineno-0-661"></a><span class="sd">    $$</span>
+</span><span id="__span-0-662"><a id="__codelineno-0-662" name="__codelineno-0-662"></a>
+</span><span id="__span-0-663"><a id="__codelineno-0-663" name="__codelineno-0-663"></a><span class="sd">    **Parameters**:</span>
+</span><span id="__span-0-664"><a id="__codelineno-0-664" name="__codelineno-0-664"></a><span class="sd">        - `other (SnipeSig)`: Another `SnipeSig` instance to compute the symmetric difference with.</span>
+</span><span id="__span-0-665"><a id="__codelineno-0-665" name="__codelineno-0-665"></a>
+</span><span id="__span-0-666"><a id="__codelineno-0-666" name="__codelineno-0-666"></a><span class="sd">    **Returns**:</span>
+</span><span id="__span-0-667"><a id="__codelineno-0-667" name="__codelineno-0-667"></a><span class="sd">        - `SnipeSig`: A new `SnipeSig` instance representing the symmetric difference of the two signatures.</span>
+</span><span id="__span-0-668"><a id="__codelineno-0-668" name="__codelineno-0-668"></a>
+</span><span id="__span-0-669"><a id="__codelineno-0-669" name="__codelineno-0-669"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-670"><a id="__codelineno-0-670" name="__codelineno-0-670"></a><span class="sd">        - `ValueError`: If `ksize` or `scale` do not match between signatures.</span>
+</span><span id="__span-0-671"><a id="__codelineno-0-671" name="__codelineno-0-671"></a><span class="sd">        - `RuntimeError`: If zero hashes remain after symmetric difference.</span>
+</span><span id="__span-0-672"><a id="__codelineno-0-672" name="__codelineno-0-672"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-673"><a id="__codelineno-0-673" name="__codelineno-0-673"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-674"><a id="__codelineno-0-674" name="__codelineno-0-674"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-675"><a id="__codelineno-0-675" name="__codelineno-0-675"></a>
+</span><span id="__span-0-676"><a id="__codelineno-0-676" name="__codelineno-0-676"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Computing symmetric difference of signatures.&quot;</span><span class="p">)</span>
 </span><span id="__span-0-677"><a id="__codelineno-0-677" name="__codelineno-0-677"></a>
-</span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>    <span class="n">mask_other</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">unique_other_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a>    <span class="n">unique_other_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask_other</span><span class="p">]</span>
-</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a>
-</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>    <span class="c1"># Handle the case where &#39;other&#39; does not track abundance</span>
-</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span><span class="p">:</span>
-</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Other signature does not track abundance. Setting abundances to 1.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>        <span class="n">unique_other_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">unique_other_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-678"><a id="__codelineno-0-678" name="__codelineno-0-678"></a>    <span class="c1"># Hashes unique to self and other</span>
+</span><span id="__span-0-679"><a id="__codelineno-0-679" name="__codelineno-0-679"></a>    <span class="n">unique_self_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-680"><a id="__codelineno-0-680" name="__codelineno-0-680"></a>    <span class="n">unique_other_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">setdiff1d</span><span class="p">(</span><span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-681"><a id="__codelineno-0-681" name="__codelineno-0-681"></a>
+</span><span id="__span-0-682"><a id="__codelineno-0-682" name="__codelineno-0-682"></a>    <span class="c1"># Abundances for unique hashes</span>
+</span><span id="__span-0-683"><a id="__codelineno-0-683" name="__codelineno-0-683"></a>    <span class="n">mask_self</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">unique_self_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-684"><a id="__codelineno-0-684" name="__codelineno-0-684"></a>    <span class="n">unique_self_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask_self</span><span class="p">]</span>
 </span><span id="__span-0-685"><a id="__codelineno-0-685" name="__codelineno-0-685"></a>
-</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>    <span class="c1"># Combine hashes and abundances</span>
-</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a>    <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">unique_self_hashes</span><span class="p">,</span> <span class="n">unique_other_hashes</span><span class="p">))</span>
-</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a>    <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">unique_self_abundances</span><span class="p">,</span> <span class="n">unique_other_abundances</span><span class="p">))</span>
-</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a>
-</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>    <span class="k">if</span> <span class="n">combined_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a>        <span class="n">_e_msg</span> <span class="o">=</span> <span class="s2">&quot;Symmetric difference operation resulted in zero hashes, which is not allowed.&quot;</span>
-</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
-</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a>
-</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>    <span class="c1"># Sort combined hashes and abundances</span>
-</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a>    <span class="n">sorted_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">)</span>
-</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a>    <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">combined_hashes</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
-</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a>    <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">combined_abundances</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
-</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a>
-</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Symmetric difference operation completed. Total unique hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">))</span>
-</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a>
-</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a>    <span class="c1"># Create a new SnipeSig instance</span>
-</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">combined_hashes</span><span class="p">,</span>
-</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">combined_abundances</span><span class="p">,</span>
-</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a>        <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a>        <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a>        <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_symmetric_difference_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>        <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>    <span class="p">)</span>
+</span><span id="__span-0-686"><a id="__codelineno-0-686" name="__codelineno-0-686"></a>    <span class="n">mask_other</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">isin</span><span class="p">(</span><span class="n">other</span><span class="o">.</span><span class="n">_hashes</span><span class="p">,</span> <span class="n">unique_other_hashes</span><span class="p">,</span> <span class="n">assume_unique</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-687"><a id="__codelineno-0-687" name="__codelineno-0-687"></a>    <span class="n">unique_other_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_abundances</span><span class="p">[</span><span class="n">mask_other</span><span class="p">]</span>
+</span><span id="__span-0-688"><a id="__codelineno-0-688" name="__codelineno-0-688"></a>
+</span><span id="__span-0-689"><a id="__codelineno-0-689" name="__codelineno-0-689"></a>    <span class="c1"># Handle the case where &#39;other&#39; does not track abundance</span>
+</span><span id="__span-0-690"><a id="__codelineno-0-690" name="__codelineno-0-690"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span><span class="p">:</span>
+</span><span id="__span-0-691"><a id="__codelineno-0-691" name="__codelineno-0-691"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Other signature does not track abundance. Setting abundances to 1.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-692"><a id="__codelineno-0-692" name="__codelineno-0-692"></a>        <span class="n">unique_other_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">unique_other_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-693"><a id="__codelineno-0-693" name="__codelineno-0-693"></a>
+</span><span id="__span-0-694"><a id="__codelineno-0-694" name="__codelineno-0-694"></a>    <span class="c1"># Combine hashes and abundances</span>
+</span><span id="__span-0-695"><a id="__codelineno-0-695" name="__codelineno-0-695"></a>    <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">unique_self_hashes</span><span class="p">,</span> <span class="n">unique_other_hashes</span><span class="p">))</span>
+</span><span id="__span-0-696"><a id="__codelineno-0-696" name="__codelineno-0-696"></a>    <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">unique_self_abundances</span><span class="p">,</span> <span class="n">unique_other_abundances</span><span class="p">))</span>
+</span><span id="__span-0-697"><a id="__codelineno-0-697" name="__codelineno-0-697"></a>
+</span><span id="__span-0-698"><a id="__codelineno-0-698" name="__codelineno-0-698"></a>    <span class="k">if</span> <span class="n">combined_hashes</span><span class="o">.</span><span class="n">size</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-699"><a id="__codelineno-0-699" name="__codelineno-0-699"></a>        <span class="n">_e_msg</span> <span class="o">=</span> <span class="s2">&quot;Symmetric difference operation resulted in zero hashes, which is not allowed.&quot;</span>
+</span><span id="__span-0-700"><a id="__codelineno-0-700" name="__codelineno-0-700"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">error</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-701"><a id="__codelineno-0-701" name="__codelineno-0-701"></a>        <span class="k">raise</span> <span class="ne">RuntimeError</span><span class="p">(</span><span class="n">_e_msg</span><span class="p">)</span>
+</span><span id="__span-0-702"><a id="__codelineno-0-702" name="__codelineno-0-702"></a>
+</span><span id="__span-0-703"><a id="__codelineno-0-703" name="__codelineno-0-703"></a>    <span class="c1"># Sort combined hashes and abundances</span>
+</span><span id="__span-0-704"><a id="__codelineno-0-704" name="__codelineno-0-704"></a>    <span class="n">sorted_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">argsort</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">)</span>
+</span><span id="__span-0-705"><a id="__codelineno-0-705" name="__codelineno-0-705"></a>    <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">combined_hashes</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
+</span><span id="__span-0-706"><a id="__codelineno-0-706" name="__codelineno-0-706"></a>    <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">combined_abundances</span><span class="p">[</span><span class="n">sorted_indices</span><span class="p">]</span>
+</span><span id="__span-0-707"><a id="__codelineno-0-707" name="__codelineno-0-707"></a>
+</span><span id="__span-0-708"><a id="__codelineno-0-708" name="__codelineno-0-708"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Symmetric difference operation completed. Total unique hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">))</span>
+</span><span id="__span-0-709"><a id="__codelineno-0-709" name="__codelineno-0-709"></a>
+</span><span id="__span-0-710"><a id="__codelineno-0-710" name="__codelineno-0-710"></a>    <span class="c1"># Create a new SnipeSig instance</span>
+</span><span id="__span-0-711"><a id="__codelineno-0-711" name="__codelineno-0-711"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-712"><a id="__codelineno-0-712" name="__codelineno-0-712"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">combined_hashes</span><span class="p">,</span>
+</span><span id="__span-0-713"><a id="__codelineno-0-713" name="__codelineno-0-713"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">combined_abundances</span><span class="p">,</span>
+</span><span id="__span-0-714"><a id="__codelineno-0-714" name="__codelineno-0-714"></a>        <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-715"><a id="__codelineno-0-715" name="__codelineno-0-715"></a>        <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-716"><a id="__codelineno-0-716" name="__codelineno-0-716"></a>        <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_symmetric_difference_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-717"><a id="__codelineno-0-717" name="__codelineno-0-717"></a>        <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-718"><a id="__codelineno-0-718" name="__codelineno-0-718"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-719"><a id="__codelineno-0-719" name="__codelineno-0-719"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8689,10 +8750,10 @@ <h3 id="snipe.api.SnipeSig.symmetric_difference_sigs" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.trim_below_median" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.trim_below_median" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">trim_below_median</span><span class="p">()</span></code>
 
-<a href="#snipe.api.SnipeSig.trim_below_median" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.trim_below_median" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -8709,16 +8770,8 @@ <h3 id="snipe.api.SnipeSig.trim_below_median" class="doc doc-heading">
     - <code>ValueError</code>: If the signature does not track abundance.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1295">1295</a></span>
-<span class="normal"><a href="#__codelineno-0-1296">1296</a></span>
-<span class="normal"><a href="#__codelineno-0-1297">1297</a></span>
-<span class="normal"><a href="#__codelineno-0-1298">1298</a></span>
-<span class="normal"><a href="#__codelineno-0-1299">1299</a></span>
-<span class="normal"><a href="#__codelineno-0-1300">1300</a></span>
-<span class="normal"><a href="#__codelineno-0-1301">1301</a></span>
-<span class="normal"><a href="#__codelineno-0-1302">1302</a></span>
-<span class="normal"><a href="#__codelineno-0-1303">1303</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1303">1303</a></span>
 <span class="normal"><a href="#__codelineno-0-1304">1304</a></span>
 <span class="normal"><a href="#__codelineno-0-1305">1305</a></span>
 <span class="normal"><a href="#__codelineno-0-1306">1306</a></span>
@@ -8738,35 +8791,43 @@ <h3 id="snipe.api.SnipeSig.trim_below_median" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1320">1320</a></span>
 <span class="normal"><a href="#__codelineno-0-1321">1321</a></span>
 <span class="normal"><a href="#__codelineno-0-1322">1322</a></span>
-<span class="normal"><a href="#__codelineno-0-1323">1323</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1295"><a id="__codelineno-0-1295" name="__codelineno-0-1295"></a><span class="k">def</span> <span class="nf">trim_below_median</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-1296"><a id="__codelineno-0-1296" name="__codelineno-0-1296"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1297"><a id="__codelineno-0-1297" name="__codelineno-0-1297"></a><span class="sd">    Trim hashes with abundances below the median abundance.</span>
-</span><span id="__span-0-1298"><a id="__codelineno-0-1298" name="__codelineno-0-1298"></a>
-</span><span id="__span-0-1299"><a id="__codelineno-0-1299" name="__codelineno-0-1299"></a><span class="sd">    This method removes all hashes whose abundances are less than the median abundance of the signature.</span>
-</span><span id="__span-0-1300"><a id="__codelineno-0-1300" name="__codelineno-0-1300"></a>
-</span><span id="__span-0-1301"><a id="__codelineno-0-1301" name="__codelineno-0-1301"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-1302"><a id="__codelineno-0-1302" name="__codelineno-0-1302"></a>
-</span><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a><span class="sd">    Let \\( m \\) be the median of \\( \\{ a(h) \mid h \in H \\} \\).</span>
-</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a><span class="sd">    The updated hash set \\( H&#39; \\) is:</span>
-</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a>
-</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a><span class="sd">    H&#39; = \\{ h \in H \mid a(h) \geq m \\}</span>
-</span><span id="__span-0-1308"><a id="__codelineno-0-1308" name="__codelineno-0-1308"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a>
-</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a><span class="sd">        - `ValueError`: If the signature does not track abundance.</span>
-</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a><span class="sd">    &quot;&quot;&quot;</span>
+<span class="normal"><a href="#__codelineno-0-1323">1323</a></span>
+<span class="normal"><a href="#__codelineno-0-1324">1324</a></span>
+<span class="normal"><a href="#__codelineno-0-1325">1325</a></span>
+<span class="normal"><a href="#__codelineno-0-1326">1326</a></span>
+<span class="normal"><a href="#__codelineno-0-1327">1327</a></span>
+<span class="normal"><a href="#__codelineno-0-1328">1328</a></span>
+<span class="normal"><a href="#__codelineno-0-1329">1329</a></span>
+<span class="normal"><a href="#__codelineno-0-1330">1330</a></span>
+<span class="normal"><a href="#__codelineno-0-1331">1331</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1303"><a id="__codelineno-0-1303" name="__codelineno-0-1303"></a><span class="k">def</span> <span class="nf">trim_below_median</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-1304"><a id="__codelineno-0-1304" name="__codelineno-0-1304"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1305"><a id="__codelineno-0-1305" name="__codelineno-0-1305"></a><span class="sd">    Trim hashes with abundances below the median abundance.</span>
+</span><span id="__span-0-1306"><a id="__codelineno-0-1306" name="__codelineno-0-1306"></a>
+</span><span id="__span-0-1307"><a id="__codelineno-0-1307" name="__codelineno-0-1307"></a><span class="sd">    This method removes all hashes whose abundances are less than the median abundance of the signature.</span>
+</span><span id="__span-0-1308"><a id="__codelineno-0-1308" name="__codelineno-0-1308"></a>
+</span><span id="__span-0-1309"><a id="__codelineno-0-1309" name="__codelineno-0-1309"></a><span class="sd">    **Mathematical Explanation**:</span>
+</span><span id="__span-0-1310"><a id="__codelineno-0-1310" name="__codelineno-0-1310"></a>
+</span><span id="__span-0-1311"><a id="__codelineno-0-1311" name="__codelineno-0-1311"></a><span class="sd">    Let \\( m \\) be the median of \\( \\{ a(h) \mid h \in H \\} \\).</span>
+</span><span id="__span-0-1312"><a id="__codelineno-0-1312" name="__codelineno-0-1312"></a><span class="sd">    The updated hash set \\( H&#39; \\) is:</span>
 </span><span id="__span-0-1313"><a id="__codelineno-0-1313" name="__codelineno-0-1313"></a>
-</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;trim below median&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a>
-</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
-</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No hashes to trim based on median abundance.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a>        <span class="k">return</span>
-</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a>
-</span><span id="__span-0-1320"><a id="__codelineno-0-1320" name="__codelineno-0-1320"></a>    <span class="n">median</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span>
-</span><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&gt;=</span> <span class="n">median</span>
-</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
-</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trimmed hashes with abundance below median (</span><span class="si">%f</span><span class="s2">).&quot;</span><span class="p">,</span> <span class="n">median</span><span class="p">)</span>
+</span><span id="__span-0-1314"><a id="__codelineno-0-1314" name="__codelineno-0-1314"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1315"><a id="__codelineno-0-1315" name="__codelineno-0-1315"></a><span class="sd">    H&#39; = \\{ h \in H \mid a(h) \geq m \\}</span>
+</span><span id="__span-0-1316"><a id="__codelineno-0-1316" name="__codelineno-0-1316"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1317"><a id="__codelineno-0-1317" name="__codelineno-0-1317"></a>
+</span><span id="__span-0-1318"><a id="__codelineno-0-1318" name="__codelineno-0-1318"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-1319"><a id="__codelineno-0-1319" name="__codelineno-0-1319"></a><span class="sd">        - `ValueError`: If the signature does not track abundance.</span>
+</span><span id="__span-0-1320"><a id="__codelineno-0-1320" name="__codelineno-0-1320"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1321"><a id="__codelineno-0-1321" name="__codelineno-0-1321"></a>
+</span><span id="__span-0-1322"><a id="__codelineno-0-1322" name="__codelineno-0-1322"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;trim below median&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1323"><a id="__codelineno-0-1323" name="__codelineno-0-1323"></a>
+</span><span id="__span-0-1324"><a id="__codelineno-0-1324" name="__codelineno-0-1324"></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="__span-0-1325"><a id="__codelineno-0-1325" name="__codelineno-0-1325"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;No hashes to trim based on median abundance.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1326"><a id="__codelineno-0-1326" name="__codelineno-0-1326"></a>        <span class="k">return</span>
+</span><span id="__span-0-1327"><a id="__codelineno-0-1327" name="__codelineno-0-1327"></a>
+</span><span id="__span-0-1328"><a id="__codelineno-0-1328" name="__codelineno-0-1328"></a>    <span class="n">median</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">median</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span><span class="p">)</span>
+</span><span id="__span-0-1329"><a id="__codelineno-0-1329" name="__codelineno-0-1329"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">&gt;=</span> <span class="n">median</span>
+</span><span id="__span-0-1330"><a id="__codelineno-0-1330" name="__codelineno-0-1330"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
+</span><span id="__span-0-1331"><a id="__codelineno-0-1331" name="__codelineno-0-1331"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trimmed hashes with abundance below median (</span><span class="si">%f</span><span class="s2">).&quot;</span><span class="p">,</span> <span class="n">median</span><span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8776,10 +8837,10 @@ <h3 id="snipe.api.SnipeSig.trim_below_median" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.trim_singletons" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.trim_singletons" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">trim_singletons</span><span class="p">()</span></code>
 
-<a href="#snipe.api.SnipeSig.trim_singletons" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.trim_singletons" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -8795,16 +8856,8 @@ <h3 id="snipe.api.SnipeSig.trim_singletons" class="doc doc-heading">
     - <code>ValueError</code>: If the signature does not track abundance.</p>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1341">1341</a></span>
-<span class="normal"><a href="#__codelineno-0-1342">1342</a></span>
-<span class="normal"><a href="#__codelineno-0-1343">1343</a></span>
-<span class="normal"><a href="#__codelineno-0-1344">1344</a></span>
-<span class="normal"><a href="#__codelineno-0-1345">1345</a></span>
-<span class="normal"><a href="#__codelineno-0-1346">1346</a></span>
-<span class="normal"><a href="#__codelineno-0-1347">1347</a></span>
-<span class="normal"><a href="#__codelineno-0-1348">1348</a></span>
-<span class="normal"><a href="#__codelineno-0-1349">1349</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-1349">1349</a></span>
 <span class="normal"><a href="#__codelineno-0-1350">1350</a></span>
 <span class="normal"><a href="#__codelineno-0-1351">1351</a></span>
 <span class="normal"><a href="#__codelineno-0-1352">1352</a></span>
@@ -8816,27 +8869,37 @@ <h3 id="snipe.api.SnipeSig.trim_singletons" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-1358">1358</a></span>
 <span class="normal"><a href="#__codelineno-0-1359">1359</a></span>
 <span class="normal"><a href="#__codelineno-0-1360">1360</a></span>
-<span class="normal"><a href="#__codelineno-0-1361">1361</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1341"><a id="__codelineno-0-1341" name="__codelineno-0-1341"></a><span class="k">def</span> <span class="nf">trim_singletons</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
-</span><span id="__span-0-1342"><a id="__codelineno-0-1342" name="__codelineno-0-1342"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-1343"><a id="__codelineno-0-1343" name="__codelineno-0-1343"></a><span class="sd">    Remove hashes with abundance equal to 1.</span>
-</span><span id="__span-0-1344"><a id="__codelineno-0-1344" name="__codelineno-0-1344"></a>
-</span><span id="__span-0-1345"><a id="__codelineno-0-1345" name="__codelineno-0-1345"></a><span class="sd">    This method removes all hashes that are singletons (abundance equals 1).</span>
-</span><span id="__span-0-1346"><a id="__codelineno-0-1346" name="__codelineno-0-1346"></a>
-</span><span id="__span-0-1347"><a id="__codelineno-0-1347" name="__codelineno-0-1347"></a><span class="sd">    **Mathematical Explanation**:</span>
-</span><span id="__span-0-1348"><a id="__codelineno-0-1348" name="__codelineno-0-1348"></a>
-</span><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a><span class="sd">    The updated hash set \( H&#39; \) is:</span>
-</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a><span class="sd">    H&#39; = \{ h \in H \mid a(h) \neq 1 \}</span>
-</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a><span class="sd">    $$</span>
-</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a>
-</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a><span class="sd">    **Raises**:</span>
-</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a><span class="sd">        - `ValueError`: If the signature does not track abundance.</span>
-</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;trim singletons&quot;</span><span class="p">)</span>
-</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a>
-</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">!=</span> <span class="mi">1</span>
-</span><span id="__span-0-1360"><a id="__codelineno-0-1360" name="__codelineno-0-1360"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
-</span><span id="__span-0-1361"><a id="__codelineno-0-1361" name="__codelineno-0-1361"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trimmed hashes with abundance equal to 1.&quot;</span><span class="p">)</span>
+<span class="normal"><a href="#__codelineno-0-1361">1361</a></span>
+<span class="normal"><a href="#__codelineno-0-1362">1362</a></span>
+<span class="normal"><a href="#__codelineno-0-1363">1363</a></span>
+<span class="normal"><a href="#__codelineno-0-1364">1364</a></span>
+<span class="normal"><a href="#__codelineno-0-1365">1365</a></span>
+<span class="normal"><a href="#__codelineno-0-1366">1366</a></span>
+<span class="normal"><a href="#__codelineno-0-1367">1367</a></span>
+<span class="normal"><a href="#__codelineno-0-1368">1368</a></span>
+<span class="normal"><a href="#__codelineno-0-1369">1369</a></span>
+<span class="normal"><a href="#__codelineno-0-1370">1370</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-1349"><a id="__codelineno-0-1349" name="__codelineno-0-1349"></a><span class="k">def</span> <span class="nf">trim_singletons</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="__span-0-1350"><a id="__codelineno-0-1350" name="__codelineno-0-1350"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-1351"><a id="__codelineno-0-1351" name="__codelineno-0-1351"></a><span class="sd">    Remove hashes with abundance equal to 1.</span>
+</span><span id="__span-0-1352"><a id="__codelineno-0-1352" name="__codelineno-0-1352"></a>
+</span><span id="__span-0-1353"><a id="__codelineno-0-1353" name="__codelineno-0-1353"></a><span class="sd">    This method removes all hashes that are singletons (abundance equals 1).</span>
+</span><span id="__span-0-1354"><a id="__codelineno-0-1354" name="__codelineno-0-1354"></a>
+</span><span id="__span-0-1355"><a id="__codelineno-0-1355" name="__codelineno-0-1355"></a><span class="sd">    **Mathematical Explanation**:</span>
+</span><span id="__span-0-1356"><a id="__codelineno-0-1356" name="__codelineno-0-1356"></a>
+</span><span id="__span-0-1357"><a id="__codelineno-0-1357" name="__codelineno-0-1357"></a><span class="sd">    The updated hash set \( H&#39; \) is:</span>
+</span><span id="__span-0-1358"><a id="__codelineno-0-1358" name="__codelineno-0-1358"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1359"><a id="__codelineno-0-1359" name="__codelineno-0-1359"></a><span class="sd">    H&#39; = \{ h \in H \mid a(h) \neq 1 \}</span>
+</span><span id="__span-0-1360"><a id="__codelineno-0-1360" name="__codelineno-0-1360"></a><span class="sd">    $$</span>
+</span><span id="__span-0-1361"><a id="__codelineno-0-1361" name="__codelineno-0-1361"></a>
+</span><span id="__span-0-1362"><a id="__codelineno-0-1362" name="__codelineno-0-1362"></a><span class="sd">    **Raises**:</span>
+</span><span id="__span-0-1363"><a id="__codelineno-0-1363" name="__codelineno-0-1363"></a><span class="sd">        - `ValueError`: If the signature does not track abundance.</span>
+</span><span id="__span-0-1364"><a id="__codelineno-0-1364" name="__codelineno-0-1364"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-1365"><a id="__codelineno-0-1365" name="__codelineno-0-1365"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_validate_abundance_operation</span><span class="p">(</span><span class="kc">None</span><span class="p">,</span> <span class="s2">&quot;trim singletons&quot;</span><span class="p">)</span>
+</span><span id="__span-0-1366"><a id="__codelineno-0-1366" name="__codelineno-0-1366"></a>
+</span><span id="__span-0-1367"><a id="__codelineno-0-1367" name="__codelineno-0-1367"></a>    <span class="n">mask</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span> <span class="o">!=</span> <span class="mi">1</span>
+</span><span id="__span-0-1368"><a id="__codelineno-0-1368" name="__codelineno-0-1368"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Trimming </span><span class="si">%d</span><span class="s2"> hashes with abundance equal to 1.&quot;</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="o">~</span><span class="n">mask</span><span class="p">))</span>
+</span><span id="__span-0-1369"><a id="__codelineno-0-1369" name="__codelineno-0-1369"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">_apply_mask</span><span class="p">(</span><span class="n">mask</span><span class="p">)</span>
+</span><span id="__span-0-1370"><a id="__codelineno-0-1370" name="__codelineno-0-1370"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Size after trimming singletons: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span><span class="p">))</span> 
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -8846,10 +8909,10 @@ <h3 id="snipe.api.SnipeSig.trim_singletons" class="doc doc-heading">
 <div class="doc doc-object doc-function">
 
 
-<h3 id="snipe.api.SnipeSig.union_sigs" class="doc doc-heading">
+<h3 id="snipe.api.snipe_sig.SnipeSig.union_sigs" class="doc doc-heading">
             <code class="highlight language-python"><span class="n">union_sigs</span><span class="p">(</span><span class="n">other</span><span class="p">)</span></code>
 
-<a href="#snipe.api.SnipeSig.union_sigs" class="headerlink" title="Permanent link">&para;</a></h3>
+<a href="#snipe.api.snipe_sig.SnipeSig.union_sigs" class="headerlink" title="Permanent link">&para;</a></h3>
 
 
     <div class="doc doc-contents ">
@@ -8877,16 +8940,8 @@ <h3 id="snipe.api.SnipeSig.union_sigs" class="doc doc-heading">
 \]</div>
 
             <details class="quote">
-              <summary>Source code in <code>src/snipe/api/__init__.py</code></summary>
-              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-398">398</a></span>
-<span class="normal"><a href="#__codelineno-0-399">399</a></span>
-<span class="normal"><a href="#__codelineno-0-400">400</a></span>
-<span class="normal"><a href="#__codelineno-0-401">401</a></span>
-<span class="normal"><a href="#__codelineno-0-402">402</a></span>
-<span class="normal"><a href="#__codelineno-0-403">403</a></span>
-<span class="normal"><a href="#__codelineno-0-404">404</a></span>
-<span class="normal"><a href="#__codelineno-0-405">405</a></span>
-<span class="normal"><a href="#__codelineno-0-406">406</a></span>
+              <summary>Source code in <code>src/snipe/api/snipe_sig.py</code></summary>
+              <div class="language-python highlight"><table class="highlighttable"><tr><td class="linenos"><div class="linenodiv"><pre><span></span><span class="normal"><a href="#__codelineno-0-406">406</a></span>
 <span class="normal"><a href="#__codelineno-0-407">407</a></span>
 <span class="normal"><a href="#__codelineno-0-408">408</a></span>
 <span class="normal"><a href="#__codelineno-0-409">409</a></span>
@@ -8944,73 +8999,81 @@ <h3 id="snipe.api.SnipeSig.union_sigs" class="doc doc-heading">
 <span class="normal"><a href="#__codelineno-0-461">461</a></span>
 <span class="normal"><a href="#__codelineno-0-462">462</a></span>
 <span class="normal"><a href="#__codelineno-0-463">463</a></span>
-<span class="normal"><a href="#__codelineno-0-464">464</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-398"><a id="__codelineno-0-398" name="__codelineno-0-398"></a><span class="k">def</span> <span class="nf">union_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
-</span><span id="__span-0-399"><a id="__codelineno-0-399" name="__codelineno-0-399"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
-</span><span id="__span-0-400"><a id="__codelineno-0-400" name="__codelineno-0-400"></a><span class="sd">    Combine this signature with another by summing abundances where hashes overlap.</span>
-</span><span id="__span-0-401"><a id="__codelineno-0-401" name="__codelineno-0-401"></a>
-</span><span id="__span-0-402"><a id="__codelineno-0-402" name="__codelineno-0-402"></a><span class="sd">    Given two signatures \( A \) and \( B \) with hash sets \( H_A \) and \( H_B \),</span>
-</span><span id="__span-0-403"><a id="__codelineno-0-403" name="__codelineno-0-403"></a><span class="sd">    and their corresponding abundance functions \( a_A \) and \( a_B \), the union</span>
-</span><span id="__span-0-404"><a id="__codelineno-0-404" name="__codelineno-0-404"></a><span class="sd">    signature \( C \) is defined as follows:</span>
-</span><span id="__span-0-405"><a id="__codelineno-0-405" name="__codelineno-0-405"></a>
-</span><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a><span class="sd">    - **Hash Set**: </span>
-</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a>
-</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a><span class="sd">    $$</span>
-</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a><span class="sd">    H_C = H_A \cup H_B</span>
-</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a><span class="sd">    $$</span>
-</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a>
-</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a><span class="sd">    - **Abundance Function**:</span>
+<span class="normal"><a href="#__codelineno-0-464">464</a></span>
+<span class="normal"><a href="#__codelineno-0-465">465</a></span>
+<span class="normal"><a href="#__codelineno-0-466">466</a></span>
+<span class="normal"><a href="#__codelineno-0-467">467</a></span>
+<span class="normal"><a href="#__codelineno-0-468">468</a></span>
+<span class="normal"><a href="#__codelineno-0-469">469</a></span>
+<span class="normal"><a href="#__codelineno-0-470">470</a></span>
+<span class="normal"><a href="#__codelineno-0-471">471</a></span>
+<span class="normal"><a href="#__codelineno-0-472">472</a></span></pre></div></td><td class="code"><div><pre><span></span><code><span id="__span-0-406"><a id="__codelineno-0-406" name="__codelineno-0-406"></a><span class="k">def</span> <span class="nf">union_sigs</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">other</span><span class="p">:</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="s1">&#39;SnipeSig&#39;</span><span class="p">:</span>
+</span><span id="__span-0-407"><a id="__codelineno-0-407" name="__codelineno-0-407"></a><span class="w">    </span><span class="sa">r</span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="__span-0-408"><a id="__codelineno-0-408" name="__codelineno-0-408"></a><span class="sd">    Combine this signature with another by summing abundances where hashes overlap.</span>
+</span><span id="__span-0-409"><a id="__codelineno-0-409" name="__codelineno-0-409"></a>
+</span><span id="__span-0-410"><a id="__codelineno-0-410" name="__codelineno-0-410"></a><span class="sd">    Given two signatures \( A \) and \( B \) with hash sets \( H_A \) and \( H_B \),</span>
+</span><span id="__span-0-411"><a id="__codelineno-0-411" name="__codelineno-0-411"></a><span class="sd">    and their corresponding abundance functions \( a_A \) and \( a_B \), the union</span>
+</span><span id="__span-0-412"><a id="__codelineno-0-412" name="__codelineno-0-412"></a><span class="sd">    signature \( C \) is defined as follows:</span>
 </span><span id="__span-0-413"><a id="__codelineno-0-413" name="__codelineno-0-413"></a>
-</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a><span class="sd">    $$</span>
-</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a><span class="sd">    a_C(h) =</span>
-</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a><span class="sd">    \begin{cases} </span>
-</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a><span class="sd">        a_A(h) + a_B(h), &amp; \text{if } h \in H_A \cap H_B \\</span>
-</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a><span class="sd">        a_A(h), &amp; \text{if } h \in H_A \setminus H_B \\</span>
-</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a><span class="sd">        a_B(h), &amp; \text{if } h \in H_B \setminus H_A</span>
-</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a><span class="sd">    \end{cases}</span>
-</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a><span class="sd">    $$</span>
-</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a><span class="sd">    &quot;&quot;&quot;</span>
-</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
-</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a>
-</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Unioning signatures (including all unique hashes).&quot;</span><span class="p">)</span>
-</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a>
-</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a>    <span class="c1"># Access internal arrays directly</span>
-</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a>    <span class="n">self_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span>
-</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a>    <span class="n">self_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span>
-</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>    <span class="n">other_hashes</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span>
-</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>    <span class="n">other_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_abundances</span>
+</span><span id="__span-0-414"><a id="__codelineno-0-414" name="__codelineno-0-414"></a><span class="sd">    - **Hash Set**: </span>
+</span><span id="__span-0-415"><a id="__codelineno-0-415" name="__codelineno-0-415"></a>
+</span><span id="__span-0-416"><a id="__codelineno-0-416" name="__codelineno-0-416"></a><span class="sd">    $$</span>
+</span><span id="__span-0-417"><a id="__codelineno-0-417" name="__codelineno-0-417"></a><span class="sd">    H_C = H_A \cup H_B</span>
+</span><span id="__span-0-418"><a id="__codelineno-0-418" name="__codelineno-0-418"></a><span class="sd">    $$</span>
+</span><span id="__span-0-419"><a id="__codelineno-0-419" name="__codelineno-0-419"></a>
+</span><span id="__span-0-420"><a id="__codelineno-0-420" name="__codelineno-0-420"></a><span class="sd">    - **Abundance Function**:</span>
+</span><span id="__span-0-421"><a id="__codelineno-0-421" name="__codelineno-0-421"></a>
+</span><span id="__span-0-422"><a id="__codelineno-0-422" name="__codelineno-0-422"></a><span class="sd">    $$</span>
+</span><span id="__span-0-423"><a id="__codelineno-0-423" name="__codelineno-0-423"></a><span class="sd">    a_C(h) =</span>
+</span><span id="__span-0-424"><a id="__codelineno-0-424" name="__codelineno-0-424"></a><span class="sd">    \begin{cases} </span>
+</span><span id="__span-0-425"><a id="__codelineno-0-425" name="__codelineno-0-425"></a><span class="sd">        a_A(h) + a_B(h), &amp; \text{if } h \in H_A \cap H_B \\</span>
+</span><span id="__span-0-426"><a id="__codelineno-0-426" name="__codelineno-0-426"></a><span class="sd">        a_A(h), &amp; \text{if } h \in H_A \setminus H_B \\</span>
+</span><span id="__span-0-427"><a id="__codelineno-0-427" name="__codelineno-0-427"></a><span class="sd">        a_B(h), &amp; \text{if } h \in H_B \setminus H_A</span>
+</span><span id="__span-0-428"><a id="__codelineno-0-428" name="__codelineno-0-428"></a><span class="sd">    \end{cases}</span>
+</span><span id="__span-0-429"><a id="__codelineno-0-429" name="__codelineno-0-429"></a><span class="sd">    $$</span>
+</span><span id="__span-0-430"><a id="__codelineno-0-430" name="__codelineno-0-430"></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="__span-0-431"><a id="__codelineno-0-431" name="__codelineno-0-431"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_snipe_signature</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
+</span><span id="__span-0-432"><a id="__codelineno-0-432" name="__codelineno-0-432"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">__verify_matching_ksize_scale</span><span class="p">(</span><span class="n">other</span><span class="p">)</span>
 </span><span id="__span-0-433"><a id="__codelineno-0-433" name="__codelineno-0-433"></a>
-</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>    <span class="c1"># Handle the case where &#39;other&#39; does not track abundance</span>
-</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span><span class="p">:</span>
-</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Other signature does not track abundance. Setting abundances to 1.&quot;</span><span class="p">)</span>
-</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>        <span class="n">other_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">other_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
-</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>
-</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>    <span class="c1"># Combine hashes and abundances</span>
-</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>    <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">self_hashes</span><span class="p">,</span> <span class="n">other_hashes</span><span class="p">))</span>
-</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>    <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">self_abundances</span><span class="p">,</span> <span class="n">other_abundances</span><span class="p">))</span>
-</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>
-</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>    <span class="c1"># Use numpy&#39;s unique function with return_inverse to sum abundances efficiently</span>
-</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>    <span class="n">unique_hashes</span><span class="p">,</span> <span class="n">inverse_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">,</span> <span class="n">return_inverse</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
-</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">unique_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
+</span><span id="__span-0-434"><a id="__codelineno-0-434" name="__codelineno-0-434"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Unioning signatures (including all unique hashes).&quot;</span><span class="p">)</span>
+</span><span id="__span-0-435"><a id="__codelineno-0-435" name="__codelineno-0-435"></a>
+</span><span id="__span-0-436"><a id="__codelineno-0-436" name="__codelineno-0-436"></a>    <span class="c1"># Access internal arrays directly</span>
+</span><span id="__span-0-437"><a id="__codelineno-0-437" name="__codelineno-0-437"></a>    <span class="n">self_hashes</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_hashes</span>
+</span><span id="__span-0-438"><a id="__codelineno-0-438" name="__codelineno-0-438"></a>    <span class="n">self_abundances</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">_abundances</span>
+</span><span id="__span-0-439"><a id="__codelineno-0-439" name="__codelineno-0-439"></a>    <span class="n">other_hashes</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_hashes</span>
+</span><span id="__span-0-440"><a id="__codelineno-0-440" name="__codelineno-0-440"></a>    <span class="n">other_abundances</span> <span class="o">=</span> <span class="n">other</span><span class="o">.</span><span class="n">_abundances</span>
+</span><span id="__span-0-441"><a id="__codelineno-0-441" name="__codelineno-0-441"></a>
+</span><span id="__span-0-442"><a id="__codelineno-0-442" name="__codelineno-0-442"></a>    <span class="c1"># Handle the case where &#39;other&#39; does not track abundance</span>
+</span><span id="__span-0-443"><a id="__codelineno-0-443" name="__codelineno-0-443"></a>    <span class="k">if</span> <span class="ow">not</span> <span class="n">other</span><span class="o">.</span><span class="n">track_abundance</span><span class="p">:</span>
+</span><span id="__span-0-444"><a id="__codelineno-0-444" name="__codelineno-0-444"></a>        <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Other signature does not track abundance. Setting abundances to 1.&quot;</span><span class="p">)</span>
+</span><span id="__span-0-445"><a id="__codelineno-0-445" name="__codelineno-0-445"></a>        <span class="n">other_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">ones_like</span><span class="p">(</span><span class="n">other_abundances</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
 </span><span id="__span-0-446"><a id="__codelineno-0-446" name="__codelineno-0-446"></a>
-</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>    <span class="c1"># Sum abundances for duplicate hashes</span>
-</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>    <span class="n">np</span><span class="o">.</span><span class="n">add</span><span class="o">.</span><span class="n">at</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">inverse_indices</span><span class="p">,</span> <span class="n">combined_abundances</span><span class="p">)</span>
-</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>
-</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>    <span class="c1"># Handle potential overflow</span>
-</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">iinfo</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">)</span>
-</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>
-</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Union operation completed. Total hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">unique_hashes</span><span class="p">))</span>
+</span><span id="__span-0-447"><a id="__codelineno-0-447" name="__codelineno-0-447"></a>    <span class="c1"># Combine hashes and abundances</span>
+</span><span id="__span-0-448"><a id="__codelineno-0-448" name="__codelineno-0-448"></a>    <span class="n">combined_hashes</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">self_hashes</span><span class="p">,</span> <span class="n">other_hashes</span><span class="p">))</span>
+</span><span id="__span-0-449"><a id="__codelineno-0-449" name="__codelineno-0-449"></a>    <span class="n">combined_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">concatenate</span><span class="p">((</span><span class="n">self_abundances</span><span class="p">,</span> <span class="n">other_abundances</span><span class="p">))</span>
+</span><span id="__span-0-450"><a id="__codelineno-0-450" name="__codelineno-0-450"></a>
+</span><span id="__span-0-451"><a id="__codelineno-0-451" name="__codelineno-0-451"></a>    <span class="c1"># Use numpy&#39;s unique function with return_inverse to sum abundances efficiently</span>
+</span><span id="__span-0-452"><a id="__codelineno-0-452" name="__codelineno-0-452"></a>    <span class="n">unique_hashes</span><span class="p">,</span> <span class="n">inverse_indices</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">unique</span><span class="p">(</span><span class="n">combined_hashes</span><span class="p">,</span> <span class="n">return_inverse</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="__span-0-453"><a id="__codelineno-0-453" name="__codelineno-0-453"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros_like</span><span class="p">(</span><span class="n">unique_hashes</span><span class="p">,</span> <span class="n">dtype</span><span class="o">=</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span>
 </span><span id="__span-0-454"><a id="__codelineno-0-454" name="__codelineno-0-454"></a>
-</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>    <span class="c1"># Create a new SnipeSig instance</span>
-</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
-</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes</span><span class="p">,</span>
-</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">summed_abundances</span><span class="p">,</span>
-</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>        <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
-</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>        <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
-</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>        <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_union_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
-</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>        <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
-</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
-</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>    <span class="p">)</span>
+</span><span id="__span-0-455"><a id="__codelineno-0-455" name="__codelineno-0-455"></a>    <span class="c1"># Sum abundances for duplicate hashes</span>
+</span><span id="__span-0-456"><a id="__codelineno-0-456" name="__codelineno-0-456"></a>    <span class="n">np</span><span class="o">.</span><span class="n">add</span><span class="o">.</span><span class="n">at</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">inverse_indices</span><span class="p">,</span> <span class="n">combined_abundances</span><span class="p">)</span>
+</span><span id="__span-0-457"><a id="__codelineno-0-457" name="__codelineno-0-457"></a>
+</span><span id="__span-0-458"><a id="__codelineno-0-458" name="__codelineno-0-458"></a>    <span class="c1"># Handle potential overflow</span>
+</span><span id="__span-0-459"><a id="__codelineno-0-459" name="__codelineno-0-459"></a>    <span class="n">summed_abundances</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">minimum</span><span class="p">(</span><span class="n">summed_abundances</span><span class="p">,</span> <span class="n">np</span><span class="o">.</span><span class="n">iinfo</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">uint32</span><span class="p">)</span><span class="o">.</span><span class="n">max</span><span class="p">)</span>
+</span><span id="__span-0-460"><a id="__codelineno-0-460" name="__codelineno-0-460"></a>
+</span><span id="__span-0-461"><a id="__codelineno-0-461" name="__codelineno-0-461"></a>    <span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">debug</span><span class="p">(</span><span class="s2">&quot;Union operation completed. Total hashes: </span><span class="si">%d</span><span class="s2">&quot;</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">unique_hashes</span><span class="p">))</span>
+</span><span id="__span-0-462"><a id="__codelineno-0-462" name="__codelineno-0-462"></a>
+</span><span id="__span-0-463"><a id="__codelineno-0-463" name="__codelineno-0-463"></a>    <span class="c1"># Create a new SnipeSig instance</span>
+</span><span id="__span-0-464"><a id="__codelineno-0-464" name="__codelineno-0-464"></a>    <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">create_from_hashes_abundances</span><span class="p">(</span>
+</span><span id="__span-0-465"><a id="__codelineno-0-465" name="__codelineno-0-465"></a>        <span class="n">hashes</span><span class="o">=</span><span class="n">unique_hashes</span><span class="p">,</span>
+</span><span id="__span-0-466"><a id="__codelineno-0-466" name="__codelineno-0-466"></a>        <span class="n">abundances</span><span class="o">=</span><span class="n">summed_abundances</span><span class="p">,</span>
+</span><span id="__span-0-467"><a id="__codelineno-0-467" name="__codelineno-0-467"></a>        <span class="n">ksize</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_ksize</span><span class="p">,</span>
+</span><span id="__span-0-468"><a id="__codelineno-0-468" name="__codelineno-0-468"></a>        <span class="n">scale</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">_scale</span><span class="p">,</span>
+</span><span id="__span-0-469"><a id="__codelineno-0-469" name="__codelineno-0-469"></a>        <span class="n">name</span><span class="o">=</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="bp">self</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">_union_</span><span class="si">{</span><span class="n">other</span><span class="o">.</span><span class="n">_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="__span-0-470"><a id="__codelineno-0-470" name="__codelineno-0-470"></a>        <span class="n">filename</span><span class="o">=</span><span class="kc">None</span><span class="p">,</span>
+</span><span id="__span-0-471"><a id="__codelineno-0-471" name="__codelineno-0-471"></a>        <span class="n">enable_logging</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">logger</span><span class="o">.</span><span class="n">level</span> <span class="o">&lt;=</span> <span class="n">logging</span><span class="o">.</span><span class="n">DEBUG</span>
+</span><span id="__span-0-472"><a id="__codelineno-0-472" name="__codelineno-0-472"></a>    <span class="p">)</span>
 </span></code></pre></div></td></tr></table></div>
             </details>
     </div>
@@ -9055,7 +9118,7 @@ <h3 id="snipe.api.SnipeSig.union_sigs" class="doc doc-heading">
     <span class="md-icon" title="Last update">
       <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M21 13.1c-.1 0-.3.1-.4.2l-1 1 2.1 2.1 1-1c.2-.2.2-.6 0-.8l-1.3-1.3c-.1-.1-.2-.2-.4-.2m-1.9 1.8-6.1 6V23h2.1l6.1-6.1zM12.5 7v5.2l4 2.4-1 1L11 13V7zM11 21.9c-5.1-.5-9-4.8-9-9.9C2 6.5 6.5 2 12 2c5.3 0 9.6 4.1 10 9.3-.3-.1-.6-.2-1-.2s-.7.1-1 .2C19.6 7.2 16.2 4 12 4c-4.4 0-8 3.6-8 8 0 4.1 3.1 7.5 7.1 7.9l-.1.2z"/></svg>
     </span>
-    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 13, 2024</span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
   </span>
 
     
@@ -9065,7 +9128,7 @@ <h3 id="snipe.api.SnipeSig.union_sigs" class="doc doc-heading">
     <span class="md-icon" title="Created">
       <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M14.47 15.08 11 13V7h1.5v5.25l3.08 1.83c-.41.28-.79.62-1.11 1m-1.39 4.84c-.36.05-.71.08-1.08.08-4.42 0-8-3.58-8-8s3.58-8 8-8 8 3.58 8 8c0 .37-.03.72-.08 1.08.69.1 1.33.32 1.92.64.1-.56.16-1.13.16-1.72 0-5.5-4.5-10-10-10S2 6.5 2 12s4.47 10 10 10c.59 0 1.16-.06 1.72-.16-.32-.59-.54-1.23-.64-1.92M18 15v3h-3v2h3v3h2v-3h3v-2h-3v-3z"/></svg>
     </span>
-    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 13, 2024</span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
   </span>
 
     
diff --git a/cli/index.html b/cli/index.html
index e436ead..d41cec1 100644
--- a/cli/index.html
+++ b/cli/index.html
@@ -15,7 +15,7 @@
         <link rel="canonical" href="https://snipe-bio.github.io/snipe/cli/">
       
       
-        <link rel="prev" href="../ReferenceQC/">
+        <link rel="prev" href="../Sketch/">
       
       
       
@@ -403,6 +403,27 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="../Sketch/" class="md-nav__link">
+        
+  
+  <span class="md-ellipsis">
+    Sketch
+  </span>
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -499,7 +520,7 @@ <h1 id="command-line-interface-cli-documentation">Command Line Interface (CLI) D
     <span class="md-icon" title="Last update">
       <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M21 13.1c-.1 0-.3.1-.4.2l-1 1 2.1 2.1 1-1c.2-.2.2-.6 0-.8l-1.3-1.3c-.1-.1-.2-.2-.4-.2m-1.9 1.8-6.1 6V23h2.1l6.1-6.1zM12.5 7v5.2l4 2.4-1 1L11 13V7zM11 21.9c-5.1-.5-9-4.8-9-9.9C2 6.5 6.5 2 12 2c5.3 0 9.6 4.1 10 9.3-.3-.1-.6-.2-1-.2s-.7.1-1 .2C19.6 7.2 16.2 4 12 4c-4.4 0-8 3.6-8 8 0 4.1 3.1 7.5 7.1 7.9l-.1.2z"/></svg>
     </span>
-    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 13, 2024</span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
   </span>
 
     
@@ -509,7 +530,7 @@ <h1 id="command-line-interface-cli-documentation">Command Line Interface (CLI) D
     <span class="md-icon" title="Created">
       <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M14.47 15.08 11 13V7h1.5v5.25l3.08 1.83c-.41.28-.79.62-1.11 1m-1.39 4.84c-.36.05-.71.08-1.08.08-4.42 0-8-3.58-8-8s3.58-8 8-8 8 3.58 8 8c0 .37-.03.72-.08 1.08.69.1 1.33.32 1.92.64.1-.56.16-1.13.16-1.72 0-5.5-4.5-10-10-10S2 6.5 2 12s4.47 10 10 10c.59 0 1.16-.06 1.72-.16-.32-.59-.54-1.23-.64-1.92M18 15v3h-3v2h3v3h2v-3h3v-2h-3v-3z"/></svg>
     </span>
-    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 13, 2024</span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
   </span>
 
     
diff --git a/index.html b/index.html
index a7835f1..c9dcb78 100644
--- a/index.html
+++ b/index.html
@@ -413,6 +413,27 @@
 
               
             
+              
+                
+  
+  
+  
+  
+    <li class="md-nav__item">
+      <a href="Sketch/" class="md-nav__link">
+        
+  
+  <span class="md-ellipsis">
+    Sketch
+  </span>
+  
+
+      </a>
+    </li>
+  
+
+              
+            
           </ul>
         </nav>
       
@@ -496,7 +517,7 @@ <h1 id="welcome-to-mkdocs">Welcome to MkDocs<a class="headerlink" href="#welcome
     <span class="md-icon" title="Last update">
       <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M21 13.1c-.1 0-.3.1-.4.2l-1 1 2.1 2.1 1-1c.2-.2.2-.6 0-.8l-1.3-1.3c-.1-.1-.2-.2-.4-.2m-1.9 1.8-6.1 6V23h2.1l6.1-6.1zM12.5 7v5.2l4 2.4-1 1L11 13V7zM11 21.9c-5.1-.5-9-4.8-9-9.9C2 6.5 6.5 2 12 2c5.3 0 9.6 4.1 10 9.3-.3-.1-.6-.2-1-.2s-.7.1-1 .2C19.6 7.2 16.2 4 12 4c-4.4 0-8 3.6-8 8 0 4.1 3.1 7.5 7.1 7.9l-.1.2z"/></svg>
     </span>
-    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 13, 2024</span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
   </span>
 
     
@@ -506,7 +527,7 @@ <h1 id="welcome-to-mkdocs">Welcome to MkDocs<a class="headerlink" href="#welcome
     <span class="md-icon" title="Created">
       <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 24 24"><path d="M14.47 15.08 11 13V7h1.5v5.25l3.08 1.83c-.41.28-.79.62-1.11 1m-1.39 4.84c-.36.05-.71.08-1.08.08-4.42 0-8-3.58-8-8s3.58-8 8-8 8 3.58 8 8c0 .37-.03.72-.08 1.08.69.1 1.33.32 1.92.64.1-.56.16-1.13.16-1.72 0-5.5-4.5-10-10-10S2 6.5 2 12s4.47 10 10 10c.59 0 1.16-.06 1.72-.16-.32-.59-.54-1.23-.64-1.92M18 15v3h-3v2h3v3h2v-3h3v-2h-3v-3z"/></svg>
     </span>
-    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 13, 2024</span>
+    <span class="git-revision-date-localized-plugin git-revision-date-localized-plugin-date">October 15, 2024</span>
   </span>
 
     
diff --git a/objects.inv b/objects.inv
index 81bf2a3..72eefef 100644
Binary files a/objects.inv and b/objects.inv differ
diff --git a/search/search_index.json b/search/search_index.json
index c9442dd..5aa241e 100644
--- a/search/search_index.json
+++ b/search/search_index.json
@@ -1 +1 @@
-{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"]},"docs":[{"location":"","title":"Welcome to MkDocs","text":""},{"location":"ReferenceQC/","title":"Python API Documentation","text":""},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC","title":"<code>ReferenceQC</code>","text":"<p>Class for performing quality control of sequencing data against a reference genome.</p> <p>This class computes various metrics to assess the quality and characteristics of a sequencing sample, including coverage indices and abundance ratios, by comparing sample k-mer signatures with a reference genome and an optional amplicon signature.</p> <p>Parameters</p> <ul> <li><code>sample_sig</code> (<code>SnipeSig</code>): The sample k-mer signature (must be of type <code>SigType.SAMPLE</code>).</li> <li><code>reference_sig</code> (<code>SnipeSig</code>): The reference genome k-mer signature (must be of type <code>SigType.GENOME</code>).</li> <li><code>amplicon_sig</code> (<code>Optional[SnipeSig]</code>): The amplicon k-mer signature (must be of type <code>SigType.AMPLICON</code>), if applicable.</li> <li><code>enable_logging</code> (<code>bool</code>): Flag to enable detailed logging.</li> </ul> <p>Attributes</p> <ul> <li><code>sample_sig</code> (<code>SnipeSig</code>): The sample signature.</li> <li><code>reference_sig</code> (<code>SnipeSig</code>): The reference genome signature.</li> <li><code>amplicon_sig</code> (<code>Optional[SnipeSig]</code>): The amplicon signature.</li> <li><code>sample_stats</code> (<code>Dict[str, Any]</code>): Statistics of the sample signature.</li> <li><code>genome_stats</code> (<code>Dict[str, Any]</code>): Calculated genome-related statistics.</li> <li><code>amplicon_stats</code> (<code>Dict[str, Any]</code>): Calculated amplicon-related statistics (if <code>amplicon_sig</code> is provided).</li> <li><code>advanced_stats</code> (<code>Dict[str, Any]</code>): Calculated advanced statistics (optional).</li> <li><code>predicted_assay_type</code> (<code>str</code>): Predicted assay type based on metrics.</li> </ul> <p>Calculated Metrics</p> <p>The class calculates the following metrics:</p> <ul> <li> <p>Total unique k-mers</p> <ul> <li>Description: Number of unique k-mers in the sample signature.</li> <li>Calculation:   $$   \\text{Total unique k-mers} = \\left| \\text{Sample k-mer set} \\right|   $$</li> </ul> </li> <li> <p>k-mer total abundance</p> <ul> <li>Description: Sum of abundances of all k-mers in the sample signature.</li> <li>Calculation:   $$   \\text{k-mer total abundance} = \\sum_{k \\in \\text{Sample k-mer set}} \\text{abundance}(k)   $$</li> </ul> </li> <li> <p>k-mer mean abundance</p> <ul> <li>Description: Average abundance of k-mers in the sample signature.</li> <li>Calculation:   $$   \\text{k-mer mean abundance} = \\frac{\\text{k-mer total abundance}}{\\text{Total unique k-mers}}   $$</li> </ul> </li> <li> <p>k-mer median abundance</p> <ul> <li>Description: Median abundance of k-mers in the sample signature.</li> <li>Calculation: Median of abundances in the sample k-mers.</li> </ul> </li> <li> <p>Number of singletons</p> <ul> <li>Description: Number of k-mers with an abundance of 1 in the sample signature.</li> <li>Calculation:   $$   \\text{Number of singletons} = \\left| { k \\in \\text{Sample k-mer set} \\mid \\text{abundance}(k) = 1 } \\right|   $$</li> </ul> </li> <li> <p>Genomic unique k-mers</p> <ul> <li>Description: Number of k-mers shared between the sample and the reference genome.</li> <li>Calculation:   $$   \\text{Genomic unique k-mers} = \\left| \\text{Sample k-mer set} \\cap \\text{Reference genome k-mer set} \\right|   $$</li> </ul> </li> <li> <p>Genome coverage index</p> <ul> <li>Description: Proportion of the reference genome's k-mers that are present in the sample.</li> <li>Calculation:   $$   \\text{Genome coverage index} = \\frac{\\text{Genomic unique k-mers}}{\\left| \\text{Reference genome k-mer set} \\right|}   $$</li> </ul> </li> <li> <p>Genomic k-mers total abundance</p> <ul> <li>Description: Sum of abundances for k-mers shared with the reference genome.</li> <li>Calculation:   $$   \\text{Genomic k-mers total abundance} = \\sum_{k \\in \\text{Sample k-mer set} \\cap \\text{Reference genome k-mer set}} \\text{abundance}(k)   $$</li> </ul> </li> <li> <p>Genomic k-mers mean abundance</p> <ul> <li>Description: Average abundance of k-mers shared with the reference genome.</li> <li>Calculation:   $$   \\text{Genomic k-mers mean abundance} = \\frac{\\text{Genomic k-mers total abundance}}{\\text{Genomic unique k-mers}}   $$</li> </ul> </li> <li> <p>Mapping index</p> <ul> <li>Description: Proportion of the sample's total k-mer abundance that maps to the reference genome.</li> <li>Calculation:   $$   \\text{Mapping index} = \\frac{\\text{Genomic k-mers total abundance}}{\\text{k-mer total abundance}}   $$</li> </ul> </li> </ul> <p>If <code>amplicon_sig</code> is provided, additional metrics are calculated:</p> <ul> <li> <p>Amplicon unique k-mers</p> <ul> <li>Description: Number of k-mers shared between the sample and the amplicon.</li> <li>Calculation:   $$   \\text{Amplicon unique k-mers} = \\left| \\text{Sample k-mer set} \\cap \\text{Amplicon k-mer set} \\right|   $$</li> </ul> </li> <li> <p>Amplicon coverage index</p> <ul> <li>Description: Proportion of the amplicon's k-mers that are present in the sample.</li> <li>Calculation:   $$   \\text{Amplicon coverage index} = \\frac{\\text{Amplicon unique k-mers}}{\\left| \\text{Amplicon k-mer set} \\right|}   $$</li> </ul> </li> <li> <p>Amplicon k-mers total abundance</p> <ul> <li>Description: Sum of abundances for k-mers shared with the amplicon.</li> <li>Calculation:   $$   \\text{Amplicon k-mers total abundance} = \\sum_{k \\in \\text{Sample k-mer set} \\cap \\text{Amplicon k-mer set}} \\text{abundance}(k)   $$</li> </ul> </li> <li> <p>Amplicon k-mers mean abundance</p> <ul> <li>Description: Average abundance of k-mers shared with the amplicon.</li> <li>Calculation:   $$   \\text{Amplicon k-mers mean abundance} = \\frac{\\text{Amplicon k-mers total abundance}}{\\text{Amplicon unique k-mers}}   $$</li> </ul> </li> <li> <p>Relative total abundance</p> <ul> <li>Description: Ratio of the amplicon k-mers total abundance to the genomic k-mers total abundance.</li> <li>Calculation:   $$   \\text{Relative total abundance} = \\frac{\\text{Amplicon k-mers total abundance}}{\\text{Genomic k-mers total abundance}}   $$</li> </ul> </li> <li> <p>Relative coverage</p> <ul> <li>Description: Ratio of the amplicon coverage index to the genome coverage index.</li> <li>Calculation:   $$   \\text{Relative coverage} = \\frac{\\text{Amplicon coverage index}}{\\text{Genome coverage index}}   $$</li> </ul> </li> <li> <p>Predicted Assay Type</p> <ul> <li>Description: Predicted assay type based on the <code>Relative total abundance</code>.</li> <li>Calculation:</li> <li>If \\(\\text{Relative total abundance} \\leq 0.0809\\), then WGS (Whole Genome Sequencing).</li> <li>If \\(\\text{Relative total abundance} \\geq 0.1188\\), then WXS (Whole Exome Sequencing).</li> <li>If between these values, assign based on the closest threshold.</li> </ul> </li> </ul> <p>Advanced Metrics (optional, calculated if <code>include_advanced</code> is <code>True</code>):</p> <ul> <li> <p>Median-trimmed unique k-mers</p> <ul> <li>Description: Number of unique k-mers in the sample after removing k-mers with abundance below the median.</li> <li>Calculation:</li> <li>Remove k-mers where \\(\\text{abundance}(k) &lt; \\text{Median abundance}\\).</li> <li>Count the remaining k-mers.</li> </ul> </li> <li> <p>Median-trimmed total abundance</p> <ul> <li>Description: Sum of abundances after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed total abundance} = \\sum_{k \\in \\text{Median-trimmed Sample k-mer set}} \\text{abundance}(k)   $$</li> </ul> </li> <li> <p>Median-trimmed mean abundance</p> <ul> <li>Description: Average abundance after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed mean abundance} = \\frac{\\text{Median-trimmed total abundance}}{\\text{Median-trimmed unique k-mers}}   $$</li> </ul> </li> <li> <p>Median-trimmed median abundance</p> <ul> <li>Description: Median abundance after median trimming.</li> <li>Calculation: Median of abundances in the median-trimmed sample.</li> </ul> </li> <li> <p>Median-trimmed Genomic unique k-mers</p> <ul> <li>Description: Number of genomic k-mers in the median-trimmed sample.</li> <li>Calculation:   $$   \\text{Median-trimmed Genomic unique k-mers} = \\left| \\text{Median-trimmed Sample k-mer set} \\cap \\text{Reference genome k-mer set} \\right|   $$</li> </ul> </li> <li> <p>Median-trimmed Genome coverage index</p> <ul> <li>Description: Genome coverage index after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed Genome coverage index} = \\frac{\\text{Median-trimmed Genomic unique k-mers}}{\\left| \\text{Reference genome k-mer set} \\right|}   $$</li> </ul> </li> <li> <p>Median-trimmed Amplicon unique k-mers (if <code>amplicon_sig</code> is provided)</p> <ul> <li>Description: Number of amplicon k-mers in the median-trimmed sample.</li> <li>Calculation:   $$   \\text{Median-trimmed Amplicon unique k-mers} = \\left| \\text{Median-trimmed Sample k-mer set} \\cap \\text{Amplicon k-mer set} \\right|   $$</li> </ul> </li> <li> <p>Median-trimmed Amplicon coverage index</p> <ul> <li>Description: Amplicon coverage index after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed Amplicon coverage index} = \\frac{\\text{Median-trimmed Amplicon unique k-mers}}{\\left| \\text{Amplicon k-mer set} \\right|}   $$</li> </ul> </li> <li> <p>Median-trimmed relative coverage</p> <ul> <li>Description: Relative coverage after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed relative coverage} = \\frac{\\text{Median-trimmed Amplicon coverage index}}{\\text{Median-trimmed Genome coverage index}}   $$</li> </ul> </li> <li> <p>Median-trimmed relative mean abundance</p> <ul> <li>Description: Ratio of median-trimmed amplicon mean abundance to median-trimmed genomic mean abundance.</li> <li>Calculation:   $$   \\text{Median-trimmed relative mean abundance} = \\frac{\\text{Median-trimmed Amplicon mean abundance}}{\\text{Median-trimmed Genomic mean abundance}}   $$</li> </ul> </li> </ul> <p>Usage Example</p> <pre><code>qc = ReferenceQC(\n    sample_sig=sample_signature,\n    reference_sig=reference_signature,\n    amplicon_sig=amplicon_signature,\n    enable_logging=True\n)\n\nstats = qc.get_aggregated_stats(include_advanced=True)\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>class ReferenceQC:\n    r\"\"\"\n    Class for performing quality control of sequencing data against a reference genome.\n\n    This class computes various metrics to assess the quality and characteristics of a sequencing sample, including coverage indices and abundance ratios, by comparing sample k-mer signatures with a reference genome and an optional amplicon signature.\n\n    **Parameters**\n\n    - `sample_sig` (`SnipeSig`): The sample k-mer signature (must be of type `SigType.SAMPLE`).\n    - `reference_sig` (`SnipeSig`): The reference genome k-mer signature (must be of type `SigType.GENOME`).\n    - `amplicon_sig` (`Optional[SnipeSig]`): The amplicon k-mer signature (must be of type `SigType.AMPLICON`), if applicable.\n    - `enable_logging` (`bool`): Flag to enable detailed logging.\n\n    **Attributes**\n\n    - `sample_sig` (`SnipeSig`): The sample signature.\n    - `reference_sig` (`SnipeSig`): The reference genome signature.\n    - `amplicon_sig` (`Optional[SnipeSig]`): The amplicon signature.\n    - `sample_stats` (`Dict[str, Any]`): Statistics of the sample signature.\n    - `genome_stats` (`Dict[str, Any]`): Calculated genome-related statistics.\n    - `amplicon_stats` (`Dict[str, Any]`): Calculated amplicon-related statistics (if `amplicon_sig` is provided).\n    - `advanced_stats` (`Dict[str, Any]`): Calculated advanced statistics (optional).\n    - `predicted_assay_type` (`str`): Predicted assay type based on metrics.\n\n    **Calculated Metrics**\n\n    The class calculates the following metrics:\n\n    - **Total unique k-mers**\n        - Description: Number of unique k-mers in the sample signature.\n        - Calculation:\n          $$\n          \\text{Total unique k-mers} = \\left| \\text{Sample k-mer set} \\right|\n          $$\n\n    - **k-mer total abundance**\n        - Description: Sum of abundances of all k-mers in the sample signature.\n        - Calculation:\n          $$\n          \\text{k-mer total abundance} = \\sum_{k \\in \\text{Sample k-mer set}} \\text{abundance}(k)\n          $$\n\n    - **k-mer mean abundance**\n        - Description: Average abundance of k-mers in the sample signature.\n        - Calculation:\n          $$\n          \\text{k-mer mean abundance} = \\frac{\\text{k-mer total abundance}}{\\text{Total unique k-mers}}\n          $$\n\n    - **k-mer median abundance**\n        - Description: Median abundance of k-mers in the sample signature.\n        - Calculation: Median of abundances in the sample k-mers.\n\n    - **Number of singletons**\n        - Description: Number of k-mers with an abundance of 1 in the sample signature.\n        - Calculation:\n          $$\n          \\text{Number of singletons} = \\left| \\{ k \\in \\text{Sample k-mer set} \\mid \\text{abundance}(k) = 1 \\} \\right|\n          $$\n\n    - **Genomic unique k-mers**\n        - Description: Number of k-mers shared between the sample and the reference genome.\n        - Calculation:\n          $$\n          \\text{Genomic unique k-mers} = \\left| \\text{Sample k-mer set} \\cap \\text{Reference genome k-mer set} \\right|\n          $$\n\n    - **Genome coverage index**\n        - Description: Proportion of the reference genome's k-mers that are present in the sample.\n        - Calculation:\n          $$\n          \\text{Genome coverage index} = \\frac{\\text{Genomic unique k-mers}}{\\left| \\text{Reference genome k-mer set} \\right|}\n          $$\n\n    - **Genomic k-mers total abundance**\n        - Description: Sum of abundances for k-mers shared with the reference genome.\n        - Calculation:\n          $$\n          \\text{Genomic k-mers total abundance} = \\sum_{k \\in \\text{Sample k-mer set} \\cap \\text{Reference genome k-mer set}} \\text{abundance}(k)\n          $$\n\n    - **Genomic k-mers mean abundance**\n        - Description: Average abundance of k-mers shared with the reference genome.\n        - Calculation:\n          $$\n          \\text{Genomic k-mers mean abundance} = \\frac{\\text{Genomic k-mers total abundance}}{\\text{Genomic unique k-mers}}\n          $$\n\n    - **Mapping index**\n        - Description: Proportion of the sample's total k-mer abundance that maps to the reference genome.\n        - Calculation:\n          $$\n          \\text{Mapping index} = \\frac{\\text{Genomic k-mers total abundance}}{\\text{k-mer total abundance}}\n          $$\n\n    If `amplicon_sig` is provided, additional metrics are calculated:\n\n    - **Amplicon unique k-mers**\n        - Description: Number of k-mers shared between the sample and the amplicon.\n        - Calculation:\n          $$\n          \\text{Amplicon unique k-mers} = \\left| \\text{Sample k-mer set} \\cap \\text{Amplicon k-mer set} \\right|\n          $$\n\n    - **Amplicon coverage index**\n        - Description: Proportion of the amplicon's k-mers that are present in the sample.\n        - Calculation:\n          $$\n          \\text{Amplicon coverage index} = \\frac{\\text{Amplicon unique k-mers}}{\\left| \\text{Amplicon k-mer set} \\right|}\n          $$\n\n    - **Amplicon k-mers total abundance**\n        - Description: Sum of abundances for k-mers shared with the amplicon.\n        - Calculation:\n          $$\n          \\text{Amplicon k-mers total abundance} = \\sum_{k \\in \\text{Sample k-mer set} \\cap \\text{Amplicon k-mer set}} \\text{abundance}(k)\n          $$\n\n    - **Amplicon k-mers mean abundance**\n        - Description: Average abundance of k-mers shared with the amplicon.\n        - Calculation:\n          $$\n          \\text{Amplicon k-mers mean abundance} = \\frac{\\text{Amplicon k-mers total abundance}}{\\text{Amplicon unique k-mers}}\n          $$\n\n    - **Relative total abundance**\n        - Description: Ratio of the amplicon k-mers total abundance to the genomic k-mers total abundance.\n        - Calculation:\n          $$\n          \\text{Relative total abundance} = \\frac{\\text{Amplicon k-mers total abundance}}{\\text{Genomic k-mers total abundance}}\n          $$\n\n    - **Relative coverage**\n        - Description: Ratio of the amplicon coverage index to the genome coverage index.\n        - Calculation:\n          $$\n          \\text{Relative coverage} = \\frac{\\text{Amplicon coverage index}}{\\text{Genome coverage index}}\n          $$\n\n    - **Predicted Assay Type**\n        - Description: Predicted assay type based on the `Relative total abundance`.\n        - Calculation:\n          - If \\(\\text{Relative total abundance} \\leq 0.0809\\), then **WGS** (Whole Genome Sequencing).\n          - If \\(\\text{Relative total abundance} \\geq 0.1188\\), then **WXS** (Whole Exome Sequencing).\n          - If between these values, assign based on the closest threshold.\n\n    **Advanced Metrics** (optional, calculated if `include_advanced` is `True`):\n\n    - **Median-trimmed unique k-mers**\n        - Description: Number of unique k-mers in the sample after removing k-mers with abundance below the median.\n        - Calculation:\n          - Remove k-mers where \\(\\text{abundance}(k) &lt; \\text{Median abundance}\\).\n          - Count the remaining k-mers.\n\n    - **Median-trimmed total abundance**\n        - Description: Sum of abundances after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed total abundance} = \\sum_{k \\in \\text{Median-trimmed Sample k-mer set}} \\text{abundance}(k)\n          $$\n\n    - **Median-trimmed mean abundance**\n        - Description: Average abundance after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed mean abundance} = \\frac{\\text{Median-trimmed total abundance}}{\\text{Median-trimmed unique k-mers}}\n          $$\n\n    - **Median-trimmed median abundance**\n        - Description: Median abundance after median trimming.\n        - Calculation: Median of abundances in the median-trimmed sample.\n\n    - **Median-trimmed Genomic unique k-mers**\n        - Description: Number of genomic k-mers in the median-trimmed sample.\n        - Calculation:\n          $$\n          \\text{Median-trimmed Genomic unique k-mers} = \\left| \\text{Median-trimmed Sample k-mer set} \\cap \\text{Reference genome k-mer set} \\right|\n          $$\n\n    - **Median-trimmed Genome coverage index**\n        - Description: Genome coverage index after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed Genome coverage index} = \\frac{\\text{Median-trimmed Genomic unique k-mers}}{\\left| \\text{Reference genome k-mer set} \\right|}\n          $$\n\n    - **Median-trimmed Amplicon unique k-mers** (if `amplicon_sig` is provided)\n        - Description: Number of amplicon k-mers in the median-trimmed sample.\n        - Calculation:\n          $$\n          \\text{Median-trimmed Amplicon unique k-mers} = \\left| \\text{Median-trimmed Sample k-mer set} \\cap \\text{Amplicon k-mer set} \\right|\n          $$\n\n    - **Median-trimmed Amplicon coverage index**\n        - Description: Amplicon coverage index after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed Amplicon coverage index} = \\frac{\\text{Median-trimmed Amplicon unique k-mers}}{\\left| \\text{Amplicon k-mer set} \\right|}\n          $$\n\n    - **Median-trimmed relative coverage**\n        - Description: Relative coverage after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed relative coverage} = \\frac{\\text{Median-trimmed Amplicon coverage index}}{\\text{Median-trimmed Genome coverage index}}\n          $$\n\n    - **Median-trimmed relative mean abundance**\n        - Description: Ratio of median-trimmed amplicon mean abundance to median-trimmed genomic mean abundance.\n        - Calculation:\n          $$\n          \\text{Median-trimmed relative mean abundance} = \\frac{\\text{Median-trimmed Amplicon mean abundance}}{\\text{Median-trimmed Genomic mean abundance}}\n          $$\n\n    **Usage Example**\n\n    ```python\n    qc = ReferenceQC(\n        sample_sig=sample_signature,\n        reference_sig=reference_signature,\n        amplicon_sig=amplicon_signature,\n        enable_logging=True\n    )\n\n    stats = qc.get_aggregated_stats(include_advanced=True)\n    ```\n    \"\"\"\n\n    def __init__(self, *,\n                 sample_sig: SnipeSig,\n                 reference_sig: SnipeSig,\n                 amplicon_sig: Optional[SnipeSig] = None,\n                 enable_logging: bool = False,\n                 **kwargs):\n        # Initialize logger\n        self.logger = logging.getLogger(self.__class__.__name__)\n\n        if enable_logging:\n            self.logger.setLevel(logging.DEBUG)\n            if not self.logger.hasHandlers():\n                ch = logging.StreamHandler()\n                ch.setLevel(logging.DEBUG)\n                formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')\n                ch.setFormatter(formatter)\n                self.logger.addHandler(ch)\n            self.logger.debug(\"Logging is enabled for ReferenceQC.\")\n        else:\n            self.logger.setLevel(logging.CRITICAL)\n\n        # logging all passed parameters\n        self.logger.debug(\"passed parameters:\\n\")\n        for key, value in locals().items():\n            self.logger.debug(\"\\t%s: %s\", key, value)\n\n\n        # Validate that all signatures have the same ksize and scale\n        self.logger.debug(\"Validating ksize and scale across signatures.\")\n        if sample_sig.ksize != reference_sig.ksize:\n            self.logger.error(\"K-mer sizes do not match: sample_sig.ksize=%d vs reference_sig.ksize=%d\",\n                              sample_sig.ksize, reference_sig.ksize)\n            raise ValueError(f\"sample_sig kszie ({sample_sig.ksize}) does not match reference_sig ksize ({reference_sig.ksize}).\")\n        if sample_sig.scale != reference_sig.scale:\n            self.logger.error(\"Scale values do not match: sample_sig.scale=%d vs reference_sig.scale=%d\",\n                              sample_sig.scale, reference_sig.scale)\n            raise ValueError(f\"sample_sig scale ({sample_sig.scale}) does not match reference_sig scale ({reference_sig.scale}).\")\n\n        if amplicon_sig is not None:\n            if amplicon_sig.ksize != sample_sig.ksize:\n                self.logger.error(\"K-mer sizes do not match: amplicon_sig.ksize=%d vs sample_sig.ksize=%d\",\n                                  amplicon_sig.ksize, sample_sig.ksize)\n                raise ValueError(f\"amplicon_sig ksize ({amplicon_sig.ksize}) does not match sample_sig ksize ({sample_sig.ksize}).\")\n            if amplicon_sig.scale != sample_sig.scale:\n                self.logger.error(\"Scale values do not match: amplicon_sig.scale=%d vs sample_sig.scale=%d\",\n                                  amplicon_sig.scale, sample_sig.scale)\n                raise ValueError(f\"amplicon_sig scale ({amplicon_sig.scale}) does not match sample_sig scale ({sample_sig.scale}).\")\n\n        self.logger.debug(\"All signatures have matching ksize and scale.\")\n\n\n        # Verify signature types\n        if sample_sig._type != SigType.SAMPLE:\n            self.logger.error(\"Invalid signature type for sample_sig: %s | %s\", sample_sig.sigtype, sample_sig._type)\n            raise ValueError(f\"sample_sig must be of type {SigType.SAMPLE}, got {sample_sig.sigtype}\")\n\n        if reference_sig.sigtype != SigType.GENOME:\n            self.logger.error(\"Invalid signature type for reference_sig: %s\", reference_sig.sigtype)\n            raise ValueError(f\"reference_sig must be of type {SigType.GENOME}, got {reference_sig.sigtype}\")\n\n        if amplicon_sig is not None and amplicon_sig.sigtype != SigType.AMPLICON:\n            self.logger.error(\"Invalid signature type for amplicon_sig: %s\", amplicon_sig.sigtype)\n            raise ValueError(f\"amplicon_sig must be of type {SigType.AMPLICON}, got {amplicon_sig.sigtype}\")\n\n\n        self.logger.debug(\"Chromosome specific signatures provided.\")\n        self.flag_activate_sex_metrics = True\n\n\n        self.sample_sig = sample_sig\n        self.reference_sig = reference_sig\n        self.amplicon_sig = amplicon_sig\n        self.enable_logging = enable_logging\n\n        # Initialize attributes\n        self.sample_stats: Dict[str, Any] = {}\n        self.genome_stats: Dict[str, Any] = {}\n        self.amplicon_stats: Dict[str, Any] = {}\n        self.advanced_stats: Dict[str, Any] = {}\n        self.chrs_stats: Dict[str, Dict[str, Any]] = {}\n        self.sex_stats: Dict[str, Any] = {}\n        self.predicted_assay_type: str = \"\"\n\n        # Set grey zone thresholds\n        self.relative_total_abundance_grey_zone = [0.08092723407173719, 0.11884490500267662]\n\n        # Get sample statistics\n        self.logger.debug(\"Getting sample statistics.\")\n        self.sample_stats_raw = self.sample_sig.get_sample_stats\n\n        # Get reference genome statistics\n        self.logger.debug(\"Getting reference genome statistics.\")\n        self.genome_sig_stats = self.reference_sig.get_sample_stats\n\n        # If amplicon_sig is provided, get its stats\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"Getting amplicon statistics.\")\n            self.amplicon_sig_stats = self.amplicon_sig.get_sample_stats\n\n        # Compute metrics\n        self.logger.debug(\"Calculating statistics.\")\n        self._calculate_stats()\n\n\n    def _calculate_stats(self):\n        r\"\"\"\n        Calculate the various metrics based on the sample, reference, and optional amplicon signatures.\n        \"\"\"\n        # ============= SAMPLE STATS =============\n        self.logger.debug(\"Processing sample statistics.\")\n        self.sample_stats = {\n            \"Total unique k-mers\": self.sample_stats_raw[\"num_hashes\"],\n            \"k-mer total abundance\": self.sample_stats_raw[\"total_abundance\"],\n            \"k-mer mean abundance\": self.sample_stats_raw[\"mean_abundance\"],\n            \"k-mer median abundance\": self.sample_stats_raw[\"median_abundance\"],\n            \"num_singletons\": self.sample_stats_raw[\"num_singletons\"],\n            \"ksize\": self.sample_stats_raw[\"ksize\"],\n            \"scale\": self.sample_stats_raw[\"scale\"],\n            \"name\": self.sample_stats_raw[\"name\"],\n            \"filename\": self.sample_stats_raw[\"filename\"],\n        }\n\n        # ============= GENOME STATS =============\n        self.logger.debug(\"Calculating genome statistics.\")\n        # Compute intersection of sample and reference genome\n        self.logger.debug(\"Type of sample_sig: %s | Type of reference_sig: %s\", self.sample_sig.sigtype, self.reference_sig.sigtype)\n        sample_genome = self.sample_sig &amp; self.reference_sig\n        # Get stats (call get_sample_stats only once)\n\n        # Log hashes and abundances for both sample and reference\n        self.logger.debug(\"Sample hashes: %s\", self.sample_sig.hashes)\n        self.logger.debug(\"Sample abundances: %s\", self.sample_sig.abundances)\n        self.logger.debug(\"Reference hashes: %s\", self.reference_sig.hashes)\n        self.logger.debug(\"Reference abundances: %s\", self.reference_sig.abundances)\n\n        sample_genome_stats = sample_genome.get_sample_stats\n\n        self.genome_stats = {\n            \"Genomic unique k-mers\": sample_genome_stats[\"num_hashes\"],\n            \"Genomic k-mers total abundance\": sample_genome_stats[\"total_abundance\"],\n            \"Genomic k-mers mean abundance\": sample_genome_stats[\"mean_abundance\"],\n            \"Genomic k-mers median abundance\": sample_genome_stats[\"median_abundance\"],\n            # Genome coverage index\n            \"Genome coverage index\": (\n                sample_genome_stats[\"num_hashes\"] / self.genome_sig_stats[\"num_hashes\"]\n                if self.genome_sig_stats[\"num_hashes\"] &gt; 0 else 0\n            ),\n            # Mapping index\n            \"Mapping index\": (\n                sample_genome_stats[\"total_abundance\"] / self.sample_stats[\"k-mer total abundance\"]\n                if self.sample_stats[\"k-mer total abundance\"] &gt; 0 else 0\n            ),\n        }\n\n        # ============= AMPLICON STATS =============\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"Calculating amplicon statistics.\")\n            # Compute intersection of sample and amplicon\n            sample_amplicon = self.sample_sig &amp; self.amplicon_sig\n            # Get stats (call get_sample_stats only once)\n            sample_amplicon_stats = sample_amplicon.get_sample_stats\n\n            self.amplicon_stats = {\n                \"Amplicon unique k-mers\": sample_amplicon_stats[\"num_hashes\"],\n                \"Amplicon k-mers total abundance\": sample_amplicon_stats[\"total_abundance\"],\n                \"Amplicon k-mers mean abundance\": sample_amplicon_stats[\"mean_abundance\"],\n                \"Amplicon k-mers median abundance\": sample_amplicon_stats[\"median_abundance\"],\n                # Amplicon coverage index\n                \"Amplicon coverage index\": (\n                    sample_amplicon_stats[\"num_hashes\"] / self.amplicon_sig_stats[\"num_hashes\"]\n                    if self.amplicon_sig_stats[\"num_hashes\"] &gt; 0 else 0\n                ),\n            }\n\n            # Relative metrics\n            self.amplicon_stats[\"Relative total abundance\"] = (\n                self.amplicon_stats[\"Amplicon k-mers total abundance\"] / self.genome_stats[\"Genomic k-mers total abundance\"]\n                if self.genome_stats[\"Genomic k-mers total abundance\"] &gt; 0 else 0\n            )\n            self.amplicon_stats[\"Relative coverage\"] = (\n                self.amplicon_stats[\"Amplicon coverage index\"] / self.genome_stats[\"Genome coverage index\"]\n                if self.genome_stats[\"Genome coverage index\"] &gt; 0 else 0\n            )\n\n            # Predicted assay type\n            relative_total_abundance = self.amplicon_stats[\"Relative total abundance\"]\n            if relative_total_abundance &lt;= self.relative_total_abundance_grey_zone[0]:\n                self.predicted_assay_type = \"WGS\"\n            elif relative_total_abundance &gt;= self.relative_total_abundance_grey_zone[1]:\n                self.predicted_assay_type = \"WXS\"\n            else:\n                # Assign based on the closest threshold\n                distance_to_wgs = abs(relative_total_abundance - self.relative_total_abundance_grey_zone[0])\n                distance_to_wxs = abs(relative_total_abundance - self.relative_total_abundance_grey_zone[1])\n                self.predicted_assay_type = \"WGS\" if distance_to_wgs &lt; distance_to_wxs else \"WXS\"\n            self.logger.debug(\"Predicted assay type: %s\", self.predicted_assay_type)\n\n    def get_aggregated_stats(self, include_advanced: bool = False) -&gt; Dict[str, Any]:\n        r\"\"\"\n        Retrieve aggregated statistics from the quality control analysis.\n\n        **Parameters**\n\n        - `include_advanced (bool)`:  \n          If set to `True`, includes advanced metrics in the aggregated statistics.\n\n        **Returns**\n\n        - `Dict[str, Any]`:  \n          A dictionary containing the aggregated statistics, which may include:\n          - Sample statistics\n          - Genome statistics\n          - Amplicon statistics (if provided)\n          - Predicted assay type\n          - Advanced statistics (if `include_advanced` is `True`)\n        \"\"\"\n        aggregated_stats: Dict[str, Any] = {}\n        # Include sample_stats\n        aggregated_stats.update(self.sample_stats)\n        # Include genome_stats\n        aggregated_stats.update(self.genome_stats)\n        # Include amplicon_stats if available\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"While aggregating stats; amplicon signature provided.\")\n            aggregated_stats.update(self.amplicon_stats)\n            aggregated_stats[\"Predicted Assay Type\"] = self.predicted_assay_type\n\n        if self.chrs_stats:\n            aggregated_stats.update(self.chrs_stats)\n\n        if self.sex_stats:\n            aggregated_stats.update(self.sex_stats)\n\n        # Include advanced_stats if requested\n        if include_advanced:\n            self._calculate_advanced_stats()\n            aggregated_stats.update(self.advanced_stats)\n\n        return aggregated_stats\n\n    def _calculate_advanced_stats(self):\n        r\"\"\"\n        Calculate advanced statistics, such as median-trimmed metrics.\n        \"\"\"\n        self.logger.debug(\"Calculating advanced statistics.\")\n\n        # Copy sample signature to avoid modifying the original\n        median_trimmed_sample_sig = self.sample_sig.copy()\n        # Trim below median\n        median_trimmed_sample_sig.trim_below_median()\n        # Get stats\n        median_trimmed_sample_stats = median_trimmed_sample_sig.get_sample_stats\n        self.advanced_stats.update({\n            \"Median-trimmed unique k-mers\": median_trimmed_sample_stats[\"num_hashes\"],\n            \"Median-trimmed total abundance\": median_trimmed_sample_stats[\"total_abundance\"],\n            \"Median-trimmed mean abundance\": median_trimmed_sample_stats[\"mean_abundance\"],\n            \"Median-trimmed median abundance\": median_trimmed_sample_stats[\"median_abundance\"],\n        })\n\n        # Genome stats for median-trimmed sample\n        median_trimmed_sample_genome = median_trimmed_sample_sig &amp; self.reference_sig\n        median_trimmed_sample_genome_stats = median_trimmed_sample_genome.get_sample_stats\n        self.advanced_stats.update({\n            \"Median-trimmed Genomic unique k-mers\": median_trimmed_sample_genome_stats[\"num_hashes\"],\n            \"Median-trimmed Genomic total abundance\": median_trimmed_sample_genome_stats[\"total_abundance\"],\n            \"Median-trimmed Genomic mean abundance\": median_trimmed_sample_genome_stats[\"mean_abundance\"],\n            \"Median-trimmed Genomic median abundance\": median_trimmed_sample_genome_stats[\"median_abundance\"],\n            \"Median-trimmed Genome coverage index\": (\n                median_trimmed_sample_genome_stats[\"num_hashes\"] / self.genome_sig_stats[\"num_hashes\"]\n                if self.genome_sig_stats[\"num_hashes\"] &gt; 0 else 0\n            ),\n        })\n\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"Calculating advanced amplicon statistics.\")\n            # Amplicon stats for median-trimmed sample\n            median_trimmed_sample_amplicon = median_trimmed_sample_sig &amp; self.amplicon_sig\n            median_trimmed_sample_amplicon_stats = median_trimmed_sample_amplicon.get_sample_stats\n            self.advanced_stats.update({\n                \"Median-trimmed Amplicon unique k-mers\": median_trimmed_sample_amplicon_stats[\"num_hashes\"],\n                \"Median-trimmed Amplicon total abundance\": median_trimmed_sample_amplicon_stats[\"total_abundance\"],\n                \"Median-trimmed Amplicon mean abundance\": median_trimmed_sample_amplicon_stats[\"mean_abundance\"],\n                \"Median-trimmed Amplicon median abundance\": median_trimmed_sample_amplicon_stats[\"median_abundance\"],\n                \"Median-trimmed Amplicon coverage index\": (\n                    median_trimmed_sample_amplicon_stats[\"num_hashes\"] / self.amplicon_sig_stats[\"num_hashes\"]\n                    if self.amplicon_sig_stats[\"num_hashes\"] &gt; 0 else 0\n                ),\n            })\n            # Additional advanced relative metrics\n            self.logger.debug(\"Calculating advanced relative metrics.\")\n            self.amplicon_stats[\"Median-trimmed relative coverage\"] = (\n                self.advanced_stats[\"Median-trimmed Amplicon coverage index\"] / self.advanced_stats[\"Median-trimmed Genome coverage index\"]\n                if self.advanced_stats[\"Median-trimmed Genome coverage index\"] &gt; 0 else 0\n            )\n            self.amplicon_stats[\"Median-trimmed relative mean abundance\"] = (\n                self.advanced_stats[\"Median-trimmed Amplicon mean abundance\"] / self.advanced_stats[\"Median-trimmed Genomic mean abundance\"]\n                if self.advanced_stats[\"Median-trimmed Genomic mean abundance\"] &gt; 0 else 0\n            )\n            # Update amplicon_stats with advanced metrics\n            self.amplicon_stats.update({\n                \"Median-trimmed relative coverage\": self.amplicon_stats[\"Median-trimmed relative coverage\"],\n                \"Median-trimmed relative mean abundance\": self.amplicon_stats[\"Median-trimmed relative mean abundance\"],\n            })\n\n            self.advanced_stats.update(self.amplicon_stats)\n\n    def _calculate_advanced_stats(self):\n        r\"\"\"\n        Calculate advanced statistics, such as median-trimmed metrics.\n        \"\"\"\n        self.logger.debug(\"Calculating advanced statistics.\")\n\n        # Copy sample signature to avoid modifying the original\n        median_trimmed_sample_sig = self.sample_sig.copy()\n        # Trim below median\n        median_trimmed_sample_sig.trim_below_median()\n        # Get stats\n        median_trimmed_sample_stats = median_trimmed_sample_sig.get_sample_stats\n        self.advanced_stats.update({\n            \"Median-trimmed unique k-mers\": median_trimmed_sample_stats[\"num_hashes\"],\n            \"Median-trimmed total abundance\": median_trimmed_sample_stats[\"total_abundance\"],\n            \"Median-trimmed mean abundance\": median_trimmed_sample_stats[\"mean_abundance\"],\n            \"Median-trimmed median abundance\": median_trimmed_sample_stats[\"median_abundance\"],\n        })\n\n        # Genome stats for median-trimmed sample\n        median_trimmed_sample_genome = median_trimmed_sample_sig &amp; self.reference_sig\n        median_trimmed_sample_genome_stats = median_trimmed_sample_genome.get_sample_stats\n        self.advanced_stats.update({\n            \"Median-trimmed Genomic unique k-mers\": median_trimmed_sample_genome_stats[\"num_hashes\"],\n            \"Median-trimmed Genomic total abundance\": median_trimmed_sample_genome_stats[\"total_abundance\"],\n            \"Median-trimmed Genomic mean abundance\": median_trimmed_sample_genome_stats[\"mean_abundance\"],\n            \"Median-trimmed Genomic median abundance\": median_trimmed_sample_genome_stats[\"median_abundance\"],\n            \"Median-trimmed Genome coverage index\": (\n                median_trimmed_sample_genome_stats[\"num_hashes\"] / self.genome_sig_stats[\"num_hashes\"]\n                if self.genome_sig_stats[\"num_hashes\"] &gt; 0 else 0\n            ),\n        })\n\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"Calculating advanced amplicon statistics.\")\n            # Amplicon stats for median-trimmed sample\n            median_trimmed_sample_amplicon = median_trimmed_sample_sig &amp; self.amplicon_sig\n            median_trimmed_sample_amplicon_stats = median_trimmed_sample_amplicon.get_sample_stats\n            self.advanced_stats.update({\n                \"Median-trimmed Amplicon unique k-mers\": median_trimmed_sample_amplicon_stats[\"num_hashes\"],\n                \"Median-trimmed Amplicon total abundance\": median_trimmed_sample_amplicon_stats[\"total_abundance\"],\n                \"Median-trimmed Amplicon mean abundance\": median_trimmed_sample_amplicon_stats[\"mean_abundance\"],\n                \"Median-trimmed Amplicon median abundance\": median_trimmed_sample_amplicon_stats[\"median_abundance\"],\n                \"Median-trimmed Amplicon coverage index\": (\n                    median_trimmed_sample_amplicon_stats[\"num_hashes\"] / self.amplicon_sig_stats[\"num_hashes\"]\n                    if self.amplicon_sig_stats[\"num_hashes\"] &gt; 0 else 0\n                ),\n            })\n            # Additional advanced relative metrics\n            self.logger.debug(\"Calculating advanced relative metrics.\")\n            self.amplicon_stats[\"Median-trimmed relative coverage\"] = (\n                self.advanced_stats[\"Median-trimmed Amplicon coverage index\"] / self.advanced_stats[\"Median-trimmed Genome coverage index\"]\n                if self.advanced_stats[\"Median-trimmed Genome coverage index\"] &gt; 0 else 0\n            )\n            self.amplicon_stats[\"Median-trimmed relative mean abundance\"] = (\n                self.advanced_stats[\"Median-trimmed Amplicon mean abundance\"] / self.advanced_stats[\"Median-trimmed Genomic mean abundance\"]\n                if self.advanced_stats[\"Median-trimmed Genomic mean abundance\"] &gt; 0 else 0\n            )\n            # Update amplicon_stats with advanced metrics\n            self.amplicon_stats.update({\n                \"Median-trimmed relative coverage\": self.amplicon_stats[\"Median-trimmed relative coverage\"],\n                \"Median-trimmed relative mean abundance\": self.amplicon_stats[\"Median-trimmed relative mean abundance\"],\n            })\n\n            self.advanced_stats.update(self.amplicon_stats)\n\n    def split_sig_randomly(self, n: int) -&gt; List[SnipeSig]:\n        r\"\"\"\n        Split the sample signature into `n` random parts based on abundances.\n\n        This method distributes the k-mers of the sample signature into `n` parts using a multinomial distribution\n        based on their abundances. Each k-mer's abundance is split across the `n` parts proportionally.\n\n        **Mathematical Explanation**:\n\n        For each k-mer with hash \\( h \\) and abundance \\( a_h \\), its abundance is distributed into \\( n \\) parts\n        according to a multinomial distribution. Specifically, the abundance in each part \\( i \\) is given by:\n\n        $$\n        a_{h,i} \\sim \\text{Multinomial}(a_h, \\frac{1}{n}, \\frac{1}{n}, \\dots, \\frac{1}{n})\n        $$\n\n        Where:\n        - \\( a_{h,i} \\) is the abundance of k-mer \\( h \\) in part \\( i \\).\n        - Each \\( a_{h,i} \\) is a non-negative integer such that \\( \\sum_{i=1}^{n} a_{h,i} = a_h \\).\n\n        **Parameters**:\n\n        - `n` (`int`): Number of parts to split into.\n\n        **Returns**:\n\n        - `List[SnipeSig]`:  \n          List of `SnipeSig` instances representing the split parts.\n\n        **Usage Example**:\n\n        ```python\n        split_sigs = qc.split_sig_randomly(n=3)\n        for idx, sig in enumerate(split_sigs, 1):\n            print(f\"Signature part {idx}: {sig}\")\n        ```\n        \"\"\"\n        self.logger.debug(\"Splitting sample signature into %d random parts.\", n)\n        # Get k-mers and abundances\n        hash_to_abund = dict(zip(self.sample_sig.hashes, self.sample_sig.abundances))\n        random_split_sigs = self.distribute_kmers_random(hash_to_abund, n)\n        split_sigs = [\n            SnipeSig.create_from_hashes_abundances(\n                hashes=np.array(list(kmer_dict.keys()), dtype=np.uint64),\n                abundances=np.array(list(kmer_dict.values()), dtype=np.uint32),\n                ksize=self.sample_sig.ksize,\n                scale=self.sample_sig.scale,\n                name=f\"{self.sample_sig.name}_part_{i+1}\",\n                filename=self.sample_sig.filename,\n                enable_logging=self.enable_logging\n            )\n            for i, kmer_dict in enumerate(random_split_sigs)\n        ]\n        return split_sigs\n\n    @staticmethod\n    def distribute_kmers_random(original_dict: Dict[int, int], n: int) -&gt; List[Dict[int, int]]:\n        r\"\"\"\n        Distribute the k-mers randomly into `n` parts based on their abundances.\n\n        This helper method performs the actual distribution of k-mers using a multinomial distribution.\n\n        **Mathematical Explanation**:\n\n        Given a k-mer with hash \\( h \\) and abundance \\( a_h \\), the distribution of its abundance across \\( n \\)\n        parts is modeled as:\n\n        $$\n        a_{h,1}, a_{h,2}, \\dots, a_{h,n} \\sim \\text{Multinomial}(a_h, p_1, p_2, \\dots, p_n)\n        $$\n\n        Where \\( p_i = \\frac{1}{n} \\) for all \\( i \\).\n\n        **Parameters**:\n\n        - `original_dict` (`Dict[int, int]`):  \n          Dictionary mapping k-mer hashes to their abundances.\n        - `n` (`int`): Number of parts to split into.\n\n        **Returns**:\n\n        - `List[Dict[int, int]]`:  \n          List of dictionaries, each mapping k-mer hashes to their abundances in that part.\n\n        **Usage Example**:\n\n        ```python\n        distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)\n        ```\n        \"\"\"\n        # Initialize the resulting dictionaries\n        distributed_dicts = [{} for _ in range(n)]\n\n        # For each k-mer and its abundance\n        for kmer_hash, abundance in original_dict.items():\n            if abundance == 0:\n                continue  # Skip zero abundances\n            # Generate multinomial split of abundance\n            counts = np.random.multinomial(abundance, [1.0 / n] * n)\n            # Update each dictionary\n            for i in range(n):\n                if counts[i] &gt; 0:\n                    distributed_dicts[i][kmer_hash] = counts[i]\n\n        return distributed_dicts\n\n    def calculate_coverage_vs_depth(self, n: int = 30) -&gt; List[Dict[str, Any]]:\n        r\"\"\"\n        Calculate cumulative coverage index vs cumulative sequencing depth.\n\n        This method simulates incremental sequencing by splitting the sample signature into `n` parts and\n        calculating the cumulative coverage index at each step. It helps in understanding how coverage\n        improves with increased sequencing depth.\n\n        **Mathematical Explanation**:\n\n        For each cumulative part \\( i \\) (where \\( 1 \\leq i \\leq n \\)):\n\n        - **Cumulative Sequencing Depth** (\\( D_i \\)):\n          $$\n          D_i = \\sum_{j=1}^{i} a_j\n          $$\n          Where \\( a_j \\) is the total abundance of the \\( j^{th} \\) part.\n\n        - **Cumulative Coverage Index** (\\( C_i \\)):\n          $$\n          C_i = \\frac{\\text{Number of genomic unique k-mers in first } i \\text{ parts}}{\\left| \\text{Reference genome k-mer set} \\right|}\n          $$\n\n        **Parameters**:\n\n        - `n` (`int`): Number of parts to split the signature into.\n\n        **Returns**:\n\n        - `List[Dict[str, Any]]`:  \n          List of dictionaries containing:\n            - `\"cumulative_parts\"` (`int`): Number of parts included.\n            - `\"cumulative_total_abundance\"` (`int`): Total sequencing depth up to this part.\n            - `\"cumulative_coverage_index\"` (`float`): Coverage index up to this part.\n\n        **Usage Example**:\n\n        ```python\n        coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)\n        for data in coverage_depth_data:\n            print(data)\n        ```\n        \"\"\"\n        self.logger.debug(\"Calculating coverage vs depth with %d parts.\", n)\n        # Determine the ROI reference signature\n        if isinstance(self.amplicon_sig, SnipeSig):\n            roi_reference_sig = self.amplicon_sig\n            self.logger.debug(\"Using amplicon signature as ROI reference.\")\n        else:\n            roi_reference_sig = self.reference_sig\n            self.logger.debug(\"Using reference genome signature as ROI reference.\")\n\n        # Split the sample signature into n random parts\n        split_sigs = self.split_sig_randomly(n)\n\n        coverage_depth_data = []\n\n        cumulative_snipe_sig = split_sigs[0].copy()\n        cumulative_total_abundance = cumulative_snipe_sig.total_abundance\n\n        #! force conversion to GENOME\n        roi_reference_sig.sigtype = SigType.GENOME\n\n        # Compute initial coverage index\n        cumulative_qc = ReferenceQC(\n            sample_sig=cumulative_snipe_sig,\n            reference_sig=roi_reference_sig,\n            enable_logging=self.enable_logging\n        )\n        cumulative_stats = cumulative_qc.get_aggregated_stats()\n        cumulative_coverage_index = cumulative_stats[\"Genome coverage index\"]\n\n        coverage_depth_data.append({\n            \"cumulative_parts\": 1,\n            \"cumulative_total_abundance\": cumulative_total_abundance,\n            \"cumulative_coverage_index\": cumulative_coverage_index,\n        })\n\n        # Iterate over the rest of the parts\n        for i in range(1, n):\n            current_part = split_sigs[i]\n\n            # Add current part to cumulative signature\n            cumulative_snipe_sig += current_part\n            cumulative_total_abundance += current_part.total_abundance\n\n            # Compute new coverage index\n            cumulative_qc = ReferenceQC(\n                sample_sig=cumulative_snipe_sig,\n                reference_sig=roi_reference_sig,\n                enable_logging=self.enable_logging\n            )\n            cumulative_stats = cumulative_qc.get_aggregated_stats()\n            cumulative_coverage_index = cumulative_stats[\"Genome coverage index\"]\n\n            coverage_depth_data.append({\n                \"cumulative_parts\": i + 1,\n                \"cumulative_total_abundance\": cumulative_total_abundance,\n                \"cumulative_coverage_index\": cumulative_coverage_index,\n            })\n\n        self.logger.debug(\"Coverage vs depth calculation completed.\")\n        return coverage_depth_data\n\n    def predict_coverage(self, extra_fold: float, n: int = 30) -&gt; float:\n        r\"\"\"\n        Predict the coverage index if additional sequencing is performed.\n\n        This method estimates the potential increase in the genome coverage index when the sequencing depth\n        is increased by a specified fold (extra sequencing). It does so by:\n\n        1. **Cumulative Coverage Calculation**:\n        - Splitting the sample signature into `n` random parts to simulate incremental sequencing data.\n        - Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.\n\n        2. **Saturation Curve Fitting**:\n        - Modeling the relationship between cumulative coverage and cumulative sequencing depth using\n            a hyperbolic saturation function.\n        - The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.\n\n        3. **Coverage Prediction**:\n        - Using the fitted model to predict the coverage index at an increased sequencing depth (current depth\n            multiplied by `1 + extra_fold`).\n\n        **Mathematical Explanation**:\n\n        - **Saturation Model**:\n        The coverage index \\( C \\) as a function of sequencing depth \\( D \\) is modeled using the function:\n\n        $$\n        C(D) = \\frac{a \\cdot D}{b + D}\n        $$\n\n        Where:\n        - \\( a \\) and \\( b \\) are parameters estimated from the data.\n        - \\( D \\) is the cumulative sequencing depth (total abundance).\n        - \\( C(D) \\) is the cumulative coverage index at depth \\( D \\).\n\n        - **Parameter Estimation**:\n        The parameters \\( a \\) and \\( b \\) are determined by fitting the model to the observed cumulative\n        coverage and depth data using non-linear least squares optimization.\n\n        - **Coverage Prediction**:\n        The predicted coverage index \\( C_{\\text{pred}} \\) at an increased sequencing depth \\( D_{\\text{pred}} \\)\n        is calculated as:\n\n        $$\n        D_{\\text{pred}} = D_{\\text{current}} \\times (1 + \\text{extra\\_fold})\n        $$\n\n        $$\n        C_{\\text{pred}} = \\frac{a \\cdot D_{\\text{pred}}}{b + D_{\\text{pred}}}\n        $$\n\n        **Parameters**:\n\n        - `extra_fold` (*float*):  \n          The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling\n          the current sequencing depth.\n\n        - `n` (*int, optional*):  \n          The number of parts to split the sample signature into for modeling the saturation curve.\n          Default is 30.\n\n        **Returns**:\n            - `float`:  \n              The predicted genome coverage index at the increased sequencing depth.\n\n        **Raises**:\n            - `RuntimeError`:  \n              If the saturation model fails to converge during curve fitting.\n\n        **Usage Example**:\n\n        ```python\n        # Create a ReferenceQC instance with sample and reference signatures\n        qc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)\n\n        # Predict coverage index after increasing sequencing depth by 50%\n        predicted_coverage = qc.predict_coverage(extra_fold=0.5)\n\n        print(f\"Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}\")\n        ```\n\n        **Implementation Details**:\n\n        - **Splitting the Sample Signature**:\n            - The sample signature is split into `n` random parts using a multinomial distribution based on k-mer abundances.\n            - Each part represents an incremental addition of sequencing data.\n\n        - **Cumulative Calculations**:\n            - At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.\n\n        - **Curve Fitting**:\n            - The `scipy.optimize.curve_fit` function is used to fit the saturation model to the cumulative data.\n            - Initial parameter guesses are based on the observed data to aid convergence.\n        \"\"\"\n        if extra_fold &lt; 1:\n            raise ValueError(\"extra_fold must be &gt;= 1.0.\")\n\n        if n &lt; 1 or not isinstance(n, int):\n            raise ValueError(\"n must be a positive integer.\")\n\n        self.logger.debug(\"Predicting coverage with extra fold: %f\", extra_fold)\n        coverage_depth_data = self.calculate_coverage_vs_depth(n=n)\n\n        # Extract cumulative total abundance and coverage index\n        x_data = np.array([d[\"cumulative_total_abundance\"] for d in coverage_depth_data])\n        y_data = np.array([d[\"cumulative_coverage_index\"] for d in coverage_depth_data])\n\n        # Saturation model function\n        def saturation_model(x, a, b):\n            return a * x / (b + x)\n\n        # Initial parameter guesses\n        initial_guess = [y_data[-1], x_data[int(len(x_data) / 2)]]\n\n        # Fit the model to the data\n        try:\n            with warnings.catch_warnings():\n                warnings.simplefilter(\"error\", OptimizeWarning)\n                params, covariance = curve_fit(\n                    saturation_model,\n                    x_data,\n                    y_data,\n                    p0=initial_guess,\n                    bounds=(0, np.inf),\n                    maxfev=10000\n                )\n        except (RuntimeError, OptimizeWarning) as exc:\n            self.logger.error(\"Curve fitting failed.\")\n            raise RuntimeError(\"Saturation model fitting failed. Cannot predict coverage.\") from exc\n\n        # Check if covariance contains inf or nan\n        if np.isinf(covariance).any() or np.isnan(covariance).any():\n            self.logger.error(\"Covariance of parameters could not be estimated.\")\n            raise RuntimeError(\"Saturation model fitting failed. Cannot predict coverage.\")\n\n        a, b = params\n\n        # Predict coverage at increased sequencing depth\n        total_abundance = x_data[-1]\n        predicted_total_abundance = total_abundance * (1 + extra_fold)\n        predicted_coverage = saturation_model(predicted_total_abundance, a, b)\n\n        # Ensure the predicted coverage does not exceed maximum possible coverage\n        max_coverage = 1.0  # Coverage index cannot exceed 1\n        predicted_coverage = min(predicted_coverage, max_coverage)\n\n        self.logger.debug(\"Predicted coverage at %.2f-fold increase: %f\", extra_fold, predicted_coverage)\n        return predicted_coverage\n\n    def calculate_chromosome_metrics(self, chr_to_sig: Dict[str, SnipeSig]) -&gt; Dict[str, Any]:\n        r\"\"\"\n        Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.\n\n        This method computes the CV to assess the variability of mean abundances among autosomal chromosomes,\n        excluding any sex chromosomes.\n\n        **Mathematical Explanation**:\n\n        The Coefficient of Variation (CV) is defined as:\n\n        $$\n        \\text{CV} = \\frac{\\sigma}{\\mu}\n        $$\n\n        Where:\n        - \\( \\sigma \\) is the standard deviation of the mean abundances across autosomal chromosomes.\n        - \\( \\mu \\) is the mean of the mean abundances across autosomal chromosomes.\n\n        **Parameters**:\n\n        - `chr_to_sig` (`Dict[str, SnipeSig]`):  \n          A dictionary mapping chromosome names (e.g., `'autosomal-1'`, `'autosomal-2'`, `'sex-x'`, `'sex-y'`) to their corresponding\n          `SnipeSig` instances. Each `SnipeSig` should represent the k-mer signature of a specific chromosome.\n\n        **Returns**:\n\n        - `Dict[str, Any]`:  \n          A dictionary containing the computed metrics:\n              - `\"Autosomal_CV\"` (`float`):  \n                The coefficient of variation of mean abundances across autosomal chromosomes.\n\n        **Raises**:\n\n        - `ValueError`:  \n          If `chr_to_sig` is empty or if there is an inconsistency in the signatures' parameters.\n\n        **Usage Example**:\n\n        ```python\n        # Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances\n        chr_signatures = {\n            \"1\": sig_chr1,\n            \"2\": sig_chr2,\n            \"X\": sig_chrX,\n            \"Y\": sig_chrY\n        }\n\n        # Calculate chromosome metrics\n        metrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)\n\n        print(metrics)\n        # Output:\n        # {'Autosomal_CV': 0.15}\n        ```\n\n        **Notes**:\n\n        - **Exclusion of Sex Chromosomes**:  \n          Chromosomes with names containing the substring `\"sex\"` (e.g., `'sex-y'`, `'sex-x'`) are excluded from the CV calculation to focus solely on autosomal chromosomes.\n\n        - **Mean Abundance Calculation**:  \n          The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.\n        \"\"\"\n\n        # Implementation of the method\n        # let's make sure all chromosome sigs are unique\n        specific_chr_to_sig = SnipeSig.get_unique_signatures(chr_to_sig)\n\n        # calculate mean abundance for each chromosome and loaded sample sig\n        chr_to_mean_abundance = {}\n        self.logger.debug(\"Calculating mean abundance for each chromosome.\")\n        for chr_name, chr_sig in specific_chr_to_sig.items():\n            chr_sample_sig = self.sample_sig &amp; chr_sig\n            chr_stats = chr_sample_sig.get_sample_stats\n            chr_to_mean_abundance[chr_name] = chr_stats[\"mean_abundance\"]\n            self.logger.debug(\"\\t-Mean abundance for %s: %f\", chr_name, chr_stats[\"mean_abundance\"])\n\n\n        # chr_to_mean_abundance but without any chr with partial name sex\n        autosomal_chr_to_mean_abundance = {}\n        for chr_name, mean_abundance in chr_to_mean_abundance.items():\n            if \"sex\" in chr_name.lower():\n                continue\n            autosomal_chr_to_mean_abundance[chr_name] = mean_abundance\n\n\n        # calculate the CV for the whole sample\n        if autosomal_chr_to_mean_abundance:\n            mean_abundances = np.array(list(autosomal_chr_to_mean_abundance.values()), dtype=float)\n            cv = np.std(mean_abundances) / np.mean(mean_abundances) if np.mean(mean_abundances) != 0 else 0.0\n            self.chrs_stats.update({\"Autosomal_CV\": cv})\n            self.logger.debug(\"Calculated Autosomal CV: %f\", cv)\n        else:\n            self.logger.warning(\"No autosomal chromosomes were processed. 'Autosomal_CV' set to None.\")\n            self.chrs_stats.update({\"Autosomal_CV\": None})\n\n        # optional return, not required\n        return self.chrs_stats\n\n\n    def calculate_sex_chrs_metrics(self, genome_and_chr_to_sig: Dict[str, SnipeSig]) -&gt; Dict[str, Any]:\n        r\"\"\"\n        Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.\n\n        This method processes a collection of genome and chromosome-specific `SnipeSig` instances to compute\n        metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains\n        only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome.\n        The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to\n        accurately assess sex chromosome metrics.\n\n        **Mathematical Explanation**:\n\n        - **X-Ploidy Score**:\n\n          The X-Ploidy score is calculated using the formula:\n\n          $$\n          \\text{X-Ploidy} = \\left(\\frac{\\mu_X}{\\mu_{\\text{autosomal}}}\\right) \\times \\left(\\frac{N_{\\text{autosomal}}}{N_X}\\right)\n          $$\n\n          Where:\n          - \\( \\mu_X \\) is the mean abundance of X chromosome-specific k-mers in the sample.\n          - \\( \\mu_{\\text{autosomal}} \\) is the mean abundance of autosomal k-mers in the sample.\n          - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.\n          - \\( N_X \\) is the number of X chromosome-specific k-mers in the reference genome.\n\n        - **Y-Coverage**:\n\n          The Y-Coverage is calculated using the formula:\n\n          $$\n          \\text{Y-Coverage} = \\frac{\\left(\\frac{N_Y^{\\text{sample}}}{N_Y}\\right)}{\\left(\\frac{N_{\\text{autosomal}}^{\\text{sample}}}{N_{\\text{autosomal}}}\\right)}\n          $$\n\n          Where:\n          - \\( N_Y^{\\text{sample}} \\) is the number of Y chromosome-specific k-mers in the sample.\n          - \\( N_Y \\) is the number of Y chromosome-specific k-mers in the reference genome.\n          - \\( N_{\\text{autosomal}}^{\\text{sample}} \\) is the number of autosomal k-mers in the sample.\n          - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.\n\n        **Parameters**:\n\n            - `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  \n              A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include\n              the autosomal genome signature (with a name ending in `'-snipegenome'`) and chromosome-specific\n              signatures (e.g., `'sex-x'`, `'sex-y'`, `'autosome-1'`, `'autosome-2'`, etc.).\n\n        **Returns**:\n\n            - `Dict[str, Any]`:  \n              A dictionary containing the calculated sex-related metrics:\n                  - `\"X-Ploidy score\"` (`float`):  \n                    The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance\n                    to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.\n                  - `\"Y-Coverage\"` (`float`, optional):  \n                    The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.\n                    This key is present only if a Y chromosome signature is provided.\n\n        **Raises**:\n\n            - `ValueError`:  \n              - If the `'sex-x'` chromosome signature is not found in `genome_and_chr_to_sig`.\n              - If the autosomal genome signature is not found or improperly labeled.\n\n        **Usage Example**:\n\n        ```python\n        # Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances\n        genome_and_chr_signatures = {\n            \"autosomal-snipegenome\": sig_autosomal_genome,\n            \"1\": sig_chr1,\n            \"2\": sig_chr2,\n            \"sex-x\": sig_sex_x,\n            \"sex-y\": sig_sex_y\n        }\n\n        # Calculate sex chromosome metrics\n        metrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)\n\n        print(metrics)\n        # Output Example:\n        # {\n        #     \"X-Ploidy score\": 2.6667,\n        #     \"Y-Coverage\": 0.0\n        # }\n        ```\n\n        **Notes**:\n\n            - **Signature Naming Convention**:  \n              The autosomal genome signature must have a name ending with `'-snipegenome'`. Chromosome-specific\n              signatures should be named accordingly (e.g., `'sex-x'`, `'sex-y'`, `'autosomal-1'`, `'autosomal-2'`, etc.).\n\n            - **Exclusion of Sex Chromosomes from Autosomal Genome**:  \n              The Y chromosome signature (`'sex-y'`) is subtracted from the autosomal genome signature to ensure\n              that Y chromosome k-mers are not counted towards autosomal metrics.\n\n            - **Robustness**:  \n              The method includes comprehensive logging for debugging purposes, tracking each major step and\n              any exclusions made during processing.\n        \"\"\"\n\n        # Ensure that the chromosome X signature exists\n        if 'sex-x' not in genome_and_chr_to_sig:\n            self.logger.warning(\"Chromosome X ('sex-x') not found in the provided signatures. X-Ploidy score will be set to zero.\")\n            # set sex-x to an empty signature\n            genome_and_chr_to_sig['sex-x'] = SnipeSig.create_from_hashes_abundances(\n                hashes=np.array([], dtype=np.uint64),\n                abundances=np.array([], dtype=np.uint32),\n                ksize=genome_and_chr_to_sig[list(genome_and_chr_to_sig.keys())[0]].ksize,\n                scale=genome_and_chr_to_sig[list(genome_and_chr_to_sig.keys())[0]].scale,\n            )\n\n        # Separate the autosomal genome signature from chromosome-specific signatures\n        chr_to_sig: Dict[str, SnipeSig] = {}\n        autosomals_genome_sig: Optional[SnipeSig] = None\n        self.logger.debug(\"Separating autosomal genome signature from chromosome-specific signatures.\")\n\n        for name, sig in genome_and_chr_to_sig.items():\n            if name.endswith('-snipegenome'):\n                self.logger.debug(\"\\t- Identified autosomal genome signature: '%s'.\", name)\n                autosomals_genome_sig = sig\n            else:\n                chr_to_sig[name] = sig\n\n        if autosomals_genome_sig is None:\n            self.logger.error(\"Autosomal genome signature (ending with '-snipegenome') not found.\")\n            raise ValueError(\"Autosomal genome signature (ending with '-snipegenome') not found.\")\n\n        # Ensure all chromosome signatures have unique hashes\n        specific_chr_to_sig = SnipeSig.get_unique_signatures(chr_to_sig)\n\n        # Exclude Y chromosome from the autosomal genome signature if present\n        if 'sex-y' in chr_to_sig:\n            self.logger.debug(\"Y chromosome ('sex-y') detected. Removing its hashes from the autosomal genome signature.\")\n            self.logger.debug(\"\\t- Original autosomal genome size: %d hashes.\", len(autosomals_genome_sig))\n            autosomals_genome_sig = autosomals_genome_sig - chr_to_sig['sex-y']\n            self.logger.debug(\"\\t- Updated autosomal genome size after removing Y chromosome: %d hashes.\", len(autosomals_genome_sig))\n\n        # Remove X chromosome hashes from the autosomal genome signature\n        self.logger.debug(\"Removing X chromosome ('sex-x') hashes from the autosomal genome signature.\")\n        autosomals_genome_sig = autosomals_genome_sig - chr_to_sig['sex-x']\n        self.logger.debug(\"\\t- Updated autosomal genome size after removing X chromosome: %d hashes.\", len(autosomals_genome_sig))\n\n        # Derive the X chromosome-specific signature by subtracting autosomal genome hashes\n        specific_xchr_sig = specific_chr_to_sig[\"sex-x\"] - autosomals_genome_sig\n        self.logger.debug(\"\\t-Derived X chromosome-specific signature size: %d hashes.\", len(specific_xchr_sig))\n\n        # Intersect the sample signature with chromosome-specific signatures\n        sample_specific_xchr_sig = self.sample_sig &amp; specific_xchr_sig\n        if len(sample_specific_xchr_sig) == 0:\n            self.logger.warning(\"No X chromosome-specific k-mers found in the sample signature.\")\n        self.logger.debug(\"\\t-Intersected sample signature with X chromosome-specific k-mers = %d hashes.\", len(sample_specific_xchr_sig))\n        sample_autosomal_sig = self.sample_sig &amp; autosomals_genome_sig\n        self.logger.debug(\"\\t-Intersected sample signature with autosomal genome k-mers = %d hashes.\", len(sample_autosomal_sig))\n\n        # Retrieve mean abundances\n        xchr_mean_abundance = sample_specific_xchr_sig.get_sample_stats.get(\"mean_abundance\", 0.0)\n        autosomal_mean_abundance = sample_autosomal_sig.get_sample_stats.get(\"mean_abundance\", 0.0)\n\n        # Calculate X-Ploidy score\n        if autosomal_mean_abundance == 0:\n            self.logger.warning(\"Autosomal mean abundance is zero. Setting X-Ploidy score to zero to avoid division by zero.\")\n            xploidy_score = 0.0\n        else:\n            xploidy_score = (xchr_mean_abundance / autosomal_mean_abundance) * \\\n                            (len(autosomals_genome_sig) / len(specific_xchr_sig) if len(specific_xchr_sig) &gt; 0 else 0.0)\n\n        self.logger.debug(\"Calculated X-Ploidy score: %.4f\", xploidy_score)\n        self.sex_stats.update({\"X-Ploidy score\": xploidy_score})\n\n        # Calculate Y-Coverage if Y chromosome is present\n        if 'sex-y' in specific_chr_to_sig:\n            self.logger.debug(\"Calculating Y-Coverage based on Y chromosome-specific k-mers.\")\n\n            # Derive Y chromosome-specific k-mers by excluding autosomal and X chromosome k-mers\n            ychr_specific_kmers = chr_to_sig[\"sex-y\"] - autosomals_genome_sig - specific_xchr_sig\n            self.logger.debug(\"\\t-Derived Y chromosome-specific signature size: %d hashes.\", len(ychr_specific_kmers))\n\n            # Intersect Y chromosome-specific k-mers with the sample signature\n            ychr_in_sample = self.sample_sig &amp; ychr_specific_kmers\n            self.logger.debug(\"\\t-Intersected sample signature with Y chromosome-specific k-mers = %d hashes.\", len(ychr_in_sample))\n            if len(ychr_in_sample) == 0:\n                self.logger.warning(\"No Y chromosome-specific k-mers found in the sample signature.\")\n\n            # Derive autosomal-specific k-mers by excluding X and Y chromosome k-mers from the reference signature\n            autosomals_specific_kmers = self.reference_sig - specific_chr_to_sig[\"sex-x\"] - specific_chr_to_sig['sex-y']\n\n            # Calculate Y-Coverage metric\n            if len(ychr_specific_kmers) == 0 or len(autosomals_specific_kmers) == 0:\n                self.logger.warning(\"Insufficient k-mers for Y-Coverage calculation. Setting Y-Coverage to zero.\")\n                ycoverage = 0.0\n            else:\n                ycoverage = (len(ychr_in_sample) / len(ychr_specific_kmers)) / \\\n                        (len(sample_autosomal_sig) / len(autosomals_specific_kmers))\n\n            self.logger.debug(\"Calculated Y-Coverage: %.4f\", ycoverage)\n            self.sex_stats.update({\"Y-Coverage\": ycoverage})\n\n        return self.sex_stats\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.calculate_chromosome_metrics","title":"<code>calculate_chromosome_metrics(chr_to_sig)</code>","text":"<p>Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.</p> <p>This method computes the CV to assess the variability of mean abundances among autosomal chromosomes, excluding any sex chromosomes.</p> <p>Mathematical Explanation:</p> <p>The Coefficient of Variation (CV) is defined as:</p> \\[ \\text{CV} = \\frac{\\sigma}{\\mu} \\] <p>Where: - \\( \\sigma \\) is the standard deviation of the mean abundances across autosomal chromosomes. - \\( \\mu \\) is the mean of the mean abundances across autosomal chromosomes.</p> <p>Parameters:</p> <ul> <li><code>chr_to_sig</code> (<code>Dict[str, SnipeSig]</code>):   A dictionary mapping chromosome names (e.g., <code>'autosomal-1'</code>, <code>'autosomal-2'</code>, <code>'sex-x'</code>, <code>'sex-y'</code>) to their corresponding   <code>SnipeSig</code> instances. Each <code>SnipeSig</code> should represent the k-mer signature of a specific chromosome.</li> </ul> <p>Returns:</p> <ul> <li><code>Dict[str, Any]</code>:   A dictionary containing the computed metrics:<ul> <li><code>\"Autosomal_CV\"</code> (<code>float</code>):     The coefficient of variation of mean abundances across autosomal chromosomes.</li> </ul> </li> </ul> <p>Raises:</p> <ul> <li><code>ValueError</code>:   If <code>chr_to_sig</code> is empty or if there is an inconsistency in the signatures' parameters.</li> </ul> <p>Usage Example:</p> <pre><code># Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances\nchr_signatures = {\n    \"1\": sig_chr1,\n    \"2\": sig_chr2,\n    \"X\": sig_chrX,\n    \"Y\": sig_chrY\n}\n\n# Calculate chromosome metrics\nmetrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)\n\nprint(metrics)\n# Output:\n# {'Autosomal_CV': 0.15}\n</code></pre> <p>Notes:</p> <ul> <li> <p>Exclusion of Sex Chromosomes:   Chromosomes with names containing the substring <code>\"sex\"</code> (e.g., <code>'sex-y'</code>, <code>'sex-x'</code>) are excluded from the CV calculation to focus solely on autosomal chromosomes.</p> </li> <li> <p>Mean Abundance Calculation:   The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.</p> </li> </ul> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def calculate_chromosome_metrics(self, chr_to_sig: Dict[str, SnipeSig]) -&gt; Dict[str, Any]:\n    r\"\"\"\n    Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.\n\n    This method computes the CV to assess the variability of mean abundances among autosomal chromosomes,\n    excluding any sex chromosomes.\n\n    **Mathematical Explanation**:\n\n    The Coefficient of Variation (CV) is defined as:\n\n    $$\n    \\text{CV} = \\frac{\\sigma}{\\mu}\n    $$\n\n    Where:\n    - \\( \\sigma \\) is the standard deviation of the mean abundances across autosomal chromosomes.\n    - \\( \\mu \\) is the mean of the mean abundances across autosomal chromosomes.\n\n    **Parameters**:\n\n    - `chr_to_sig` (`Dict[str, SnipeSig]`):  \n      A dictionary mapping chromosome names (e.g., `'autosomal-1'`, `'autosomal-2'`, `'sex-x'`, `'sex-y'`) to their corresponding\n      `SnipeSig` instances. Each `SnipeSig` should represent the k-mer signature of a specific chromosome.\n\n    **Returns**:\n\n    - `Dict[str, Any]`:  \n      A dictionary containing the computed metrics:\n          - `\"Autosomal_CV\"` (`float`):  \n            The coefficient of variation of mean abundances across autosomal chromosomes.\n\n    **Raises**:\n\n    - `ValueError`:  \n      If `chr_to_sig` is empty or if there is an inconsistency in the signatures' parameters.\n\n    **Usage Example**:\n\n    ```python\n    # Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances\n    chr_signatures = {\n        \"1\": sig_chr1,\n        \"2\": sig_chr2,\n        \"X\": sig_chrX,\n        \"Y\": sig_chrY\n    }\n\n    # Calculate chromosome metrics\n    metrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)\n\n    print(metrics)\n    # Output:\n    # {'Autosomal_CV': 0.15}\n    ```\n\n    **Notes**:\n\n    - **Exclusion of Sex Chromosomes**:  \n      Chromosomes with names containing the substring `\"sex\"` (e.g., `'sex-y'`, `'sex-x'`) are excluded from the CV calculation to focus solely on autosomal chromosomes.\n\n    - **Mean Abundance Calculation**:  \n      The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.\n    \"\"\"\n\n    # Implementation of the method\n    # let's make sure all chromosome sigs are unique\n    specific_chr_to_sig = SnipeSig.get_unique_signatures(chr_to_sig)\n\n    # calculate mean abundance for each chromosome and loaded sample sig\n    chr_to_mean_abundance = {}\n    self.logger.debug(\"Calculating mean abundance for each chromosome.\")\n    for chr_name, chr_sig in specific_chr_to_sig.items():\n        chr_sample_sig = self.sample_sig &amp; chr_sig\n        chr_stats = chr_sample_sig.get_sample_stats\n        chr_to_mean_abundance[chr_name] = chr_stats[\"mean_abundance\"]\n        self.logger.debug(\"\\t-Mean abundance for %s: %f\", chr_name, chr_stats[\"mean_abundance\"])\n\n\n    # chr_to_mean_abundance but without any chr with partial name sex\n    autosomal_chr_to_mean_abundance = {}\n    for chr_name, mean_abundance in chr_to_mean_abundance.items():\n        if \"sex\" in chr_name.lower():\n            continue\n        autosomal_chr_to_mean_abundance[chr_name] = mean_abundance\n\n\n    # calculate the CV for the whole sample\n    if autosomal_chr_to_mean_abundance:\n        mean_abundances = np.array(list(autosomal_chr_to_mean_abundance.values()), dtype=float)\n        cv = np.std(mean_abundances) / np.mean(mean_abundances) if np.mean(mean_abundances) != 0 else 0.0\n        self.chrs_stats.update({\"Autosomal_CV\": cv})\n        self.logger.debug(\"Calculated Autosomal CV: %f\", cv)\n    else:\n        self.logger.warning(\"No autosomal chromosomes were processed. 'Autosomal_CV' set to None.\")\n        self.chrs_stats.update({\"Autosomal_CV\": None})\n\n    # optional return, not required\n    return self.chrs_stats\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.calculate_coverage_vs_depth","title":"<code>calculate_coverage_vs_depth(n=30)</code>","text":"<p>Calculate cumulative coverage index vs cumulative sequencing depth.</p> <p>This method simulates incremental sequencing by splitting the sample signature into <code>n</code> parts and calculating the cumulative coverage index at each step. It helps in understanding how coverage improves with increased sequencing depth.</p> <p>Mathematical Explanation:</p> <p>For each cumulative part \\( i \\) (where \\( 1 \\leq i \\leq n \\)):</p> <ul> <li> <p>Cumulative Sequencing Depth (\\( D_i \\)):   $$   D_i = \\sum_{j=1}^{i} a_j   $$   Where \\( a_j \\) is the total abundance of the \\( j^{th} \\) part.</p> </li> <li> <p>Cumulative Coverage Index (\\( C_i \\)):   $$   C_i = \\frac{\\text{Number of genomic unique k-mers in first } i \\text{ parts}}{\\left| \\text{Reference genome k-mer set} \\right|}   $$</p> </li> </ul> <p>Parameters:</p> <ul> <li><code>n</code> (<code>int</code>): Number of parts to split the signature into.</li> </ul> <p>Returns:</p> <ul> <li><code>List[Dict[str, Any]]</code>:   List of dictionaries containing:<ul> <li><code>\"cumulative_parts\"</code> (<code>int</code>): Number of parts included.</li> <li><code>\"cumulative_total_abundance\"</code> (<code>int</code>): Total sequencing depth up to this part.</li> <li><code>\"cumulative_coverage_index\"</code> (<code>float</code>): Coverage index up to this part.</li> </ul> </li> </ul> <p>Usage Example:</p> <pre><code>coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)\nfor data in coverage_depth_data:\n    print(data)\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def calculate_coverage_vs_depth(self, n: int = 30) -&gt; List[Dict[str, Any]]:\n    r\"\"\"\n    Calculate cumulative coverage index vs cumulative sequencing depth.\n\n    This method simulates incremental sequencing by splitting the sample signature into `n` parts and\n    calculating the cumulative coverage index at each step. It helps in understanding how coverage\n    improves with increased sequencing depth.\n\n    **Mathematical Explanation**:\n\n    For each cumulative part \\( i \\) (where \\( 1 \\leq i \\leq n \\)):\n\n    - **Cumulative Sequencing Depth** (\\( D_i \\)):\n      $$\n      D_i = \\sum_{j=1}^{i} a_j\n      $$\n      Where \\( a_j \\) is the total abundance of the \\( j^{th} \\) part.\n\n    - **Cumulative Coverage Index** (\\( C_i \\)):\n      $$\n      C_i = \\frac{\\text{Number of genomic unique k-mers in first } i \\text{ parts}}{\\left| \\text{Reference genome k-mer set} \\right|}\n      $$\n\n    **Parameters**:\n\n    - `n` (`int`): Number of parts to split the signature into.\n\n    **Returns**:\n\n    - `List[Dict[str, Any]]`:  \n      List of dictionaries containing:\n        - `\"cumulative_parts\"` (`int`): Number of parts included.\n        - `\"cumulative_total_abundance\"` (`int`): Total sequencing depth up to this part.\n        - `\"cumulative_coverage_index\"` (`float`): Coverage index up to this part.\n\n    **Usage Example**:\n\n    ```python\n    coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)\n    for data in coverage_depth_data:\n        print(data)\n    ```\n    \"\"\"\n    self.logger.debug(\"Calculating coverage vs depth with %d parts.\", n)\n    # Determine the ROI reference signature\n    if isinstance(self.amplicon_sig, SnipeSig):\n        roi_reference_sig = self.amplicon_sig\n        self.logger.debug(\"Using amplicon signature as ROI reference.\")\n    else:\n        roi_reference_sig = self.reference_sig\n        self.logger.debug(\"Using reference genome signature as ROI reference.\")\n\n    # Split the sample signature into n random parts\n    split_sigs = self.split_sig_randomly(n)\n\n    coverage_depth_data = []\n\n    cumulative_snipe_sig = split_sigs[0].copy()\n    cumulative_total_abundance = cumulative_snipe_sig.total_abundance\n\n    #! force conversion to GENOME\n    roi_reference_sig.sigtype = SigType.GENOME\n\n    # Compute initial coverage index\n    cumulative_qc = ReferenceQC(\n        sample_sig=cumulative_snipe_sig,\n        reference_sig=roi_reference_sig,\n        enable_logging=self.enable_logging\n    )\n    cumulative_stats = cumulative_qc.get_aggregated_stats()\n    cumulative_coverage_index = cumulative_stats[\"Genome coverage index\"]\n\n    coverage_depth_data.append({\n        \"cumulative_parts\": 1,\n        \"cumulative_total_abundance\": cumulative_total_abundance,\n        \"cumulative_coverage_index\": cumulative_coverage_index,\n    })\n\n    # Iterate over the rest of the parts\n    for i in range(1, n):\n        current_part = split_sigs[i]\n\n        # Add current part to cumulative signature\n        cumulative_snipe_sig += current_part\n        cumulative_total_abundance += current_part.total_abundance\n\n        # Compute new coverage index\n        cumulative_qc = ReferenceQC(\n            sample_sig=cumulative_snipe_sig,\n            reference_sig=roi_reference_sig,\n            enable_logging=self.enable_logging\n        )\n        cumulative_stats = cumulative_qc.get_aggregated_stats()\n        cumulative_coverage_index = cumulative_stats[\"Genome coverage index\"]\n\n        coverage_depth_data.append({\n            \"cumulative_parts\": i + 1,\n            \"cumulative_total_abundance\": cumulative_total_abundance,\n            \"cumulative_coverage_index\": cumulative_coverage_index,\n        })\n\n    self.logger.debug(\"Coverage vs depth calculation completed.\")\n    return coverage_depth_data\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.calculate_sex_chrs_metrics","title":"<code>calculate_sex_chrs_metrics(genome_and_chr_to_sig)</code>","text":"<p>Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.</p> <p>This method processes a collection of genome and chromosome-specific <code>SnipeSig</code> instances to compute metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome. The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to accurately assess sex chromosome metrics.</p> <p>Mathematical Explanation:</p> <ul> <li>X-Ploidy Score:</li> </ul> <p>The X-Ploidy score is calculated using the formula:</p> <p>$$   \\text{X-Ploidy} = \\left(\\frac{\\mu_X}{\\mu_{\\text{autosomal}}}\\right) \\times \\left(\\frac{N_{\\text{autosomal}}}{N_X}\\right)   $$</p> <p>Where:   - \\( \\mu_X \\) is the mean abundance of X chromosome-specific k-mers in the sample.   - \\( \\mu_{\\text{autosomal}} \\) is the mean abundance of autosomal k-mers in the sample.   - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.   - \\( N_X \\) is the number of X chromosome-specific k-mers in the reference genome.</p> <ul> <li>Y-Coverage:</li> </ul> <p>The Y-Coverage is calculated using the formula:</p> <p>$$   \\text{Y-Coverage} = \\frac{\\left(\\frac{N_Y<sup>{\\text{sample}}}{N_Y}\\right)}{\\left(\\frac{N_{\\text{autosomal}}</sup>   $$}}}{N_{\\text{autosomal}}}\\right)</p> <p>Where:   - \\( N_Y^{\\text{sample}} \\) is the number of Y chromosome-specific k-mers in the sample.   - \\( N_Y \\) is the number of Y chromosome-specific k-mers in the reference genome.   - \\( N_{\\text{autosomal}}^{\\text{sample}} \\) is the number of autosomal k-mers in the sample.   - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.</p> <p>Parameters:</p> <pre><code>- `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  \n  A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include\n  the autosomal genome signature (with a name ending in `'-snipegenome'`) and chromosome-specific\n  signatures (e.g., `'sex-x'`, `'sex-y'`, `'autosome-1'`, `'autosome-2'`, etc.).\n</code></pre> <p>Returns:</p> <pre><code>- `Dict[str, Any]`:  \n  A dictionary containing the calculated sex-related metrics:\n      - `\"X-Ploidy score\"` (`float`):  \n        The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance\n        to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.\n      - `\"Y-Coverage\"` (`float`, optional):  \n        The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.\n        This key is present only if a Y chromosome signature is provided.\n</code></pre> <p>Raises:</p> <pre><code>- `ValueError`:  \n  - If the `'sex-x'` chromosome signature is not found in `genome_and_chr_to_sig`.\n  - If the autosomal genome signature is not found or improperly labeled.\n</code></pre> <p>Usage Example:</p> <pre><code># Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances\ngenome_and_chr_signatures = {\n    \"autosomal-snipegenome\": sig_autosomal_genome,\n    \"1\": sig_chr1,\n    \"2\": sig_chr2,\n    \"sex-x\": sig_sex_x,\n    \"sex-y\": sig_sex_y\n}\n\n# Calculate sex chromosome metrics\nmetrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)\n\nprint(metrics)\n# Output Example:\n# {\n#     \"X-Ploidy score\": 2.6667,\n#     \"Y-Coverage\": 0.0\n# }\n</code></pre> <p>Notes:</p> <pre><code>- **Signature Naming Convention**:  \n  The autosomal genome signature must have a name ending with `'-snipegenome'`. Chromosome-specific\n  signatures should be named accordingly (e.g., `'sex-x'`, `'sex-y'`, `'autosomal-1'`, `'autosomal-2'`, etc.).\n\n- **Exclusion of Sex Chromosomes from Autosomal Genome**:  \n  The Y chromosome signature (`'sex-y'`) is subtracted from the autosomal genome signature to ensure\n  that Y chromosome k-mers are not counted towards autosomal metrics.\n\n- **Robustness**:  \n  The method includes comprehensive logging for debugging purposes, tracking each major step and\n  any exclusions made during processing.\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def calculate_sex_chrs_metrics(self, genome_and_chr_to_sig: Dict[str, SnipeSig]) -&gt; Dict[str, Any]:\n    r\"\"\"\n    Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.\n\n    This method processes a collection of genome and chromosome-specific `SnipeSig` instances to compute\n    metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains\n    only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome.\n    The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to\n    accurately assess sex chromosome metrics.\n\n    **Mathematical Explanation**:\n\n    - **X-Ploidy Score**:\n\n      The X-Ploidy score is calculated using the formula:\n\n      $$\n      \\text{X-Ploidy} = \\left(\\frac{\\mu_X}{\\mu_{\\text{autosomal}}}\\right) \\times \\left(\\frac{N_{\\text{autosomal}}}{N_X}\\right)\n      $$\n\n      Where:\n      - \\( \\mu_X \\) is the mean abundance of X chromosome-specific k-mers in the sample.\n      - \\( \\mu_{\\text{autosomal}} \\) is the mean abundance of autosomal k-mers in the sample.\n      - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.\n      - \\( N_X \\) is the number of X chromosome-specific k-mers in the reference genome.\n\n    - **Y-Coverage**:\n\n      The Y-Coverage is calculated using the formula:\n\n      $$\n      \\text{Y-Coverage} = \\frac{\\left(\\frac{N_Y^{\\text{sample}}}{N_Y}\\right)}{\\left(\\frac{N_{\\text{autosomal}}^{\\text{sample}}}{N_{\\text{autosomal}}}\\right)}\n      $$\n\n      Where:\n      - \\( N_Y^{\\text{sample}} \\) is the number of Y chromosome-specific k-mers in the sample.\n      - \\( N_Y \\) is the number of Y chromosome-specific k-mers in the reference genome.\n      - \\( N_{\\text{autosomal}}^{\\text{sample}} \\) is the number of autosomal k-mers in the sample.\n      - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.\n\n    **Parameters**:\n\n        - `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  \n          A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include\n          the autosomal genome signature (with a name ending in `'-snipegenome'`) and chromosome-specific\n          signatures (e.g., `'sex-x'`, `'sex-y'`, `'autosome-1'`, `'autosome-2'`, etc.).\n\n    **Returns**:\n\n        - `Dict[str, Any]`:  \n          A dictionary containing the calculated sex-related metrics:\n              - `\"X-Ploidy score\"` (`float`):  \n                The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance\n                to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.\n              - `\"Y-Coverage\"` (`float`, optional):  \n                The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.\n                This key is present only if a Y chromosome signature is provided.\n\n    **Raises**:\n\n        - `ValueError`:  \n          - If the `'sex-x'` chromosome signature is not found in `genome_and_chr_to_sig`.\n          - If the autosomal genome signature is not found or improperly labeled.\n\n    **Usage Example**:\n\n    ```python\n    # Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances\n    genome_and_chr_signatures = {\n        \"autosomal-snipegenome\": sig_autosomal_genome,\n        \"1\": sig_chr1,\n        \"2\": sig_chr2,\n        \"sex-x\": sig_sex_x,\n        \"sex-y\": sig_sex_y\n    }\n\n    # Calculate sex chromosome metrics\n    metrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)\n\n    print(metrics)\n    # Output Example:\n    # {\n    #     \"X-Ploidy score\": 2.6667,\n    #     \"Y-Coverage\": 0.0\n    # }\n    ```\n\n    **Notes**:\n\n        - **Signature Naming Convention**:  \n          The autosomal genome signature must have a name ending with `'-snipegenome'`. Chromosome-specific\n          signatures should be named accordingly (e.g., `'sex-x'`, `'sex-y'`, `'autosomal-1'`, `'autosomal-2'`, etc.).\n\n        - **Exclusion of Sex Chromosomes from Autosomal Genome**:  \n          The Y chromosome signature (`'sex-y'`) is subtracted from the autosomal genome signature to ensure\n          that Y chromosome k-mers are not counted towards autosomal metrics.\n\n        - **Robustness**:  \n          The method includes comprehensive logging for debugging purposes, tracking each major step and\n          any exclusions made during processing.\n    \"\"\"\n\n    # Ensure that the chromosome X signature exists\n    if 'sex-x' not in genome_and_chr_to_sig:\n        self.logger.warning(\"Chromosome X ('sex-x') not found in the provided signatures. X-Ploidy score will be set to zero.\")\n        # set sex-x to an empty signature\n        genome_and_chr_to_sig['sex-x'] = SnipeSig.create_from_hashes_abundances(\n            hashes=np.array([], dtype=np.uint64),\n            abundances=np.array([], dtype=np.uint32),\n            ksize=genome_and_chr_to_sig[list(genome_and_chr_to_sig.keys())[0]].ksize,\n            scale=genome_and_chr_to_sig[list(genome_and_chr_to_sig.keys())[0]].scale,\n        )\n\n    # Separate the autosomal genome signature from chromosome-specific signatures\n    chr_to_sig: Dict[str, SnipeSig] = {}\n    autosomals_genome_sig: Optional[SnipeSig] = None\n    self.logger.debug(\"Separating autosomal genome signature from chromosome-specific signatures.\")\n\n    for name, sig in genome_and_chr_to_sig.items():\n        if name.endswith('-snipegenome'):\n            self.logger.debug(\"\\t- Identified autosomal genome signature: '%s'.\", name)\n            autosomals_genome_sig = sig\n        else:\n            chr_to_sig[name] = sig\n\n    if autosomals_genome_sig is None:\n        self.logger.error(\"Autosomal genome signature (ending with '-snipegenome') not found.\")\n        raise ValueError(\"Autosomal genome signature (ending with '-snipegenome') not found.\")\n\n    # Ensure all chromosome signatures have unique hashes\n    specific_chr_to_sig = SnipeSig.get_unique_signatures(chr_to_sig)\n\n    # Exclude Y chromosome from the autosomal genome signature if present\n    if 'sex-y' in chr_to_sig:\n        self.logger.debug(\"Y chromosome ('sex-y') detected. Removing its hashes from the autosomal genome signature.\")\n        self.logger.debug(\"\\t- Original autosomal genome size: %d hashes.\", len(autosomals_genome_sig))\n        autosomals_genome_sig = autosomals_genome_sig - chr_to_sig['sex-y']\n        self.logger.debug(\"\\t- Updated autosomal genome size after removing Y chromosome: %d hashes.\", len(autosomals_genome_sig))\n\n    # Remove X chromosome hashes from the autosomal genome signature\n    self.logger.debug(\"Removing X chromosome ('sex-x') hashes from the autosomal genome signature.\")\n    autosomals_genome_sig = autosomals_genome_sig - chr_to_sig['sex-x']\n    self.logger.debug(\"\\t- Updated autosomal genome size after removing X chromosome: %d hashes.\", len(autosomals_genome_sig))\n\n    # Derive the X chromosome-specific signature by subtracting autosomal genome hashes\n    specific_xchr_sig = specific_chr_to_sig[\"sex-x\"] - autosomals_genome_sig\n    self.logger.debug(\"\\t-Derived X chromosome-specific signature size: %d hashes.\", len(specific_xchr_sig))\n\n    # Intersect the sample signature with chromosome-specific signatures\n    sample_specific_xchr_sig = self.sample_sig &amp; specific_xchr_sig\n    if len(sample_specific_xchr_sig) == 0:\n        self.logger.warning(\"No X chromosome-specific k-mers found in the sample signature.\")\n    self.logger.debug(\"\\t-Intersected sample signature with X chromosome-specific k-mers = %d hashes.\", len(sample_specific_xchr_sig))\n    sample_autosomal_sig = self.sample_sig &amp; autosomals_genome_sig\n    self.logger.debug(\"\\t-Intersected sample signature with autosomal genome k-mers = %d hashes.\", len(sample_autosomal_sig))\n\n    # Retrieve mean abundances\n    xchr_mean_abundance = sample_specific_xchr_sig.get_sample_stats.get(\"mean_abundance\", 0.0)\n    autosomal_mean_abundance = sample_autosomal_sig.get_sample_stats.get(\"mean_abundance\", 0.0)\n\n    # Calculate X-Ploidy score\n    if autosomal_mean_abundance == 0:\n        self.logger.warning(\"Autosomal mean abundance is zero. Setting X-Ploidy score to zero to avoid division by zero.\")\n        xploidy_score = 0.0\n    else:\n        xploidy_score = (xchr_mean_abundance / autosomal_mean_abundance) * \\\n                        (len(autosomals_genome_sig) / len(specific_xchr_sig) if len(specific_xchr_sig) &gt; 0 else 0.0)\n\n    self.logger.debug(\"Calculated X-Ploidy score: %.4f\", xploidy_score)\n    self.sex_stats.update({\"X-Ploidy score\": xploidy_score})\n\n    # Calculate Y-Coverage if Y chromosome is present\n    if 'sex-y' in specific_chr_to_sig:\n        self.logger.debug(\"Calculating Y-Coverage based on Y chromosome-specific k-mers.\")\n\n        # Derive Y chromosome-specific k-mers by excluding autosomal and X chromosome k-mers\n        ychr_specific_kmers = chr_to_sig[\"sex-y\"] - autosomals_genome_sig - specific_xchr_sig\n        self.logger.debug(\"\\t-Derived Y chromosome-specific signature size: %d hashes.\", len(ychr_specific_kmers))\n\n        # Intersect Y chromosome-specific k-mers with the sample signature\n        ychr_in_sample = self.sample_sig &amp; ychr_specific_kmers\n        self.logger.debug(\"\\t-Intersected sample signature with Y chromosome-specific k-mers = %d hashes.\", len(ychr_in_sample))\n        if len(ychr_in_sample) == 0:\n            self.logger.warning(\"No Y chromosome-specific k-mers found in the sample signature.\")\n\n        # Derive autosomal-specific k-mers by excluding X and Y chromosome k-mers from the reference signature\n        autosomals_specific_kmers = self.reference_sig - specific_chr_to_sig[\"sex-x\"] - specific_chr_to_sig['sex-y']\n\n        # Calculate Y-Coverage metric\n        if len(ychr_specific_kmers) == 0 or len(autosomals_specific_kmers) == 0:\n            self.logger.warning(\"Insufficient k-mers for Y-Coverage calculation. Setting Y-Coverage to zero.\")\n            ycoverage = 0.0\n        else:\n            ycoverage = (len(ychr_in_sample) / len(ychr_specific_kmers)) / \\\n                    (len(sample_autosomal_sig) / len(autosomals_specific_kmers))\n\n        self.logger.debug(\"Calculated Y-Coverage: %.4f\", ycoverage)\n        self.sex_stats.update({\"Y-Coverage\": ycoverage})\n\n    return self.sex_stats\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.distribute_kmers_random","title":"<code>distribute_kmers_random(original_dict, n)</code>  <code>staticmethod</code>","text":"<p>Distribute the k-mers randomly into <code>n</code> parts based on their abundances.</p> <p>This helper method performs the actual distribution of k-mers using a multinomial distribution.</p> <p>Mathematical Explanation:</p> <p>Given a k-mer with hash \\( h \\) and abundance \\( a_h \\), the distribution of its abundance across \\( n \\) parts is modeled as:</p> \\[ a_{h,1}, a_{h,2}, \\dots, a_{h,n} \\sim \\text{Multinomial}(a_h, p_1, p_2, \\dots, p_n) \\] <p>Where \\( p_i = \\frac{1}{n} \\) for all \\( i \\).</p> <p>Parameters:</p> <ul> <li><code>original_dict</code> (<code>Dict[int, int]</code>):   Dictionary mapping k-mer hashes to their abundances.</li> <li><code>n</code> (<code>int</code>): Number of parts to split into.</li> </ul> <p>Returns:</p> <ul> <li><code>List[Dict[int, int]]</code>:   List of dictionaries, each mapping k-mer hashes to their abundances in that part.</li> </ul> <p>Usage Example:</p> <pre><code>distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>@staticmethod\ndef distribute_kmers_random(original_dict: Dict[int, int], n: int) -&gt; List[Dict[int, int]]:\n    r\"\"\"\n    Distribute the k-mers randomly into `n` parts based on their abundances.\n\n    This helper method performs the actual distribution of k-mers using a multinomial distribution.\n\n    **Mathematical Explanation**:\n\n    Given a k-mer with hash \\( h \\) and abundance \\( a_h \\), the distribution of its abundance across \\( n \\)\n    parts is modeled as:\n\n    $$\n    a_{h,1}, a_{h,2}, \\dots, a_{h,n} \\sim \\text{Multinomial}(a_h, p_1, p_2, \\dots, p_n)\n    $$\n\n    Where \\( p_i = \\frac{1}{n} \\) for all \\( i \\).\n\n    **Parameters**:\n\n    - `original_dict` (`Dict[int, int]`):  \n      Dictionary mapping k-mer hashes to their abundances.\n    - `n` (`int`): Number of parts to split into.\n\n    **Returns**:\n\n    - `List[Dict[int, int]]`:  \n      List of dictionaries, each mapping k-mer hashes to their abundances in that part.\n\n    **Usage Example**:\n\n    ```python\n    distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)\n    ```\n    \"\"\"\n    # Initialize the resulting dictionaries\n    distributed_dicts = [{} for _ in range(n)]\n\n    # For each k-mer and its abundance\n    for kmer_hash, abundance in original_dict.items():\n        if abundance == 0:\n            continue  # Skip zero abundances\n        # Generate multinomial split of abundance\n        counts = np.random.multinomial(abundance, [1.0 / n] * n)\n        # Update each dictionary\n        for i in range(n):\n            if counts[i] &gt; 0:\n                distributed_dicts[i][kmer_hash] = counts[i]\n\n    return distributed_dicts\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.get_aggregated_stats","title":"<code>get_aggregated_stats(include_advanced=False)</code>","text":"<p>Retrieve aggregated statistics from the quality control analysis.</p> <p>Parameters</p> <ul> <li><code>include_advanced (bool)</code>:   If set to <code>True</code>, includes advanced metrics in the aggregated statistics.</li> </ul> <p>Returns</p> <ul> <li><code>Dict[str, Any]</code>:   A dictionary containing the aggregated statistics, which may include:</li> <li>Sample statistics</li> <li>Genome statistics</li> <li>Amplicon statistics (if provided)</li> <li>Predicted assay type</li> <li>Advanced statistics (if <code>include_advanced</code> is <code>True</code>)</li> </ul> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def get_aggregated_stats(self, include_advanced: bool = False) -&gt; Dict[str, Any]:\n    r\"\"\"\n    Retrieve aggregated statistics from the quality control analysis.\n\n    **Parameters**\n\n    - `include_advanced (bool)`:  \n      If set to `True`, includes advanced metrics in the aggregated statistics.\n\n    **Returns**\n\n    - `Dict[str, Any]`:  \n      A dictionary containing the aggregated statistics, which may include:\n      - Sample statistics\n      - Genome statistics\n      - Amplicon statistics (if provided)\n      - Predicted assay type\n      - Advanced statistics (if `include_advanced` is `True`)\n    \"\"\"\n    aggregated_stats: Dict[str, Any] = {}\n    # Include sample_stats\n    aggregated_stats.update(self.sample_stats)\n    # Include genome_stats\n    aggregated_stats.update(self.genome_stats)\n    # Include amplicon_stats if available\n    if self.amplicon_sig is not None:\n        self.logger.debug(\"While aggregating stats; amplicon signature provided.\")\n        aggregated_stats.update(self.amplicon_stats)\n        aggregated_stats[\"Predicted Assay Type\"] = self.predicted_assay_type\n\n    if self.chrs_stats:\n        aggregated_stats.update(self.chrs_stats)\n\n    if self.sex_stats:\n        aggregated_stats.update(self.sex_stats)\n\n    # Include advanced_stats if requested\n    if include_advanced:\n        self._calculate_advanced_stats()\n        aggregated_stats.update(self.advanced_stats)\n\n    return aggregated_stats\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.predict_coverage","title":"<code>predict_coverage(extra_fold, n=30)</code>","text":"<p>Predict the coverage index if additional sequencing is performed.</p> <p>This method estimates the potential increase in the genome coverage index when the sequencing depth is increased by a specified fold (extra sequencing). It does so by:</p> <ol> <li>Cumulative Coverage Calculation:</li> <li>Splitting the sample signature into <code>n</code> random parts to simulate incremental sequencing data.</li> <li> <p>Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.</p> </li> <li> <p>Saturation Curve Fitting:</p> </li> <li>Modeling the relationship between cumulative coverage and cumulative sequencing depth using     a hyperbolic saturation function.</li> <li> <p>The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.</p> </li> <li> <p>Coverage Prediction:</p> </li> <li>Using the fitted model to predict the coverage index at an increased sequencing depth (current depth     multiplied by <code>1 + extra_fold</code>).</li> </ol> <p>Mathematical Explanation:</p> <ul> <li>Saturation Model: The coverage index \\( C \\) as a function of sequencing depth \\( D \\) is modeled using the function:</li> </ul> \\[ C(D) = \\frac{a \\cdot D}{b + D} \\] <p>Where: - \\( a \\) and \\( b \\) are parameters estimated from the data. - \\( D \\) is the cumulative sequencing depth (total abundance). - \\( C(D) \\) is the cumulative coverage index at depth \\( D \\).</p> <ul> <li> <p>Parameter Estimation: The parameters \\( a \\) and \\( b \\) are determined by fitting the model to the observed cumulative coverage and depth data using non-linear least squares optimization.</p> </li> <li> <p>Coverage Prediction: The predicted coverage index \\( C_{\\text{pred}} \\) at an increased sequencing depth \\( D_{\\text{pred}} \\) is calculated as:</p> </li> </ul> \\[ D_{\\text{pred}} = D_{\\text{current}} \\times (1 + \\text{extra\\_fold}) \\] \\[ C_{\\text{pred}} = \\frac{a \\cdot D_{\\text{pred}}}{b + D_{\\text{pred}}} \\] <p>Parameters:</p> <ul> <li> <p><code>extra_fold</code> (float):   The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling   the current sequencing depth.</p> </li> <li> <p><code>n</code> (int, optional):   The number of parts to split the sample signature into for modeling the saturation curve.   Default is 30.</p> </li> </ul> <p>Returns:     - <code>float</code>:       The predicted genome coverage index at the increased sequencing depth.</p> <p>Raises:     - <code>RuntimeError</code>:       If the saturation model fails to converge during curve fitting.</p> <p>Usage Example:</p> <pre><code># Create a ReferenceQC instance with sample and reference signatures\nqc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)\n\n# Predict coverage index after increasing sequencing depth by 50%\npredicted_coverage = qc.predict_coverage(extra_fold=0.5)\n\nprint(f\"Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}\")\n</code></pre> <p>Implementation Details:</p> <ul> <li> <p>Splitting the Sample Signature:</p> <ul> <li>The sample signature is split into <code>n</code> random parts using a multinomial distribution based on k-mer abundances.</li> <li>Each part represents an incremental addition of sequencing data.</li> </ul> </li> <li> <p>Cumulative Calculations:</p> <ul> <li>At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.</li> </ul> </li> <li> <p>Curve Fitting:</p> <ul> <li>The <code>scipy.optimize.curve_fit</code> function is used to fit the saturation model to the cumulative data.</li> <li>Initial parameter guesses are based on the observed data to aid convergence.</li> </ul> </li> </ul> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def predict_coverage(self, extra_fold: float, n: int = 30) -&gt; float:\n    r\"\"\"\n    Predict the coverage index if additional sequencing is performed.\n\n    This method estimates the potential increase in the genome coverage index when the sequencing depth\n    is increased by a specified fold (extra sequencing). It does so by:\n\n    1. **Cumulative Coverage Calculation**:\n    - Splitting the sample signature into `n` random parts to simulate incremental sequencing data.\n    - Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.\n\n    2. **Saturation Curve Fitting**:\n    - Modeling the relationship between cumulative coverage and cumulative sequencing depth using\n        a hyperbolic saturation function.\n    - The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.\n\n    3. **Coverage Prediction**:\n    - Using the fitted model to predict the coverage index at an increased sequencing depth (current depth\n        multiplied by `1 + extra_fold`).\n\n    **Mathematical Explanation**:\n\n    - **Saturation Model**:\n    The coverage index \\( C \\) as a function of sequencing depth \\( D \\) is modeled using the function:\n\n    $$\n    C(D) = \\frac{a \\cdot D}{b + D}\n    $$\n\n    Where:\n    - \\( a \\) and \\( b \\) are parameters estimated from the data.\n    - \\( D \\) is the cumulative sequencing depth (total abundance).\n    - \\( C(D) \\) is the cumulative coverage index at depth \\( D \\).\n\n    - **Parameter Estimation**:\n    The parameters \\( a \\) and \\( b \\) are determined by fitting the model to the observed cumulative\n    coverage and depth data using non-linear least squares optimization.\n\n    - **Coverage Prediction**:\n    The predicted coverage index \\( C_{\\text{pred}} \\) at an increased sequencing depth \\( D_{\\text{pred}} \\)\n    is calculated as:\n\n    $$\n    D_{\\text{pred}} = D_{\\text{current}} \\times (1 + \\text{extra\\_fold})\n    $$\n\n    $$\n    C_{\\text{pred}} = \\frac{a \\cdot D_{\\text{pred}}}{b + D_{\\text{pred}}}\n    $$\n\n    **Parameters**:\n\n    - `extra_fold` (*float*):  \n      The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling\n      the current sequencing depth.\n\n    - `n` (*int, optional*):  \n      The number of parts to split the sample signature into for modeling the saturation curve.\n      Default is 30.\n\n    **Returns**:\n        - `float`:  \n          The predicted genome coverage index at the increased sequencing depth.\n\n    **Raises**:\n        - `RuntimeError`:  \n          If the saturation model fails to converge during curve fitting.\n\n    **Usage Example**:\n\n    ```python\n    # Create a ReferenceQC instance with sample and reference signatures\n    qc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)\n\n    # Predict coverage index after increasing sequencing depth by 50%\n    predicted_coverage = qc.predict_coverage(extra_fold=0.5)\n\n    print(f\"Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}\")\n    ```\n\n    **Implementation Details**:\n\n    - **Splitting the Sample Signature**:\n        - The sample signature is split into `n` random parts using a multinomial distribution based on k-mer abundances.\n        - Each part represents an incremental addition of sequencing data.\n\n    - **Cumulative Calculations**:\n        - At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.\n\n    - **Curve Fitting**:\n        - The `scipy.optimize.curve_fit` function is used to fit the saturation model to the cumulative data.\n        - Initial parameter guesses are based on the observed data to aid convergence.\n    \"\"\"\n    if extra_fold &lt; 1:\n        raise ValueError(\"extra_fold must be &gt;= 1.0.\")\n\n    if n &lt; 1 or not isinstance(n, int):\n        raise ValueError(\"n must be a positive integer.\")\n\n    self.logger.debug(\"Predicting coverage with extra fold: %f\", extra_fold)\n    coverage_depth_data = self.calculate_coverage_vs_depth(n=n)\n\n    # Extract cumulative total abundance and coverage index\n    x_data = np.array([d[\"cumulative_total_abundance\"] for d in coverage_depth_data])\n    y_data = np.array([d[\"cumulative_coverage_index\"] for d in coverage_depth_data])\n\n    # Saturation model function\n    def saturation_model(x, a, b):\n        return a * x / (b + x)\n\n    # Initial parameter guesses\n    initial_guess = [y_data[-1], x_data[int(len(x_data) / 2)]]\n\n    # Fit the model to the data\n    try:\n        with warnings.catch_warnings():\n            warnings.simplefilter(\"error\", OptimizeWarning)\n            params, covariance = curve_fit(\n                saturation_model,\n                x_data,\n                y_data,\n                p0=initial_guess,\n                bounds=(0, np.inf),\n                maxfev=10000\n            )\n    except (RuntimeError, OptimizeWarning) as exc:\n        self.logger.error(\"Curve fitting failed.\")\n        raise RuntimeError(\"Saturation model fitting failed. Cannot predict coverage.\") from exc\n\n    # Check if covariance contains inf or nan\n    if np.isinf(covariance).any() or np.isnan(covariance).any():\n        self.logger.error(\"Covariance of parameters could not be estimated.\")\n        raise RuntimeError(\"Saturation model fitting failed. Cannot predict coverage.\")\n\n    a, b = params\n\n    # Predict coverage at increased sequencing depth\n    total_abundance = x_data[-1]\n    predicted_total_abundance = total_abundance * (1 + extra_fold)\n    predicted_coverage = saturation_model(predicted_total_abundance, a, b)\n\n    # Ensure the predicted coverage does not exceed maximum possible coverage\n    max_coverage = 1.0  # Coverage index cannot exceed 1\n    predicted_coverage = min(predicted_coverage, max_coverage)\n\n    self.logger.debug(\"Predicted coverage at %.2f-fold increase: %f\", extra_fold, predicted_coverage)\n    return predicted_coverage\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.split_sig_randomly","title":"<code>split_sig_randomly(n)</code>","text":"<p>Split the sample signature into <code>n</code> random parts based on abundances.</p> <p>This method distributes the k-mers of the sample signature into <code>n</code> parts using a multinomial distribution based on their abundances. Each k-mer's abundance is split across the <code>n</code> parts proportionally.</p> <p>Mathematical Explanation:</p> <p>For each k-mer with hash \\( h \\) and abundance \\( a_h \\), its abundance is distributed into \\( n \\) parts according to a multinomial distribution. Specifically, the abundance in each part \\( i \\) is given by:</p> \\[ a_{h,i} \\sim \\text{Multinomial}(a_h, \\frac{1}{n}, \\frac{1}{n}, \\dots, \\frac{1}{n}) \\] <p>Where: - \\( a_{h,i} \\) is the abundance of k-mer \\( h \\) in part \\( i \\). - Each \\( a_{h,i} \\) is a non-negative integer such that \\( \\sum_{i=1}^{n} a_{h,i} = a_h \\).</p> <p>Parameters:</p> <ul> <li><code>n</code> (<code>int</code>): Number of parts to split into.</li> </ul> <p>Returns:</p> <ul> <li><code>List[SnipeSig]</code>:   List of <code>SnipeSig</code> instances representing the split parts.</li> </ul> <p>Usage Example:</p> <pre><code>split_sigs = qc.split_sig_randomly(n=3)\nfor idx, sig in enumerate(split_sigs, 1):\n    print(f\"Signature part {idx}: {sig}\")\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def split_sig_randomly(self, n: int) -&gt; List[SnipeSig]:\n    r\"\"\"\n    Split the sample signature into `n` random parts based on abundances.\n\n    This method distributes the k-mers of the sample signature into `n` parts using a multinomial distribution\n    based on their abundances. Each k-mer's abundance is split across the `n` parts proportionally.\n\n    **Mathematical Explanation**:\n\n    For each k-mer with hash \\( h \\) and abundance \\( a_h \\), its abundance is distributed into \\( n \\) parts\n    according to a multinomial distribution. Specifically, the abundance in each part \\( i \\) is given by:\n\n    $$\n    a_{h,i} \\sim \\text{Multinomial}(a_h, \\frac{1}{n}, \\frac{1}{n}, \\dots, \\frac{1}{n})\n    $$\n\n    Where:\n    - \\( a_{h,i} \\) is the abundance of k-mer \\( h \\) in part \\( i \\).\n    - Each \\( a_{h,i} \\) is a non-negative integer such that \\( \\sum_{i=1}^{n} a_{h,i} = a_h \\).\n\n    **Parameters**:\n\n    - `n` (`int`): Number of parts to split into.\n\n    **Returns**:\n\n    - `List[SnipeSig]`:  \n      List of `SnipeSig` instances representing the split parts.\n\n    **Usage Example**:\n\n    ```python\n    split_sigs = qc.split_sig_randomly(n=3)\n    for idx, sig in enumerate(split_sigs, 1):\n        print(f\"Signature part {idx}: {sig}\")\n    ```\n    \"\"\"\n    self.logger.debug(\"Splitting sample signature into %d random parts.\", n)\n    # Get k-mers and abundances\n    hash_to_abund = dict(zip(self.sample_sig.hashes, self.sample_sig.abundances))\n    random_split_sigs = self.distribute_kmers_random(hash_to_abund, n)\n    split_sigs = [\n        SnipeSig.create_from_hashes_abundances(\n            hashes=np.array(list(kmer_dict.keys()), dtype=np.uint64),\n            abundances=np.array(list(kmer_dict.values()), dtype=np.uint32),\n            ksize=self.sample_sig.ksize,\n            scale=self.sample_sig.scale,\n            name=f\"{self.sample_sig.name}_part_{i+1}\",\n            filename=self.sample_sig.filename,\n            enable_logging=self.enable_logging\n        )\n        for i, kmer_dict in enumerate(random_split_sigs)\n    ]\n    return split_sigs\n</code></pre>"},{"location":"SnipeSig/","title":"Python API Documentation","text":""},{"location":"SnipeSig/#snipe.api.SnipeSig","title":"<code>SnipeSig</code>","text":"<p>A class to handle Sourmash signatures with additional functionalities such as customized set operations and abundance management.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>class SnipeSig:\n    \"\"\"\n    A class to handle Sourmash signatures with additional functionalities\n    such as customized set operations and abundance management.\n    \"\"\"\n\n    def _try_load_from_json(self, sourmash_sig: str) -&gt; Union[List[sourmash.signature.SourmashSignature], None]:\n        r\"\"\"\n        Attempt to load sourmash signature from JSON string.\n\n        Parameters:\n            sourmash_sig (str): JSON string representing a sourmash signature.\n\n        Returns:\n            sourmash.signature.SourmashSignature or None if loading fails.\n        \"\"\"\n        try:\n            self.logger.debug(\"Trying to load sourmash signature from JSON.\")\n            list_of_sigs = list(sourmash.load_signatures_from_json(sourmash_sig))\n            return {sig.name: sig for sig in list_of_sigs}\n        except Exception as e:\n            self.logger.debug(\"Loading from JSON failed. Proceeding to file loading.\", exc_info=e)\n            return None  # Return None to indicate failure\n\n    def _try_load_from_file(self, sourmash_sig_path: str) -&gt; Union[List[sourmash.signature.SourmashSignature], None]:\n        r\"\"\"\n        Attempt to load sourmash signature(s) from a file.\n\n        Parameters:\n            sourmash_sig_path (str): File path to a sourmash signature.\n\n        Returns:\n            sourmash.signature.Sourmash\u00dfSignature, list of sourmash.signature.SourmashSignature, or None if loading fails.\n        \"\"\"\n        self.logger.debug(\"Trying to load sourmash signature from file.\")\n        try:\n            signatures = list(sourmash.load_file_as_signatures(sourmash_sig_path))\n            self.logger.debug(\"Loaded %d sourmash signature(s) from file.\", len(signatures))\n            sigs_dict = {_sig.name: _sig for _sig in signatures}\n            self.logger.debug(\"Loaded sourmash signatures into sigs_dict: %s\", sigs_dict)\n            return sigs_dict\n        except Exception as e:\n            self.logger.exception(\"Failed to load the sourmash signature from the file.\", exc_info=e)\n            raise ValueError(\"An unexpected error occurred while loading the sourmash signature.\") from e\n\n\n    def __init__(self, *, sourmash_sig: Union[str, sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature],\n                 ksize: int = 51, scale: int = 10000, sig_type=SigType.SAMPLE, enable_logging: bool = False, **kwargs):\n        r\"\"\"\n        Initialize the SnipeSig with a sourmash signature object or a path to a signature.\n\n        Parameters:\n            sourmash_sig (str or sourmash.signature.SourmashSignature): A path to a signature file or a signature object.\n            ksize (int): K-mer size.\n            scale (int): Scale value.\n            sig_type (SigType): Type of the signature.\n            enable_logging (bool): Flag to enable detailed logging.\n            **kwargs: Additional keyword arguments.\n        \"\"\"\n        # Initialize logging based on the flag\n        self.logger = logging.getLogger(self.__class__.__name__)\n\n        # Configure the logger\n        if enable_logging:\n            self.logger.setLevel(logging.DEBUG)\n            if not self.logger.hasHandlers():\n                # Create console handler\n                ch = logging.StreamHandler()\n                ch.setLevel(logging.DEBUG)\n                # Create formatter\n                formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')\n                # Add formatter to handler\n                ch.setFormatter(formatter)\n                # Add handler to logger\n                self.logger.addHandler(ch)\n            self.logger.debug(\"Logging is enabled for SnipeSig.\")\n        else:\n            self.logger.setLevel(logging.CRITICAL)\n\n        # Initialize internal variables\n        self.logger.debug(\"Initializing SnipeSig with sourmash_sig: %s\", sourmash_sig)\n\n        self._scale = scale\n        self._ksize = ksize\n        self._md5sum = None\n        self._hashes = np.array([], dtype=np.uint64)\n        self._abundances = np.array([], dtype=np.uint32)\n        self._type = sig_type\n        self._name = None\n        self._filename = None\n        self._track_abundance = False\n\n        sourmash_sigs: Dict[str, sourmash.signature.SourmashSignature] = {}\n        _sourmash_sig: Union[sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature] = None\n\n\n        self.logger.debug(\"Proceeding with a sigtype of %s\", sig_type)\n\n\n\n\n\n\n        if not isinstance(sourmash_sig, (str, sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature)):\n            # if the str is not a file path\n            self.logger.error(\"Invalid type for sourmash_sig: %s\", type(sourmash_sig).__name__)\n            raise TypeError(f\"sourmash_sig must be a file path, sourmash.signature.SourmashSignature, or Frozensourmash_signature, got {type(sourmash_sig).__name__}\")\n\n        # Case 1: If sourmash_sig is already a valid sourmash signature object\n        if isinstance(sourmash_sig, (sourmash.signature.FrozenSourmashSignature, sourmash.signature.SourmashSignature)):\n            self.logger.debug(\"Loaded sourmash signature directly from object.\")\n            sourmash_sigs = {sourmash_sig.name: sourmash_sig}\n\n        # Case 2: If sourmash_sig is a string, try to load as JSON or a file\n        elif isinstance(sourmash_sig, str):\n            self.logger.debug(\"Attempting to load sourmash signature from string input.\")\n\n            # First, try loading from JSON\n            sourmash_sigs = self._try_load_from_json(sourmash_sig)\n            self.logger.debug(\"Loaded sourmash signature from JSON: %s\", sourmash_sigs)\n\n            # If JSON loading fails, try loading from file\n            if not sourmash_sigs:\n                sourmash_sigs = self._try_load_from_file(sourmash_sig)\n\n            # If both attempts fail, raise an error\n            if not sourmash_sigs:\n                self.logger.error(\"Failed to load sourmash signature from the provided string.\")\n                raise ValueError(\"An unexpected error occurred while loading the sourmash signature.\")\n\n        if sig_type == SigType.SAMPLE or sig_type == SigType.AMPLICON:\n            if len(sourmash_sigs) &gt; 1:\n                self.logger.debug(\"Multiple signatures found in the input. Expected a single sample signature.\")\n                # not supported at this time\n                raise ValueError(\"Loading multiple sample signatures is not supported at this time.\")\n            elif len(sourmash_sigs) == 1:\n                self.logger.debug(\"Found a single signature in the sample sig input; Will use this signature.\")\n                _sourmash_sig = list(sourmash_sigs.values())[0]\n            else:\n                self.logger.debug(\"No signature found in the input. Expected a single sample signature.\")\n                raise ValueError(\"No signature found in the input. Expected a single sample signature.\")\n\n        elif sig_type == SigType.GENOME:\n            if len(sourmash_sigs) &gt; 1:\n                for signame, sig in sourmash_sigs.items():\n                    if signame.endswith(\"-snipegenome\"):\n                        sig = sig.to_mutable()\n                        sig.name = sig.name.replace(\"-snipegenome\", \"\")\n                        self.logger.debug(\"Found a genome signature with a snipe modified name. Restoring original name `%s`.\", sig.name)\n                        _sourmash_sig = sig\n                        break\n                else:\n                    self.logger.debug(\"Found multiple signature per the genome file, but none with a snipe modified name.\")\n                    raise ValueError(\"Found multiple signature per the genome file, but none with a snipe modified name.\")\n            elif len(sourmash_sigs) == 1:\n                self.logger.debug(\"Found a single signature in the genome sig input; Will use this signature.\")\n                _sourmash_sig = list(sourmash_sigs.values())[0]\n        else:\n            self.logger.debug(\"Unknown sigtype: %s\", sig_type)\n            raise ValueError(f\"Unknown sigtype: {sig_type}\")\n\n        self.logger.debug(\"Length of currently loaded signature: %d, with name: %s\", len(_sourmash_sig), _sourmash_sig.name)\n\n        # Extract properties from the loaded signature\n        self._ksize = _sourmash_sig.minhash.ksize\n        self._scale = _sourmash_sig.minhash.scaled\n        self._md5sum = _sourmash_sig.md5sum()\n        self._name = _sourmash_sig.name\n        self._filename = _sourmash_sig.filename\n        self._track_abundance = _sourmash_sig.minhash.track_abundance\n\n        # If the signature does not track abundance, assume abundance of 1 for all hashes\n        if not self._track_abundance:\n            self.logger.debug(\"Signature does not track abundance. Setting all abundances to 1.\")\n            self._abundances = np.ones(len(_sourmash_sig.minhash.hashes), dtype=np.uint32)\n            # self._track_abundance = True\n        else:\n            self._abundances = np.array(list(_sourmash_sig.minhash.hashes.values()), dtype=np.uint32)\n\n        self._hashes = np.array(list(_sourmash_sig.minhash.hashes.keys()), dtype=np.uint64)\n\n        # Sort the hashes and rearrange abundances accordingly\n        sorted_indices = np.argsort(self._hashes)\n        self._hashes = self._hashes[sorted_indices]\n        self._abundances = self._abundances[sorted_indices]\n\n        self.logger.debug(\n            \"Loaded sourmash signature from file: %s, name: %s, md5sum: %s, ksize: %d, scale: %d, \"\n            \"track_abundance: %s, type: %s, length: %d\",\n            self._filename, self._name, self._md5sum, self._ksize, self._scale,\n            self._track_abundance, self._type, len(self._hashes)\n        )\n        self.logger.debug(\"Hashes sorted during initialization.\")\n        self.logger.debug(\"Sourmash signature loading completed successfully.\")\n\n    # Setters and getters\n    @property\n    def hashes(self) -&gt; np.ndarray:\n        r\"\"\"Return a copy of the hashes array.\"\"\"\n        return self._hashes.view()\n\n    @property\n    def abundances(self) -&gt; np.ndarray:\n        r\"\"\"Return a copy of the abundances array.\"\"\"\n        return self._abundances.view()\n\n    @property\n    def md5sum(self) -&gt; str:\n        r\"\"\"Return the MD5 checksum of the signature.\"\"\"\n        return self._md5sum\n\n    @property\n    def ksize(self) -&gt; int:\n        r\"\"\"Return the k-mer size.\"\"\"\n        return self._ksize\n\n    @property\n    def scale(self) -&gt; int:\n        r\"\"\"Return the scale value.\"\"\"\n        return self._scale\n\n    @property\n    def name(self) -&gt; str:\n        r\"\"\"Return the name of the signature.\"\"\"\n        return self._name\n\n    @property\n    def filename(self) -&gt; str:\n        r\"\"\"Return the filename of the signature.\"\"\"\n        return self._filename\n\n    @property\n    def sigtype(self) -&gt; SigType:\n        r\"\"\"Return the type of the signature.\"\"\"\n        return self._type\n\n    @property\n    def track_abundance(self) -&gt; bool:\n        r\"\"\"Return whether the signature tracks abundance.\"\"\"\n        return self._track_abundance\n\n    # Basic class methods\n    def get_name(self) -&gt; str:\n        r\"\"\"Get the name of the signature.\"\"\"\n        return self._name\n\n    # setter sigtype\n    @sigtype.setter\n    def sigtype(self, sigtype: SigType):\n        r\"\"\"\n        Set the type of the signature.\n        \"\"\"\n        self._type = sigtype\n\n    def get_info(self) -&gt; dict:\n        r\"\"\"\n        Get information about the signature.\n\n        Returns:\n            dict: A dictionary containing signature information.\n        \"\"\"\n        info = {\n            \"name\": self._name,\n            \"filename\": self._filename,\n            \"md5sum\": self._md5sum,\n            \"ksize\": self._ksize,\n            \"scale\": self._scale,\n            \"track_abundance\": self._track_abundance,\n            \"sigtype\": self._type,\n            \"num_hashes\": len(self._hashes)\n        }\n        return info\n\n    def __len__(self) -&gt; int:\n        r\"\"\"Return the number of hashes in the signature.\"\"\"\n        return len(self._hashes)\n\n    def __iter__(self) -&gt; Iterator[tuple]:\n        r\"\"\"\n        Iterate over the hashes and their abundances.\n\n        Yields:\n            tuple: A tuple containing (hash, abundance).\n        \"\"\"\n        for h, a in zip(self._hashes, self._abundances):\n            yield (h, a)\n\n    def __contains__(self, hash_value: int) -&gt; bool:\n        r\"\"\"\n        Check if a hash is present in the signature.\n\n        Parameters:\n            hash_value (int): The hash value to check.\n\n        Returns:\n            bool: True if the hash is present, False otherwise.\n        \"\"\"\n        # Utilize binary search since hashes are sorted\n        index = np.searchsorted(self._hashes, hash_value)\n        if index &lt; len(self._hashes) and self._hashes[index] == hash_value:\n            return True\n        return False\n\n    def __repr__(self) -&gt; str:\n        return (f\"SnipeSig(name={self._name}, ksize={self._ksize}, scale={self._scale}, \"\n                f\"type={self._type}, num_hashes={len(self._hashes)})\")\n\n    def __str__(self) -&gt; str:\n        return self.__repr__()\n\n    def __verify_snipe_signature(self, other: 'SnipeSig'):\n        r\"\"\"\n        Verify that the other object is a SnipeSig instance.\n\n        Parameters:\n            other (SnipeSig): The other signature to verify.\n\n        Raises:\n            ValueError: If the other object is not a SnipeSig instance.\n        \"\"\"\n        if not isinstance(other, SnipeSig):\n            msg = f\"Provided sig ({type(other).__name__}) is not a SnipeSig instance.\"\n            self.logger.error(msg)\n            raise ValueError(msg)\n\n    def __verify_matching_ksize_scale(self, other: 'SnipeSig'):\n        r\"\"\"\n        Verify that the ksize and scale match between two signatures.\n\n        Parameters:\n            other (SnipeSig): The other signature to compare.\n\n        Raises:\n            ValueError: If ksize or scale do not match.\n        \"\"\"\n        if self._ksize != other.ksize:\n            _e_msg = f\"K-mer size does not match between the two signatures: {self._ksize} vs {other.ksize}.\"\n            self.logger.error(_e_msg)\n            raise ValueError(_e_msg)\n        if self._scale != other.scale:\n            _e_msg = f\"Scale value does not match between the two signatures: {self._scale} vs {other.scale}.\"\n            self.logger.error(_e_msg)\n            raise ValueError(_e_msg)\n\n    def _validate_abundance_operation(self, value: Union[int, None], operation: str):\n        r\"\"\"\n        Validate that the signature tracks abundance and that the provided value is a non-negative integer.\n\n        Parameters:\n            value (int or None): The abundance value to validate. Can be None for operations that don't require a value.\n            operation (str): Description of the operation for logging purposes.\n\n        Raises:\n            ValueError: If the signature does not track abundance or if the value is invalid.\n        \"\"\"\n        if not self._track_abundance and self.sigtype == SigType.SAMPLE:\n            self.logger.error(\"Cannot %s: signature does not track abundance.\", operation)\n            raise ValueError(\"Signature does not track abundance.\")\n\n        if value is not None:\n            if not isinstance(value, int) or value &lt; 0:\n                self.logger.error(\"%s requires a non-negative integer value.\", operation.capitalize())\n                raise ValueError(f\"{operation.capitalize()} requires a non-negative integer value.\")\n\n    # Mask application method\n    def _apply_mask(self, mask: np.ndarray):\n        r\"\"\"\n        Apply a boolean mask to the hashes and abundances arrays.\n        Ensures that the sorted order is preserved.\n\n        Parameters:\n            mask (np.ndarray): Boolean array indicating which elements to keep.\n        \"\"\"\n        self._hashes = self._hashes[mask]\n        self._abundances = self._abundances[mask]\n\n        # Verify that the hashes remain sorted\n        if self._hashes.size &gt; 1:\n            if not np.all(self._hashes[:-1] &lt;= self._hashes[1:]):\n                self.logger.error(\"Hashes are not sorted after applying mask.\")\n                raise RuntimeError(\"Hashes are not sorted after applying mask.\")\n        self.logger.debug(\"Applied mask. Hashes remain sorted.\")\n\n    # Set operation methods\n    def union_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Combine this signature with another by summing abundances where hashes overlap.\n\n        Given two signatures \\( A \\) and \\( B \\) with hash sets \\( H_A \\) and \\( H_B \\),\n        and their corresponding abundance functions \\( a_A \\) and \\( a_B \\), the union\n        signature \\( C \\) is defined as follows:\n\n        - **Hash Set**: \n\n        $$\n        H_C = H_A \\cup H_B\n        $$\n\n        - **Abundance Function**:\n\n        $$\n        a_C(h) =\n        \\begin{cases} \n            a_A(h) + a_B(h), &amp; \\text{if } h \\in H_A \\cap H_B \\\\\n            a_A(h), &amp; \\text{if } h \\in H_A \\setminus H_B \\\\\n            a_B(h), &amp; \\text{if } h \\in H_B \\setminus H_A\n        \\end{cases}\n        $$\n        \"\"\"\n        self.__verify_snipe_signature(other)\n        self.__verify_matching_ksize_scale(other)\n\n        self.logger.debug(\"Unioning signatures (including all unique hashes).\")\n\n        # Access internal arrays directly\n        self_hashes = self._hashes\n        self_abundances = self._abundances\n        other_hashes = other._hashes\n        other_abundances = other._abundances\n\n        # Handle the case where 'other' does not track abundance\n        if not other.track_abundance:\n            self.logger.debug(\"Other signature does not track abundance. Setting abundances to 1.\")\n            other_abundances = np.ones_like(other_abundances, dtype=np.uint32)\n\n        # Combine hashes and abundances\n        combined_hashes = np.concatenate((self_hashes, other_hashes))\n        combined_abundances = np.concatenate((self_abundances, other_abundances))\n\n        # Use numpy's unique function with return_inverse to sum abundances efficiently\n        unique_hashes, inverse_indices = np.unique(combined_hashes, return_inverse=True)\n        summed_abundances = np.zeros_like(unique_hashes, dtype=np.uint32)\n\n        # Sum abundances for duplicate hashes\n        np.add.at(summed_abundances, inverse_indices, combined_abundances)\n\n        # Handle potential overflow\n        summed_abundances = np.minimum(summed_abundances, np.iinfo(np.uint32).max)\n\n        self.logger.debug(\"Union operation completed. Total hashes: %d\", len(unique_hashes))\n\n        # Create a new SnipeSig instance\n        return self.create_from_hashes_abundances(\n            hashes=unique_hashes,\n            abundances=summed_abundances,\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_union_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    def _convert_to_sourmash_signature(self):\n        r\"\"\"\n        Convert the SnipeSig instance to a sourmash.signature.SourmashSignature object.\n\n        Returns:\n            sourmash.signature.SourmashSignature: A new sourmash.signature.SourmashSignature instance.\n        \"\"\"\n        self.logger.debug(\"Converting SnipeSig to sourmash.signature.SourmashSignature.\")\n\n        mh = sourmash.minhash.MinHash(n=0, ksize=self._ksize, scaled=self._scale, track_abundance=self._track_abundance)\n        mh.set_abundances(dict(zip(self._hashes, self._abundances)))\n        self.sourmash_sig = sourmash.signature.SourmashSignature(mh, name=self._name, filename=self._filename)\n        self.logger.debug(\"Conversion to sourmash.signature.SourmashSignature completed.\")\n\n    def export(self, path) -&gt; None:\n        r\"\"\"\n        Export the signature to a file.\n\n        Parameters:\n            path (str): The path to save the signature to.\n        \"\"\"\n        self._convert_to_sourmash_signature()\n        with open(str(path), \"wb\") as fp:\n            sourmash.signature.save_signatures_to_json([self.sourmash_sig], fp)\n\n    def export_to_string(self):\n        r\"\"\"\n        Export the signature to a JSON string.\n\n        Returns:\n            str: JSON string representation of the signature.\n        \"\"\"\n        self._convert_to_sourmash_signature()\n        return sourmash.signature.save_signatures_to_json([self.sourmash_sig]).decode('utf-8')\n\n    def intersection_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Compute the intersection of the current signature with another signature.\n\n        This method keeps only the hashes that are common to both signatures, and retains the abundances from self.\n\n        **Mathematical Explanation**:\n\n        Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n        and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the intersection signature \\( C \\) has:\n\n        - Hash set:\n        $$\n        H_C = H_A \\cap H_B\n        $$\n\n        - Abundance function:\n        $$\n        a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C\n        $$\n\n        **Parameters**:\n            - `other (SnipeSig)`: Another `SnipeSig` instance to intersect with.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the two signatures.\n\n        **Raises**:\n            - `ValueError`: If `ksize` or `scale` do not match between signatures.\n        \"\"\"\n        self.__verify_snipe_signature(other)\n        self.__verify_matching_ksize_scale(other)\n\n        self.logger.debug(\"Intersecting signatures.\")\n\n        # Use numpy's intersect1d function\n        common_hashes, self_indices, _ = np.intersect1d(\n            self._hashes, other._hashes, assume_unique=True, return_indices=True\n        )\n\n        if common_hashes.size == 0:\n            self.logger.debug(\"No common hashes found. Returning an empty signature.\")\n            return self.create_from_hashes_abundances(\n                hashes=np.array([], dtype=np.uint64),\n                abundances=np.array([], dtype=np.uint32),\n                ksize=self._ksize,\n                scale=self._scale,\n                name=f\"{self._name}_intersection_{other._name}\",\n                filename=None,\n                enable_logging=self.logger.level &lt;= logging.DEBUG\n            )\n\n        # Get the abundances from self\n        common_abundances = self._abundances[self_indices]\n\n        self.logger.debug(\"Intersection operation completed. Total common hashes: %d\", len(common_hashes))\n\n        # Create a new SnipeSig instance\n        return self.create_from_hashes_abundances(\n            hashes=common_hashes,\n            abundances=common_abundances,\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_intersection_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    def difference_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Compute the difference of the current signature with another signature.\n\n        This method removes hashes that are present in the other signature from self,\n        keeping the abundances from self.\n\n        **Mathematical Explanation**:\n\n        Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n        and abundance function \\( a_A(h) \\), the difference signature \\( C \\) has:\n\n        - Hash set:\n        $$\n        H_C = H_A \\setminus H_B\n        $$\n\n        - Abundance function:\n        $$\n        a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C\n        $$\n\n        **Parameters**:\n            - `other (SnipeSig)`: Another `SnipeSig` instance to subtract from the current signature.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the difference of the two signatures.\n\n        **Raises**:\n            - `ValueError`: If `ksize` or `scale` do not match between signatures.\n            - `RuntimeError`: If zero hashes remain after difference.\n        \"\"\"\n        self.__verify_snipe_signature(other)\n        self.__verify_matching_ksize_scale(other)\n\n        self.logger.debug(\"Differencing signatures.\")\n\n        # Use numpy's setdiff1d function\n        diff_hashes = np.setdiff1d(self._hashes, other._hashes, assume_unique=True)\n\n        if diff_hashes.size == 0:\n            _e_msg = f\"Difference operation resulted in zero hashes, which is not allowed for {self._name} and {other._name}.\"\n            self.logger.warning(_e_msg)\n\n        # Get the indices of the hashes in self\n        mask = np.isin(self._hashes, diff_hashes, assume_unique=True)\n        diff_abundances = self._abundances[mask]\n\n        self.logger.debug(\"Difference operation completed. Remaining hashes: %d\", len(diff_hashes))\n\n        # Create a new SnipeSig instance\n        return self.create_from_hashes_abundances(\n            hashes=diff_hashes,\n            abundances=diff_abundances,\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_difference_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    def symmetric_difference_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Compute the symmetric difference of the current signature with another signature.\n\n        This method retains hashes that are unique to each signature, with their respective abundances.\n\n        **Mathematical Explanation**:\n\n        Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n        and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the symmetric difference signature \\( C \\) has:\n\n        - Hash set:\n        $$\n        H_C = (H_A \\setminus H_B) \\cup (H_B \\setminus H_A)\n        $$\n\n        - Abundance function:\n        $$\n        a_C(h) =\n        \\begin{cases}\n        a_A(h), &amp; \\text{for } h \\in H_A \\setminus H_B \\\\\n        a_B(h), &amp; \\text{for } h \\in H_B \\setminus H_A \\\\\n        \\end{cases}\n        $$\n\n        **Parameters**:\n            - `other (SnipeSig)`: Another `SnipeSig` instance to compute the symmetric difference with.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the symmetric difference of the two signatures.\n\n        **Raises**:\n            - `ValueError`: If `ksize` or `scale` do not match between signatures.\n            - `RuntimeError`: If zero hashes remain after symmetric difference.\n        \"\"\"\n        self.__verify_snipe_signature(other)\n        self.__verify_matching_ksize_scale(other)\n\n        self.logger.debug(\"Computing symmetric difference of signatures.\")\n\n        # Hashes unique to self and other\n        unique_self_hashes = np.setdiff1d(self._hashes, other._hashes, assume_unique=True)\n        unique_other_hashes = np.setdiff1d(other._hashes, self._hashes, assume_unique=True)\n\n        # Abundances for unique hashes\n        mask_self = np.isin(self._hashes, unique_self_hashes, assume_unique=True)\n        unique_self_abundances = self._abundances[mask_self]\n\n        mask_other = np.isin(other._hashes, unique_other_hashes, assume_unique=True)\n        unique_other_abundances = other._abundances[mask_other]\n\n        # Handle the case where 'other' does not track abundance\n        if not other.track_abundance:\n            self.logger.debug(\"Other signature does not track abundance. Setting abundances to 1.\")\n            unique_other_abundances = np.ones_like(unique_other_abundances, dtype=np.uint32)\n\n        # Combine hashes and abundances\n        combined_hashes = np.concatenate((unique_self_hashes, unique_other_hashes))\n        combined_abundances = np.concatenate((unique_self_abundances, unique_other_abundances))\n\n        if combined_hashes.size == 0:\n            _e_msg = \"Symmetric difference operation resulted in zero hashes, which is not allowed.\"\n            self.logger.error(_e_msg)\n            raise RuntimeError(_e_msg)\n\n        # Sort combined hashes and abundances\n        sorted_indices = np.argsort(combined_hashes)\n        combined_hashes = combined_hashes[sorted_indices]\n        combined_abundances = combined_abundances[sorted_indices]\n\n        self.logger.debug(\"Symmetric difference operation completed. Total unique hashes: %d\", len(combined_hashes))\n\n        # Create a new SnipeSig instance\n        return self.create_from_hashes_abundances(\n            hashes=combined_hashes,\n            abundances=combined_abundances,\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_symmetric_difference_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    # Magic methods for union operations\n    def __add__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the + operator.\n        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n        returning a new signature.\n\n        Returns:\n            SnipeSig: Union of self and other.\n        \"\"\"\n        return self.union_sigs(other)\n\n    def __iadd__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the += operator.\n        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n        modifying self in-place.\n\n        Returns:\n            SnipeSig: Updated self after addition.\n        \"\"\"\n        union_sig = self.union_sigs(other)\n        self._update_from_union(union_sig)\n        return self\n\n    def __or__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the | operator.\n        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n        returning a new signature.\n\n        Returns:\n            SnipeSig: Union of self and other.\n        \"\"\"\n        return self.union_sigs(other)\n\n    def __ior__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the |= operator.\n        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n        modifying self in-place.\n\n        Returns:\n            SnipeSig: Updated self after union.\n        \"\"\"\n        union_sig = self.union_sigs(other)\n        self._update_from_union(union_sig)\n        return self\n\n    def __sub__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the - operator.\n        Removes hashes present in other from self, keeping abundances from self,\n        returning a new signature.\n\n        Returns:\n            SnipeSig: Difference of self and other.\n        \"\"\"\n        return self.difference_sigs(other)\n\n    def __isub__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the -= operator.\n        Removes hashes present in other from self, keeping abundances from self,\n        modifying self in-place.\n\n        Returns:\n            SnipeSig: Updated self after difference.\n\n        Raises:\n            RuntimeError: If zero hashes remain after difference.\n        \"\"\"\n        difference_sig = self.difference_sigs(other)\n        self._update_from_union(difference_sig)\n        return self\n\n    def __xor__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the ^ operator.\n        Keeps unique hashes from each signature with their respective abundances, returning a new signature.\n\n        Returns:\n            SnipeSig: Symmetric difference of self and other.\n        \"\"\"\n        return self.symmetric_difference_sigs(other)\n\n    def __ixor__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the ^= operator.\n        Keeps unique hashes from each signature with their respective abundances, modifying self in-place.\n\n        Returns:\n            SnipeSig: Updated self after symmetric difference.\n\n        Raises:\n            RuntimeError: If zero hashes remain after symmetric difference.\n        \"\"\"\n        symmetric_diff_sig = self.symmetric_difference_sigs(other)\n        self._update_from_union(symmetric_diff_sig)\n        return self\n\n    def __and__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the &amp; operator.\n        Keeps common hashes and retains abundances from self only, returning a new signature.\n\n        Returns:\n            SnipeSig: Intersection of self and other.\n        \"\"\"\n        return self.intersection_sigs(other)\n\n    def _update_from_union(self, other: 'SnipeSig'):\n        r\"\"\"\n        Update self's hashes and abundances from another SnipeSig instance.\n\n        Parameters:\n            other (SnipeSig): The other SnipeSig instance to update from.\n        \"\"\"\n        self._hashes = other.hashes\n        self._abundances = other.abundances\n        self._name = other.name\n        self._filename = other.filename\n        self._md5sum = other.md5sum\n        self._track_abundance = other.track_abundance\n        # No need to update ksize and scale since they are verified to match\n\n    @classmethod\n    def create_from_hashes_abundances(cls, hashes: np.ndarray, abundances: np.ndarray,\n                                      ksize: int, scale: int, name: str = None,\n                                      filename: str = None, enable_logging: bool = False, sig_type: SigType = SigType.SAMPLE) -&gt; 'SnipeSig':\n        \"\"\"\n        Internal method to create a SnipeSig instance from hashes and abundances.\n\n        Parameters:\n            hashes (np.ndarray): Array of hash values.\n            abundances (np.ndarray): Array of abundance values corresponding to the hashes.\n            ksize (int): K-mer size.\n            scale (int): Scale value.\n            name (str): Optional name for the signature.\n            filename (str): Optional filename for the signature.\n            sig_type (SigType): Type of the signature.\n            enable_logging (bool): Flag to enable logging.\n\n        Returns:\n            SnipeSig: A new SnipeSig instance.\n        \"\"\"\n        # Create a mock sourmash signature object\n        mh = sourmash.minhash.MinHash(n=0, ksize=ksize, scaled=scale, track_abundance=True)\n        mh.set_abundances(dict(zip(hashes, abundances)))\n        sig = sourmash.signature.SourmashSignature(mh, name=name or \"\", filename=filename or \"\")\n        return cls(sourmash_sig=sig, sig_type=sig_type, enable_logging=enable_logging)\n\n    # Aggregation Operations\n    @classmethod\n    def sum_signatures(cls, signatures: List['SnipeSig'], name: str = \"summed_signature\",\n                       filename: str = None, enable_logging: bool = False) -&gt; 'SnipeSig':\n\n        r\"\"\"\n        Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap.\n        This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.\n\n        $$\n        \\text{Sum}(A_1, A_2, \\dots, A_n) = \\bigcup_{i=1}^{n} A_i\n        $$\n\n        For each hash \\( h \\), its total abundance is:\n        $$\n        \\text{abundance}(h) = \\sum_{i=1}^{n} \\text{abundance}_i(h)\n        $$\n\n        **Mathematical Explanation**:\n\n        - **Union of Signatures**:\n            The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.\n\n        - **Total Abundance Calculation**:\n            For each unique hash \\( h \\), the total abundance is the sum of its abundances across all signatures where it appears.\n\n        - **Algorithm Efficiency**:\n            By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.\n\n        **Parameters**:\n            - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to sum.\n            - `name (str)`: Optional name for the resulting signature.\n            - `filename (str)`: Optional filename for the resulting signature.\n            - `enable_logging (bool)`: Flag to enable detailed logging.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the sum of the signatures.\n\n        **Raises**:\n            - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.\n            - `RuntimeError`: If an error occurs during the summation process.\n        \"\"\"\n        if not signatures:\n            raise ValueError(\"No signatures provided for summation.\")\n\n        # Verify that all signatures have the same ksize, scale, and track_abundance\n        first_sig = signatures[0]\n        ksize = first_sig.ksize\n        scale = first_sig.scale\n        track_abundance = first_sig.track_abundance\n\n        for sig in signatures[1:]:\n            if sig.ksize != ksize or sig.scale != scale:\n                raise ValueError(\"All signatures must have the same ksize and scale.\")\n            if sig.track_abundance != track_abundance:\n                raise ValueError(\"All signatures must have the same track_abundance setting.\")\n\n        # Initialize iterators for each signature's hashes and abundances\n        iterators = []\n        for sig in signatures:\n            it = iter(zip(sig.hashes, sig.abundances))\n            try:\n                first_hash, first_abundance = next(it)\n                iterators.append((first_hash, first_abundance, it))\n            except StopIteration:\n                continue  # Skip empty signatures\n\n        if not iterators:\n            raise ValueError(\"All provided signatures are empty.\")\n\n        # Initialize the heap with the first element from each iterator\n        heap = []\n        for idx, (hash_val, abundance, it) in enumerate(iterators):\n            heap.append((hash_val, abundance, idx))\n        heapq.heapify(heap)\n\n        # Prepare lists to collect the summed hashes and abundances\n        summed_hashes = []\n        summed_abundances = []\n\n        while heap:\n            current_hash, current_abundance, idx = heapq.heappop(heap)\n            # Initialize total abundance for the current_hash\n            total_abundance = current_abundance\n\n            # Check if the next element in the heap has the same hash\n            while heap and heap[0][0] == current_hash:\n                _, abundance, same_idx = heapq.heappop(heap)\n                total_abundance += abundance\n                # Push the next element from the same iterator\n                try:\n                    next_hash, next_abundance = next(iterators[same_idx][2])\n                    heapq.heappush(heap, (next_hash, next_abundance, same_idx))\n                except StopIteration:\n                    pass  # No more elements in this iterator\n\n            # Append the summed hash and abundance\n            summed_hashes.append(current_hash)\n            summed_abundances.append(total_abundance)\n\n            # Push the next element from the current iterator\n            try:\n                next_hash, next_abundance = next(iterators[idx][2])\n                heapq.heappush(heap, (next_hash, next_abundance, idx))\n            except StopIteration:\n                pass  # No more elements in this iterator\n\n        # Convert the results to NumPy arrays for efficient storage and processing\n        summed_hashes = np.array(summed_hashes, dtype=np.uint64)\n        summed_abundances = np.array(summed_abundances, dtype=np.uint32)\n\n        # Handle potential overflow by capping at the maximum value of uint32\n        summed_abundances = np.minimum(summed_abundances, np.iinfo(np.uint32).max)\n\n        # Create a new SnipeSig instance from the summed hashes and abundances\n        summed_signature = cls.create_from_hashes_abundances(\n            hashes=summed_hashes,\n            abundances=summed_abundances,\n            ksize=ksize,\n            scale=scale,\n            name=name,\n            filename=filename,\n            enable_logging=enable_logging\n        )\n\n        return summed_signature\n\n    @staticmethod\n    def get_unique_signatures(signatures: Dict[str, 'SnipeSig']) -&gt; Dict[str, 'SnipeSig']:\n        \"\"\"\n        Extract unique signatures from a dictionary of SnipeSig instances.\n\n        For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.\n\n        Parameters:\n            signatures (Dict[str, SnipeSig]): A dictionary mapping signature names to SnipeSig instances.\n\n        Returns:\n            Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.\n\n        Raises:\n            ValueError: If the input dictionary is empty or if signatures have mismatched ksize/scale.\n        \"\"\"\n        if not signatures:\n            raise ValueError(\"The input signatures dictionary is empty.\")\n\n        # Extract ksize and scale from the first signature\n        first_name, first_sig = next(iter(signatures.items()))\n        ksize = first_sig.ksize\n        scale = first_sig.scale\n\n        # Verify that all signatures have the same ksize and scale\n        for name, sig in signatures.items():\n            if sig.ksize != ksize or sig.scale != scale:\n                raise ValueError(f\"Signature '{name}' has mismatched ksize or scale.\")\n\n        # Aggregate all hashes from all signatures\n        all_hashes = np.concatenate([sig.hashes for sig in signatures.values()])\n\n        # Count the occurrences of each hash\n        unique_hashes, counts = np.unique(all_hashes, return_counts=True)\n\n        # Identify hashes that are unique across all signatures (count == 1)\n        unique_across_all = unique_hashes[counts == 1]\n\n        # Convert to a set for faster membership testing\n        unique_set = set(unique_across_all)\n\n        unique_signatures = {}\n\n        for name, sig in signatures.items():\n            # Find hashes in the current signature that are unique across all signatures\n            mask_unique = np.isin(sig.hashes, list(unique_set))\n\n            # Extract unique hashes and their abundances\n            unique_hashes_sig = sig.hashes[mask_unique]\n            unique_abundances_sig = sig.abundances[mask_unique]\n\n            # Create a new SnipeSig instance with the unique hashes and abundances\n            unique_sig = SnipeSig.create_from_hashes_abundances(\n                hashes=unique_hashes_sig,\n                abundances=unique_abundances_sig,\n                ksize=ksize,\n                scale=scale,\n                name=f\"{name}_unique\",\n                filename=None,\n                enable_logging=False,  # Set to True if you want logging for the new signatures\n                sig_type=SigType.SAMPLE  # Adjust sig_type as needed\n            )\n\n            unique_signatures[name] = unique_sig\n\n        return unique_signatures\n\n\n    @classmethod\n    def common_hashes(cls, signatures: List['SnipeSig'], name: str = \"common_hashes_signature\",\n                      filename: str = None, enable_logging: bool = False) -&gt; 'SnipeSig':\n        r\"\"\"\n        Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing\n        only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.\n\n        This method uses a heap-based multi-way merge algorithm for efficient computation,\n        especially when handling a large number of signatures with sorted hashes.\n\n        **Mathematical Explanation**:\n\n        Given signatures \\( A_1, A_2, \\dots, A_n \\) with hash sets \\( H_1, H_2, \\dots, H_n \\),\n        the intersection signature \\( C \\) has:\n\n        - Hash set:\n        $$\n        H_C = \\bigcap_{i=1}^{n} H_i\n        $$\n\n        - Abundance function:\n        $$\n        a_C(h) = \\min_{i=1}^{n} a_i(h), \\quad \\text{for } h \\in H_C\n        $$\n\n        **Parameters**:\n            - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to compute the intersection.\n            - `name (str)`: Optional name for the resulting signature.\n            - `filename (str)`: Optional filename for the resulting signature.\n            - `enable_logging (bool)`: Flag to enable detailed logging.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the signatures.\n\n        **Raises**:\n            - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.\n        \"\"\"\n        if not signatures:\n            raise ValueError(\"No signatures provided for intersection.\")\n\n        # Verify that all signatures have the same ksize and scale\n        first_sig = signatures[0]\n        ksize = first_sig.ksize\n        scale = first_sig.scale\n        for sig in signatures[1:]:\n            if sig.ksize != ksize or sig.scale != scale:\n                raise ValueError(\"All signatures must have the same ksize and scale.\")\n\n        num_signatures = len(signatures)\n        iterators = []\n        for sig in signatures:\n            it = iter(zip(sig.hashes, sig.abundances))\n            try:\n                first_hash, first_abundance = next(it)\n                iterators.append((first_hash, first_abundance, it))\n            except StopIteration:\n                # One of the signatures is empty; intersection is empty\n                return cls.create_from_hashes_abundances(\n                    hashes=np.array([], dtype=np.uint64),\n                    abundances=np.array([], dtype=np.uint32),\n                    ksize=ksize,\n                    scale=scale,\n                    name=name,\n                    filename=filename,\n                    enable_logging=enable_logging\n                )\n\n        # Initialize the heap with the first element from each iterator\n        heap = []\n        for idx, (hash_val, abundance, it) in enumerate(iterators):\n            heap.append((hash_val, abundance, idx))\n        heapq.heapify(heap)\n\n        common_hashes = []\n        common_abundances = []\n\n        while heap:\n            # Pop all entries with the smallest hash\n            current_hash, current_abundance, idx = heapq.heappop(heap)\n            same_hash_entries = [(current_hash, current_abundance, idx)]\n\n            # Collect all entries in the heap that have the same current_hash\n            while heap and heap[0][0] == current_hash:\n                h, a, i = heapq.heappop(heap)\n                same_hash_entries.append((h, a, i))\n\n            if len(same_hash_entries) == num_signatures:\n                # The current_hash is present in all signatures\n                # Take the minimum abundance across signatures\n                min_abundance = min(entry[1] for entry in same_hash_entries)\n                common_hashes.append(current_hash)\n                common_abundances.append(min_abundance)\n\n            # Push the next element from each iterator that had the current_hash\n            for entry in same_hash_entries:\n                h, a, i = entry\n                try:\n                    next_hash, next_abundance = next(iterators[i][2])\n                    heapq.heappush(heap, (next_hash, next_abundance, i))\n                except StopIteration:\n                    pass  # Iterator exhausted\n\n        # Convert the results to NumPy arrays\n        if not common_hashes:\n            # No common hashes found\n            unique_hashes = np.array([], dtype=np.uint64)\n            unique_abundances = np.array([], dtype=np.uint32)\n        else:\n            unique_hashes = np.array(common_hashes, dtype=np.uint64)\n            unique_abundances = np.array(common_abundances, dtype=np.uint32)\n\n        # Create a new SnipeSig instance from the common hashes and abundances\n        common_signature = cls.create_from_hashes_abundances(\n            hashes=unique_hashes,\n            abundances=unique_abundances,\n            ksize=ksize,\n            scale=scale,\n            name=name,\n            filename=filename,\n            enable_logging=enable_logging\n        )\n\n        return common_signature\n\n    def copy(self) -&gt; 'SnipeSig':\n        r\"\"\"\n        Create a copy of the current SnipeSig instance.\n\n        Returns:\n            SnipeSig: A new instance that is a copy of self.\n        \"\"\"\n        return SnipeSig(sourmash_sig=self.export_to_string(), sig_type=self.sigtype, enable_logging=self.logger.level &lt;= logging.DEBUG)\n\n    # Implement the __radd__ method to support sum()\n    def __radd__(self, other: Union[int, 'SnipeSig']) -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the right-hand + operator to support sum().\n\n        Returns:\n            SnipeSig: Union of self and other.\n        \"\"\"\n        return self.__radd_sum__(other)\n\n    # Override the __sum__ method\n    def __radd_sum__(self, other: Union[int, 'SnipeSig']) -&gt; 'SnipeSig':\n        r\"\"\"\n        Internal helper method to support the sum() function.\n\n        Parameters:\n            other (int or SnipeSig): The other object to add. If other is 0, return self.\n\n        Returns:\n            SnipeSig: The result of the addition.\n        \"\"\"\n        if other == 0:\n            return self\n        if not isinstance(other, SnipeSig):\n            raise TypeError(f\"Unsupported operand type(s) for +: 'SnipeSig' and '{type(other).__name__}'\")\n        return self.union_sigs(other)\n\n    def reset_abundance(self, new_abundance: int = 1):\n        r\"\"\"\n        Reset all abundances to a specified value.\n\n        This method sets the abundance of every hash in the signature to the specified `new_abundance` value.\n\n        **Mathematical Explanation**:\n\n        For each hash \\( h \\) in the signature, the abundance function is updated to:\n        $$\n        a(h) = \\text{new\\_abundance}\n        $$\n\n        **Parameters**:\n            - `new_abundance (int)`: The new abundance value to set for all hashes. Default is 1.\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance or if `new_abundance` is invalid.\n        \"\"\"\n\n        self._validate_abundance_operation(new_abundance, \"reset abundance\")\n\n        self._abundances[:] = new_abundance\n        self.logger.debug(\"Reset all abundances to %d.\", new_abundance)\n\n    def keep_min_abundance(self, min_abundance: int):\n        r\"\"\"\n        Keep only hashes with abundances greater than or equal to a minimum threshold.\n\n        This method removes hashes whose abundances are less than the specified `min_abundance`.\n\n        **Mathematical Explanation**:\n\n        The updated hash set \\( H' \\) is:\n        $$\n        H' = \\{ h \\in H \\mid a(h) \\geq \\text{min\\_abundance} \\}\n        $$\n\n        **Parameters**:\n            - `min_abundance (int)`: The minimum abundance threshold.\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance or if `min_abundance` is invalid.\n        \"\"\"\n        self._validate_abundance_operation(min_abundance, \"keep minimum abundance\")\n\n        mask = self._abundances &gt;= min_abundance\n        self._apply_mask(mask)\n        self.logger.debug(\"Kept hashes with abundance &gt;= %d.\", min_abundance)\n\n    def keep_max_abundance(self, max_abundance: int):\n        r\"\"\"\n        Keep only hashes with abundances less than or equal to a maximum threshold.\n\n        This method removes hashes whose abundances are greater than the specified `max_abundance`.\n\n        **Mathematical Explanation**:\n\n        The updated hash set \\( H' \\) is:\n        $$\n        H' = \\{ h \\in H \\mid a(h) \\leq \\text{max\\_abundance} \\}\n        $$\n\n        **Parameters**:\n            - `max_abundance (int)`: The maximum abundance threshold.\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance or if `max_abundance` is invalid.\n        \"\"\"\n        self._validate_abundance_operation(max_abundance, \"keep maximum abundance\")\n\n        mask = self._abundances &lt;= max_abundance\n        self._apply_mask(mask)\n        self.logger.debug(\"Kept hashes with abundance &lt;= %d.\", max_abundance)\n\n    def trim_below_median(self):\n        r\"\"\"\n        Trim hashes with abundances below the median abundance.\n\n        This method removes all hashes whose abundances are less than the median abundance of the signature.\n\n        **Mathematical Explanation**:\n\n        Let \\\\( m \\\\) be the median of \\\\( \\\\{ a(h) \\mid h \\in H \\\\} \\\\).\n        The updated hash set \\\\( H' \\\\) is:\n\n        $$\n        H' = \\\\{ h \\in H \\mid a(h) \\geq m \\\\}\n        $$\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance.\n        \"\"\"\n\n        self._validate_abundance_operation(None, \"trim below median\")\n\n        if len(self._abundances) == 0:\n            self.logger.debug(\"No hashes to trim based on median abundance.\")\n            return\n\n        median = np.median(self._abundances)\n        mask = self._abundances &gt;= median\n        self._apply_mask(mask)\n        self.logger.debug(\"Trimmed hashes with abundance below median (%f).\", median)\n\n    def count_singletons(self) -&gt; int:\n        r\"\"\"\n        Return the number of hashes with abundance equal to 1.\n\n        Returns:\n            int: Number of singletons.\n\n        Raises:\n            ValueError: If the signature does not track abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"count singletons\")\n\n        count = np.sum(self._abundances == 1)\n        self.logger.debug(\"Number of singletons (abundance == 1): %d\", count)\n        return int(count)\n\n    def trim_singletons(self):\n        r\"\"\"\n        Remove hashes with abundance equal to 1.\n\n        This method removes all hashes that are singletons (abundance equals 1).\n\n        **Mathematical Explanation**:\n\n        The updated hash set \\( H' \\) is:\n        $$\n        H' = \\{ h \\in H \\mid a(h) \\neq 1 \\}\n        $$\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"trim singletons\")\n\n        mask = self._abundances != 1\n        self._apply_mask(mask)\n        self.logger.debug(\"Trimmed hashes with abundance equal to 1.\")\n\n    # New Properties Implemented as per Request\n\n    @property\n    def total_abundance(self) -&gt; int:\n        r\"\"\"\n        Return the total abundance (sum of all abundances).\n\n        Returns:\n            int: Total abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"calculate total abundance\")\n\n        total = int(np.sum(self._abundances))\n        self.logger.debug(\"Total abundance: %d\", total)\n        return total\n\n    @property\n    def mean_abundance(self) -&gt; float:\n        r\"\"\"\n        Return the mean (average) abundance.\n\n        Returns:\n            float: Mean abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"calculate mean abundance\")\n\n        if len(self._abundances) == 0:\n            self.logger.debug(\"No abundances to calculate mean.\")\n            return 0.0\n\n        mean = float(np.mean(self._abundances))  # Changed to float\n        self.logger.debug(\"Mean abundance: %f\", mean)\n        return mean\n\n    @property\n    def get_sample_stats(self) -&gt; dict:\n        r\"\"\"\n        Retrieve statistical information about the signature.\n\n        This property computes and returns a dictionary containing various statistics of the signature, such as total abundance, mean and median abundances, number of singletons, and total number of hashes.\n\n        **Returns**:\n            - `dict`: A dictionary containing sample statistics:\n                - `total_abundance`: Sum of abundances.\n                - `mean_abundance`: Mean abundance.\n                - `median_abundance`: Median abundance.\n                - `num_singletons`: Number of hashes with abundance equal to 1.\n                - `num_hashes`: Total number of hashes.\n                - `ksize`: K-mer size.\n                - `scale`: Scale value.\n                - `name`: Name of the signature.\n                - `filename`: Filename of the signature.\n        \"\"\"\n\n        # if self.sigtype != SigType.SAMPLE then don't return abundance stats\n\n        stats = {\n            \"num_hashes\": len(self._hashes),\n            \"ksize\": self._ksize,\n            \"scale\": self._scale,\n            \"name\": self._name,\n            \"filename\": self._filename\n        }\n\n        if self.sigtype != SigType.SAMPLE:\n            stats[\"total_abundance\"] = None\n            stats[\"mean_abundance\"] = None\n            stats[\"median_abundance\"] = None\n            stats[\"num_singletons\"] = None\n        else:\n            stats[\"total_abundance\"] = self.total_abundance\n            stats[\"mean_abundance\"] = self.mean_abundance\n            stats[\"median_abundance\"] = self.median_abundance\n            stats[\"num_singletons\"] = self.count_singletons()\n\n        return stats\n\n    @property\n    def median_abundance(self) -&gt; float:\n        r\"\"\"\n        Return the median abundance.\n\n        Returns:\n            float: Median abundance.\n\n        Raises:\n            ValueError: If the signature does not track abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"calculate median abundance\")\n\n        if len(self._abundances) == 0:\n            self.logger.debug(\"No abundances to calculate median.\")\n            return 0.0\n\n        median = float(np.median(self._abundances))  # Changed to float\n        self.logger.debug(\"Median abundance: %f\", median)\n        return median\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.abundances","title":"<code>abundances: np.ndarray</code>  <code>property</code>","text":"<p>Return a copy of the abundances array.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.filename","title":"<code>filename: str</code>  <code>property</code>","text":"<p>Return the filename of the signature.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.get_sample_stats","title":"<code>get_sample_stats: dict</code>  <code>property</code>","text":"<p>Retrieve statistical information about the signature.</p> <p>This property computes and returns a dictionary containing various statistics of the signature, such as total abundance, mean and median abundances, number of singletons, and total number of hashes.</p> <p>Returns:     - <code>dict</code>: A dictionary containing sample statistics:         - <code>total_abundance</code>: Sum of abundances.         - <code>mean_abundance</code>: Mean abundance.         - <code>median_abundance</code>: Median abundance.         - <code>num_singletons</code>: Number of hashes with abundance equal to 1.         - <code>num_hashes</code>: Total number of hashes.         - <code>ksize</code>: K-mer size.         - <code>scale</code>: Scale value.         - <code>name</code>: Name of the signature.         - <code>filename</code>: Filename of the signature.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.hashes","title":"<code>hashes: np.ndarray</code>  <code>property</code>","text":"<p>Return a copy of the hashes array.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.ksize","title":"<code>ksize: int</code>  <code>property</code>","text":"<p>Return the k-mer size.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.md5sum","title":"<code>md5sum: str</code>  <code>property</code>","text":"<p>Return the MD5 checksum of the signature.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.mean_abundance","title":"<code>mean_abundance: float</code>  <code>property</code>","text":"<p>Return the mean (average) abundance.</p> <p>Returns:</p> Name Type Description <code>float</code> <code>float</code> <p>Mean abundance.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.median_abundance","title":"<code>median_abundance: float</code>  <code>property</code>","text":"<p>Return the median abundance.</p> <p>Returns:</p> Name Type Description <code>float</code> <code>float</code> <p>Median abundance.</p> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the signature does not track abundance.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.name","title":"<code>name: str</code>  <code>property</code>","text":"<p>Return the name of the signature.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.scale","title":"<code>scale: int</code>  <code>property</code>","text":"<p>Return the scale value.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.sigtype","title":"<code>sigtype: SigType</code>  <code>property</code> <code>writable</code>","text":"<p>Return the type of the signature.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.total_abundance","title":"<code>total_abundance: int</code>  <code>property</code>","text":"<p>Return the total abundance (sum of all abundances).</p> <p>Returns:</p> Name Type Description <code>int</code> <code>int</code> <p>Total abundance.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.track_abundance","title":"<code>track_abundance: bool</code>  <code>property</code>","text":"<p>Return whether the signature tracks abundance.</p>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__add__","title":"<code>__add__(other)</code>","text":"<p>Implements the + operator. Includes all unique hashes from both signatures and sums their abundances where hashes overlap, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Union of self and other.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __add__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the + operator.\n    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n    returning a new signature.\n\n    Returns:\n        SnipeSig: Union of self and other.\n    \"\"\"\n    return self.union_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__and__","title":"<code>__and__(other)</code>","text":"<p>Implements the &amp; operator. Keeps common hashes and retains abundances from self only, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Intersection of self and other.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __and__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the &amp; operator.\n    Keeps common hashes and retains abundances from self only, returning a new signature.\n\n    Returns:\n        SnipeSig: Intersection of self and other.\n    \"\"\"\n    return self.intersection_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__contains__","title":"<code>__contains__(hash_value)</code>","text":"<p>Check if a hash is present in the signature.</p> <p>Parameters:</p> Name Type Description Default <code>hash_value</code> <code>int</code> <p>The hash value to check.</p> required <p>Returns:</p> Name Type Description <code>bool</code> <code>bool</code> <p>True if the hash is present, False otherwise.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __contains__(self, hash_value: int) -&gt; bool:\n    r\"\"\"\n    Check if a hash is present in the signature.\n\n    Parameters:\n        hash_value (int): The hash value to check.\n\n    Returns:\n        bool: True if the hash is present, False otherwise.\n    \"\"\"\n    # Utilize binary search since hashes are sorted\n    index = np.searchsorted(self._hashes, hash_value)\n    if index &lt; len(self._hashes) and self._hashes[index] == hash_value:\n        return True\n    return False\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__iadd__","title":"<code>__iadd__(other)</code>","text":"<p>Implements the += operator. Includes all unique hashes from both signatures and sums their abundances where hashes overlap, modifying self in-place.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Updated self after addition.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __iadd__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the += operator.\n    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n    modifying self in-place.\n\n    Returns:\n        SnipeSig: Updated self after addition.\n    \"\"\"\n    union_sig = self.union_sigs(other)\n    self._update_from_union(union_sig)\n    return self\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__init__","title":"<code>__init__(*, sourmash_sig, ksize=51, scale=10000, sig_type=SigType.SAMPLE, enable_logging=False, **kwargs)</code>","text":"<p>Initialize the SnipeSig with a sourmash signature object or a path to a signature.</p> <p>Parameters:</p> Name Type Description Default <code>sourmash_sig</code> <code>str or SourmashSignature</code> <p>A path to a signature file or a signature object.</p> required <code>ksize</code> <code>int</code> <p>K-mer size.</p> <code>51</code> <code>scale</code> <code>int</code> <p>Scale value.</p> <code>10000</code> <code>sig_type</code> <code>SigType</code> <p>Type of the signature.</p> <code>SAMPLE</code> <code>enable_logging</code> <code>bool</code> <p>Flag to enable detailed logging.</p> <code>False</code> <code>**kwargs</code> <p>Additional keyword arguments.</p> <code>{}</code> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __init__(self, *, sourmash_sig: Union[str, sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature],\n             ksize: int = 51, scale: int = 10000, sig_type=SigType.SAMPLE, enable_logging: bool = False, **kwargs):\n    r\"\"\"\n    Initialize the SnipeSig with a sourmash signature object or a path to a signature.\n\n    Parameters:\n        sourmash_sig (str or sourmash.signature.SourmashSignature): A path to a signature file or a signature object.\n        ksize (int): K-mer size.\n        scale (int): Scale value.\n        sig_type (SigType): Type of the signature.\n        enable_logging (bool): Flag to enable detailed logging.\n        **kwargs: Additional keyword arguments.\n    \"\"\"\n    # Initialize logging based on the flag\n    self.logger = logging.getLogger(self.__class__.__name__)\n\n    # Configure the logger\n    if enable_logging:\n        self.logger.setLevel(logging.DEBUG)\n        if not self.logger.hasHandlers():\n            # Create console handler\n            ch = logging.StreamHandler()\n            ch.setLevel(logging.DEBUG)\n            # Create formatter\n            formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')\n            # Add formatter to handler\n            ch.setFormatter(formatter)\n            # Add handler to logger\n            self.logger.addHandler(ch)\n        self.logger.debug(\"Logging is enabled for SnipeSig.\")\n    else:\n        self.logger.setLevel(logging.CRITICAL)\n\n    # Initialize internal variables\n    self.logger.debug(\"Initializing SnipeSig with sourmash_sig: %s\", sourmash_sig)\n\n    self._scale = scale\n    self._ksize = ksize\n    self._md5sum = None\n    self._hashes = np.array([], dtype=np.uint64)\n    self._abundances = np.array([], dtype=np.uint32)\n    self._type = sig_type\n    self._name = None\n    self._filename = None\n    self._track_abundance = False\n\n    sourmash_sigs: Dict[str, sourmash.signature.SourmashSignature] = {}\n    _sourmash_sig: Union[sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature] = None\n\n\n    self.logger.debug(\"Proceeding with a sigtype of %s\", sig_type)\n\n\n\n\n\n\n    if not isinstance(sourmash_sig, (str, sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature)):\n        # if the str is not a file path\n        self.logger.error(\"Invalid type for sourmash_sig: %s\", type(sourmash_sig).__name__)\n        raise TypeError(f\"sourmash_sig must be a file path, sourmash.signature.SourmashSignature, or Frozensourmash_signature, got {type(sourmash_sig).__name__}\")\n\n    # Case 1: If sourmash_sig is already a valid sourmash signature object\n    if isinstance(sourmash_sig, (sourmash.signature.FrozenSourmashSignature, sourmash.signature.SourmashSignature)):\n        self.logger.debug(\"Loaded sourmash signature directly from object.\")\n        sourmash_sigs = {sourmash_sig.name: sourmash_sig}\n\n    # Case 2: If sourmash_sig is a string, try to load as JSON or a file\n    elif isinstance(sourmash_sig, str):\n        self.logger.debug(\"Attempting to load sourmash signature from string input.\")\n\n        # First, try loading from JSON\n        sourmash_sigs = self._try_load_from_json(sourmash_sig)\n        self.logger.debug(\"Loaded sourmash signature from JSON: %s\", sourmash_sigs)\n\n        # If JSON loading fails, try loading from file\n        if not sourmash_sigs:\n            sourmash_sigs = self._try_load_from_file(sourmash_sig)\n\n        # If both attempts fail, raise an error\n        if not sourmash_sigs:\n            self.logger.error(\"Failed to load sourmash signature from the provided string.\")\n            raise ValueError(\"An unexpected error occurred while loading the sourmash signature.\")\n\n    if sig_type == SigType.SAMPLE or sig_type == SigType.AMPLICON:\n        if len(sourmash_sigs) &gt; 1:\n            self.logger.debug(\"Multiple signatures found in the input. Expected a single sample signature.\")\n            # not supported at this time\n            raise ValueError(\"Loading multiple sample signatures is not supported at this time.\")\n        elif len(sourmash_sigs) == 1:\n            self.logger.debug(\"Found a single signature in the sample sig input; Will use this signature.\")\n            _sourmash_sig = list(sourmash_sigs.values())[0]\n        else:\n            self.logger.debug(\"No signature found in the input. Expected a single sample signature.\")\n            raise ValueError(\"No signature found in the input. Expected a single sample signature.\")\n\n    elif sig_type == SigType.GENOME:\n        if len(sourmash_sigs) &gt; 1:\n            for signame, sig in sourmash_sigs.items():\n                if signame.endswith(\"-snipegenome\"):\n                    sig = sig.to_mutable()\n                    sig.name = sig.name.replace(\"-snipegenome\", \"\")\n                    self.logger.debug(\"Found a genome signature with a snipe modified name. Restoring original name `%s`.\", sig.name)\n                    _sourmash_sig = sig\n                    break\n            else:\n                self.logger.debug(\"Found multiple signature per the genome file, but none with a snipe modified name.\")\n                raise ValueError(\"Found multiple signature per the genome file, but none with a snipe modified name.\")\n        elif len(sourmash_sigs) == 1:\n            self.logger.debug(\"Found a single signature in the genome sig input; Will use this signature.\")\n            _sourmash_sig = list(sourmash_sigs.values())[0]\n    else:\n        self.logger.debug(\"Unknown sigtype: %s\", sig_type)\n        raise ValueError(f\"Unknown sigtype: {sig_type}\")\n\n    self.logger.debug(\"Length of currently loaded signature: %d, with name: %s\", len(_sourmash_sig), _sourmash_sig.name)\n\n    # Extract properties from the loaded signature\n    self._ksize = _sourmash_sig.minhash.ksize\n    self._scale = _sourmash_sig.minhash.scaled\n    self._md5sum = _sourmash_sig.md5sum()\n    self._name = _sourmash_sig.name\n    self._filename = _sourmash_sig.filename\n    self._track_abundance = _sourmash_sig.minhash.track_abundance\n\n    # If the signature does not track abundance, assume abundance of 1 for all hashes\n    if not self._track_abundance:\n        self.logger.debug(\"Signature does not track abundance. Setting all abundances to 1.\")\n        self._abundances = np.ones(len(_sourmash_sig.minhash.hashes), dtype=np.uint32)\n        # self._track_abundance = True\n    else:\n        self._abundances = np.array(list(_sourmash_sig.minhash.hashes.values()), dtype=np.uint32)\n\n    self._hashes = np.array(list(_sourmash_sig.minhash.hashes.keys()), dtype=np.uint64)\n\n    # Sort the hashes and rearrange abundances accordingly\n    sorted_indices = np.argsort(self._hashes)\n    self._hashes = self._hashes[sorted_indices]\n    self._abundances = self._abundances[sorted_indices]\n\n    self.logger.debug(\n        \"Loaded sourmash signature from file: %s, name: %s, md5sum: %s, ksize: %d, scale: %d, \"\n        \"track_abundance: %s, type: %s, length: %d\",\n        self._filename, self._name, self._md5sum, self._ksize, self._scale,\n        self._track_abundance, self._type, len(self._hashes)\n    )\n    self.logger.debug(\"Hashes sorted during initialization.\")\n    self.logger.debug(\"Sourmash signature loading completed successfully.\")\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__ior__","title":"<code>__ior__(other)</code>","text":"<p>Implements the |= operator. Includes all unique hashes from both signatures and sums their abundances where hashes overlap, modifying self in-place.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Updated self after union.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __ior__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the |= operator.\n    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n    modifying self in-place.\n\n    Returns:\n        SnipeSig: Updated self after union.\n    \"\"\"\n    union_sig = self.union_sigs(other)\n    self._update_from_union(union_sig)\n    return self\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__isub__","title":"<code>__isub__(other)</code>","text":"<p>Implements the -= operator. Removes hashes present in other from self, keeping abundances from self, modifying self in-place.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Updated self after difference.</p> <p>Raises:</p> Type Description <code>RuntimeError</code> <p>If zero hashes remain after difference.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __isub__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the -= operator.\n    Removes hashes present in other from self, keeping abundances from self,\n    modifying self in-place.\n\n    Returns:\n        SnipeSig: Updated self after difference.\n\n    Raises:\n        RuntimeError: If zero hashes remain after difference.\n    \"\"\"\n    difference_sig = self.difference_sigs(other)\n    self._update_from_union(difference_sig)\n    return self\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__iter__","title":"<code>__iter__()</code>","text":"<p>Iterate over the hashes and their abundances.</p> <p>Yields:</p> Name Type Description <code>tuple</code> <code>tuple</code> <p>A tuple containing (hash, abundance).</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __iter__(self) -&gt; Iterator[tuple]:\n    r\"\"\"\n    Iterate over the hashes and their abundances.\n\n    Yields:\n        tuple: A tuple containing (hash, abundance).\n    \"\"\"\n    for h, a in zip(self._hashes, self._abundances):\n        yield (h, a)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__ixor__","title":"<code>__ixor__(other)</code>","text":"<p>Implements the ^= operator. Keeps unique hashes from each signature with their respective abundances, modifying self in-place.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Updated self after symmetric difference.</p> <p>Raises:</p> Type Description <code>RuntimeError</code> <p>If zero hashes remain after symmetric difference.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __ixor__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the ^= operator.\n    Keeps unique hashes from each signature with their respective abundances, modifying self in-place.\n\n    Returns:\n        SnipeSig: Updated self after symmetric difference.\n\n    Raises:\n        RuntimeError: If zero hashes remain after symmetric difference.\n    \"\"\"\n    symmetric_diff_sig = self.symmetric_difference_sigs(other)\n    self._update_from_union(symmetric_diff_sig)\n    return self\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__len__","title":"<code>__len__()</code>","text":"<p>Return the number of hashes in the signature.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __len__(self) -&gt; int:\n    r\"\"\"Return the number of hashes in the signature.\"\"\"\n    return len(self._hashes)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__or__","title":"<code>__or__(other)</code>","text":"<p>Implements the | operator. Includes all unique hashes from both signatures and sums their abundances where hashes overlap, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Union of self and other.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __or__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the | operator.\n    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n    returning a new signature.\n\n    Returns:\n        SnipeSig: Union of self and other.\n    \"\"\"\n    return self.union_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__radd__","title":"<code>__radd__(other)</code>","text":"<p>Implements the right-hand + operator to support sum().</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Union of self and other.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __radd__(self, other: Union[int, 'SnipeSig']) -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the right-hand + operator to support sum().\n\n    Returns:\n        SnipeSig: Union of self and other.\n    \"\"\"\n    return self.__radd_sum__(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__radd_sum__","title":"<code>__radd_sum__(other)</code>","text":"<p>Internal helper method to support the sum() function.</p> <p>Parameters:</p> Name Type Description Default <code>other</code> <code>int or SnipeSig</code> <p>The other object to add. If other is 0, return self.</p> required <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>The result of the addition.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __radd_sum__(self, other: Union[int, 'SnipeSig']) -&gt; 'SnipeSig':\n    r\"\"\"\n    Internal helper method to support the sum() function.\n\n    Parameters:\n        other (int or SnipeSig): The other object to add. If other is 0, return self.\n\n    Returns:\n        SnipeSig: The result of the addition.\n    \"\"\"\n    if other == 0:\n        return self\n    if not isinstance(other, SnipeSig):\n        raise TypeError(f\"Unsupported operand type(s) for +: 'SnipeSig' and '{type(other).__name__}'\")\n    return self.union_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__sub__","title":"<code>__sub__(other)</code>","text":"<p>Implements the - operator. Removes hashes present in other from self, keeping abundances from self, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Difference of self and other.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __sub__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the - operator.\n    Removes hashes present in other from self, keeping abundances from self,\n    returning a new signature.\n\n    Returns:\n        SnipeSig: Difference of self and other.\n    \"\"\"\n    return self.difference_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__verify_matching_ksize_scale","title":"<code>__verify_matching_ksize_scale(other)</code>","text":"<p>Verify that the ksize and scale match between two signatures.</p> <p>Parameters:</p> Name Type Description Default <code>other</code> <code>SnipeSig</code> <p>The other signature to compare.</p> required <p>Raises:</p> Type Description <code>ValueError</code> <p>If ksize or scale do not match.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __verify_matching_ksize_scale(self, other: 'SnipeSig'):\n    r\"\"\"\n    Verify that the ksize and scale match between two signatures.\n\n    Parameters:\n        other (SnipeSig): The other signature to compare.\n\n    Raises:\n        ValueError: If ksize or scale do not match.\n    \"\"\"\n    if self._ksize != other.ksize:\n        _e_msg = f\"K-mer size does not match between the two signatures: {self._ksize} vs {other.ksize}.\"\n        self.logger.error(_e_msg)\n        raise ValueError(_e_msg)\n    if self._scale != other.scale:\n        _e_msg = f\"Scale value does not match between the two signatures: {self._scale} vs {other.scale}.\"\n        self.logger.error(_e_msg)\n        raise ValueError(_e_msg)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__verify_snipe_signature","title":"<code>__verify_snipe_signature(other)</code>","text":"<p>Verify that the other object is a SnipeSig instance.</p> <p>Parameters:</p> Name Type Description Default <code>other</code> <code>SnipeSig</code> <p>The other signature to verify.</p> required <p>Raises:</p> Type Description <code>ValueError</code> <p>If the other object is not a SnipeSig instance.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __verify_snipe_signature(self, other: 'SnipeSig'):\n    r\"\"\"\n    Verify that the other object is a SnipeSig instance.\n\n    Parameters:\n        other (SnipeSig): The other signature to verify.\n\n    Raises:\n        ValueError: If the other object is not a SnipeSig instance.\n    \"\"\"\n    if not isinstance(other, SnipeSig):\n        msg = f\"Provided sig ({type(other).__name__}) is not a SnipeSig instance.\"\n        self.logger.error(msg)\n        raise ValueError(msg)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.__xor__","title":"<code>__xor__(other)</code>","text":"<p>Implements the ^ operator. Keeps unique hashes from each signature with their respective abundances, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Symmetric difference of self and other.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def __xor__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the ^ operator.\n    Keeps unique hashes from each signature with their respective abundances, returning a new signature.\n\n    Returns:\n        SnipeSig: Symmetric difference of self and other.\n    \"\"\"\n    return self.symmetric_difference_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.common_hashes","title":"<code>common_hashes(signatures, name='common_hashes_signature', filename=None, enable_logging=False)</code>  <code>classmethod</code>","text":"<p>Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.</p> <p>This method uses a heap-based multi-way merge algorithm for efficient computation, especially when handling a large number of signatures with sorted hashes.</p> <p>Mathematical Explanation:</p> <p>Given signatures \\( A_1, A_2, \\dots, A_n \\) with hash sets \\( H_1, H_2, \\dots, H_n \\), the intersection signature \\( C \\) has:</p> <ul> <li> <p>Hash set: $$ H_C = \\bigcap_{i=1}^{n} H_i $$</p> </li> <li> <p>Abundance function: $$ a_C(h) = \\min_{i=1}^{n} a_i(h), \\quad \\text{for } h \\in H_C $$</p> </li> </ul> <p>Parameters:     - <code>signatures (List[SnipeSig])</code>: List of <code>SnipeSig</code> instances to compute the intersection.     - <code>name (str)</code>: Optional name for the resulting signature.     - <code>filename (str)</code>: Optional filename for the resulting signature.     - <code>enable_logging (bool)</code>: Flag to enable detailed logging.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the intersection of the signatures.</p> <p>Raises:     - <code>ValueError</code>: If the signatures list is empty or if <code>ksize</code>/<code>scale</code> do not match across signatures.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>@classmethod\ndef common_hashes(cls, signatures: List['SnipeSig'], name: str = \"common_hashes_signature\",\n                  filename: str = None, enable_logging: bool = False) -&gt; 'SnipeSig':\n    r\"\"\"\n    Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing\n    only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.\n\n    This method uses a heap-based multi-way merge algorithm for efficient computation,\n    especially when handling a large number of signatures with sorted hashes.\n\n    **Mathematical Explanation**:\n\n    Given signatures \\( A_1, A_2, \\dots, A_n \\) with hash sets \\( H_1, H_2, \\dots, H_n \\),\n    the intersection signature \\( C \\) has:\n\n    - Hash set:\n    $$\n    H_C = \\bigcap_{i=1}^{n} H_i\n    $$\n\n    - Abundance function:\n    $$\n    a_C(h) = \\min_{i=1}^{n} a_i(h), \\quad \\text{for } h \\in H_C\n    $$\n\n    **Parameters**:\n        - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to compute the intersection.\n        - `name (str)`: Optional name for the resulting signature.\n        - `filename (str)`: Optional filename for the resulting signature.\n        - `enable_logging (bool)`: Flag to enable detailed logging.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the signatures.\n\n    **Raises**:\n        - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.\n    \"\"\"\n    if not signatures:\n        raise ValueError(\"No signatures provided for intersection.\")\n\n    # Verify that all signatures have the same ksize and scale\n    first_sig = signatures[0]\n    ksize = first_sig.ksize\n    scale = first_sig.scale\n    for sig in signatures[1:]:\n        if sig.ksize != ksize or sig.scale != scale:\n            raise ValueError(\"All signatures must have the same ksize and scale.\")\n\n    num_signatures = len(signatures)\n    iterators = []\n    for sig in signatures:\n        it = iter(zip(sig.hashes, sig.abundances))\n        try:\n            first_hash, first_abundance = next(it)\n            iterators.append((first_hash, first_abundance, it))\n        except StopIteration:\n            # One of the signatures is empty; intersection is empty\n            return cls.create_from_hashes_abundances(\n                hashes=np.array([], dtype=np.uint64),\n                abundances=np.array([], dtype=np.uint32),\n                ksize=ksize,\n                scale=scale,\n                name=name,\n                filename=filename,\n                enable_logging=enable_logging\n            )\n\n    # Initialize the heap with the first element from each iterator\n    heap = []\n    for idx, (hash_val, abundance, it) in enumerate(iterators):\n        heap.append((hash_val, abundance, idx))\n    heapq.heapify(heap)\n\n    common_hashes = []\n    common_abundances = []\n\n    while heap:\n        # Pop all entries with the smallest hash\n        current_hash, current_abundance, idx = heapq.heappop(heap)\n        same_hash_entries = [(current_hash, current_abundance, idx)]\n\n        # Collect all entries in the heap that have the same current_hash\n        while heap and heap[0][0] == current_hash:\n            h, a, i = heapq.heappop(heap)\n            same_hash_entries.append((h, a, i))\n\n        if len(same_hash_entries) == num_signatures:\n            # The current_hash is present in all signatures\n            # Take the minimum abundance across signatures\n            min_abundance = min(entry[1] for entry in same_hash_entries)\n            common_hashes.append(current_hash)\n            common_abundances.append(min_abundance)\n\n        # Push the next element from each iterator that had the current_hash\n        for entry in same_hash_entries:\n            h, a, i = entry\n            try:\n                next_hash, next_abundance = next(iterators[i][2])\n                heapq.heappush(heap, (next_hash, next_abundance, i))\n            except StopIteration:\n                pass  # Iterator exhausted\n\n    # Convert the results to NumPy arrays\n    if not common_hashes:\n        # No common hashes found\n        unique_hashes = np.array([], dtype=np.uint64)\n        unique_abundances = np.array([], dtype=np.uint32)\n    else:\n        unique_hashes = np.array(common_hashes, dtype=np.uint64)\n        unique_abundances = np.array(common_abundances, dtype=np.uint32)\n\n    # Create a new SnipeSig instance from the common hashes and abundances\n    common_signature = cls.create_from_hashes_abundances(\n        hashes=unique_hashes,\n        abundances=unique_abundances,\n        ksize=ksize,\n        scale=scale,\n        name=name,\n        filename=filename,\n        enable_logging=enable_logging\n    )\n\n    return common_signature\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.copy","title":"<code>copy()</code>","text":"<p>Create a copy of the current SnipeSig instance.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>A new instance that is a copy of self.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def copy(self) -&gt; 'SnipeSig':\n    r\"\"\"\n    Create a copy of the current SnipeSig instance.\n\n    Returns:\n        SnipeSig: A new instance that is a copy of self.\n    \"\"\"\n    return SnipeSig(sourmash_sig=self.export_to_string(), sig_type=self.sigtype, enable_logging=self.logger.level &lt;= logging.DEBUG)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.count_singletons","title":"<code>count_singletons()</code>","text":"<p>Return the number of hashes with abundance equal to 1.</p> <p>Returns:</p> Name Type Description <code>int</code> <code>int</code> <p>Number of singletons.</p> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the signature does not track abundance.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def count_singletons(self) -&gt; int:\n    r\"\"\"\n    Return the number of hashes with abundance equal to 1.\n\n    Returns:\n        int: Number of singletons.\n\n    Raises:\n        ValueError: If the signature does not track abundance.\n    \"\"\"\n    self._validate_abundance_operation(None, \"count singletons\")\n\n    count = np.sum(self._abundances == 1)\n    self.logger.debug(\"Number of singletons (abundance == 1): %d\", count)\n    return int(count)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.create_from_hashes_abundances","title":"<code>create_from_hashes_abundances(hashes, abundances, ksize, scale, name=None, filename=None, enable_logging=False, sig_type=SigType.SAMPLE)</code>  <code>classmethod</code>","text":"<p>Internal method to create a SnipeSig instance from hashes and abundances.</p> <p>Parameters:</p> Name Type Description Default <code>hashes</code> <code>ndarray</code> <p>Array of hash values.</p> required <code>abundances</code> <code>ndarray</code> <p>Array of abundance values corresponding to the hashes.</p> required <code>ksize</code> <code>int</code> <p>K-mer size.</p> required <code>scale</code> <code>int</code> <p>Scale value.</p> required <code>name</code> <code>str</code> <p>Optional name for the signature.</p> <code>None</code> <code>filename</code> <code>str</code> <p>Optional filename for the signature.</p> <code>None</code> <code>sig_type</code> <code>SigType</code> <p>Type of the signature.</p> <code>SAMPLE</code> <code>enable_logging</code> <code>bool</code> <p>Flag to enable logging.</p> <code>False</code> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>A new SnipeSig instance.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>@classmethod\ndef create_from_hashes_abundances(cls, hashes: np.ndarray, abundances: np.ndarray,\n                                  ksize: int, scale: int, name: str = None,\n                                  filename: str = None, enable_logging: bool = False, sig_type: SigType = SigType.SAMPLE) -&gt; 'SnipeSig':\n    \"\"\"\n    Internal method to create a SnipeSig instance from hashes and abundances.\n\n    Parameters:\n        hashes (np.ndarray): Array of hash values.\n        abundances (np.ndarray): Array of abundance values corresponding to the hashes.\n        ksize (int): K-mer size.\n        scale (int): Scale value.\n        name (str): Optional name for the signature.\n        filename (str): Optional filename for the signature.\n        sig_type (SigType): Type of the signature.\n        enable_logging (bool): Flag to enable logging.\n\n    Returns:\n        SnipeSig: A new SnipeSig instance.\n    \"\"\"\n    # Create a mock sourmash signature object\n    mh = sourmash.minhash.MinHash(n=0, ksize=ksize, scaled=scale, track_abundance=True)\n    mh.set_abundances(dict(zip(hashes, abundances)))\n    sig = sourmash.signature.SourmashSignature(mh, name=name or \"\", filename=filename or \"\")\n    return cls(sourmash_sig=sig, sig_type=sig_type, enable_logging=enable_logging)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.difference_sigs","title":"<code>difference_sigs(other)</code>","text":"<p>Compute the difference of the current signature with another signature.</p> <p>This method removes hashes that are present in the other signature from self, keeping the abundances from self.</p> <p>Mathematical Explanation:</p> <p>Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\), and abundance function \\( a_A(h) \\), the difference signature \\( C \\) has:</p> <ul> <li> <p>Hash set: $$ H_C = H_A \\setminus H_B $$</p> </li> <li> <p>Abundance function: $$ a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C $$</p> </li> </ul> <p>Parameters:     - <code>other (SnipeSig)</code>: Another <code>SnipeSig</code> instance to subtract from the current signature.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the difference of the two signatures.</p> <p>Raises:     - <code>ValueError</code>: If <code>ksize</code> or <code>scale</code> do not match between signatures.     - <code>RuntimeError</code>: If zero hashes remain after difference.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def difference_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Compute the difference of the current signature with another signature.\n\n    This method removes hashes that are present in the other signature from self,\n    keeping the abundances from self.\n\n    **Mathematical Explanation**:\n\n    Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n    and abundance function \\( a_A(h) \\), the difference signature \\( C \\) has:\n\n    - Hash set:\n    $$\n    H_C = H_A \\setminus H_B\n    $$\n\n    - Abundance function:\n    $$\n    a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C\n    $$\n\n    **Parameters**:\n        - `other (SnipeSig)`: Another `SnipeSig` instance to subtract from the current signature.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the difference of the two signatures.\n\n    **Raises**:\n        - `ValueError`: If `ksize` or `scale` do not match between signatures.\n        - `RuntimeError`: If zero hashes remain after difference.\n    \"\"\"\n    self.__verify_snipe_signature(other)\n    self.__verify_matching_ksize_scale(other)\n\n    self.logger.debug(\"Differencing signatures.\")\n\n    # Use numpy's setdiff1d function\n    diff_hashes = np.setdiff1d(self._hashes, other._hashes, assume_unique=True)\n\n    if diff_hashes.size == 0:\n        _e_msg = f\"Difference operation resulted in zero hashes, which is not allowed for {self._name} and {other._name}.\"\n        self.logger.warning(_e_msg)\n\n    # Get the indices of the hashes in self\n    mask = np.isin(self._hashes, diff_hashes, assume_unique=True)\n    diff_abundances = self._abundances[mask]\n\n    self.logger.debug(\"Difference operation completed. Remaining hashes: %d\", len(diff_hashes))\n\n    # Create a new SnipeSig instance\n    return self.create_from_hashes_abundances(\n        hashes=diff_hashes,\n        abundances=diff_abundances,\n        ksize=self._ksize,\n        scale=self._scale,\n        name=f\"{self._name}_difference_{other._name}\",\n        filename=None,\n        enable_logging=self.logger.level &lt;= logging.DEBUG\n    )\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.export","title":"<code>export(path)</code>","text":"<p>Export the signature to a file.</p> <p>Parameters:</p> Name Type Description Default <code>path</code> <code>str</code> <p>The path to save the signature to.</p> required Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def export(self, path) -&gt; None:\n    r\"\"\"\n    Export the signature to a file.\n\n    Parameters:\n        path (str): The path to save the signature to.\n    \"\"\"\n    self._convert_to_sourmash_signature()\n    with open(str(path), \"wb\") as fp:\n        sourmash.signature.save_signatures_to_json([self.sourmash_sig], fp)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.export_to_string","title":"<code>export_to_string()</code>","text":"<p>Export the signature to a JSON string.</p> <p>Returns:</p> Name Type Description <code>str</code> <p>JSON string representation of the signature.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def export_to_string(self):\n    r\"\"\"\n    Export the signature to a JSON string.\n\n    Returns:\n        str: JSON string representation of the signature.\n    \"\"\"\n    self._convert_to_sourmash_signature()\n    return sourmash.signature.save_signatures_to_json([self.sourmash_sig]).decode('utf-8')\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.get_info","title":"<code>get_info()</code>","text":"<p>Get information about the signature.</p> <p>Returns:</p> Name Type Description <code>dict</code> <code>dict</code> <p>A dictionary containing signature information.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def get_info(self) -&gt; dict:\n    r\"\"\"\n    Get information about the signature.\n\n    Returns:\n        dict: A dictionary containing signature information.\n    \"\"\"\n    info = {\n        \"name\": self._name,\n        \"filename\": self._filename,\n        \"md5sum\": self._md5sum,\n        \"ksize\": self._ksize,\n        \"scale\": self._scale,\n        \"track_abundance\": self._track_abundance,\n        \"sigtype\": self._type,\n        \"num_hashes\": len(self._hashes)\n    }\n    return info\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.get_name","title":"<code>get_name()</code>","text":"<p>Get the name of the signature.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def get_name(self) -&gt; str:\n    r\"\"\"Get the name of the signature.\"\"\"\n    return self._name\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.get_unique_signatures","title":"<code>get_unique_signatures(signatures)</code>  <code>staticmethod</code>","text":"<p>Extract unique signatures from a dictionary of SnipeSig instances.</p> <p>For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.</p> <p>Parameters:</p> Name Type Description Default <code>signatures</code> <code>Dict[str, SnipeSig]</code> <p>A dictionary mapping signature names to SnipeSig instances.</p> required <p>Returns:</p> Type Description <code>Dict[str, SnipeSig]</code> <p>Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.</p> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the input dictionary is empty or if signatures have mismatched ksize/scale.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>@staticmethod\ndef get_unique_signatures(signatures: Dict[str, 'SnipeSig']) -&gt; Dict[str, 'SnipeSig']:\n    \"\"\"\n    Extract unique signatures from a dictionary of SnipeSig instances.\n\n    For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.\n\n    Parameters:\n        signatures (Dict[str, SnipeSig]): A dictionary mapping signature names to SnipeSig instances.\n\n    Returns:\n        Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.\n\n    Raises:\n        ValueError: If the input dictionary is empty or if signatures have mismatched ksize/scale.\n    \"\"\"\n    if not signatures:\n        raise ValueError(\"The input signatures dictionary is empty.\")\n\n    # Extract ksize and scale from the first signature\n    first_name, first_sig = next(iter(signatures.items()))\n    ksize = first_sig.ksize\n    scale = first_sig.scale\n\n    # Verify that all signatures have the same ksize and scale\n    for name, sig in signatures.items():\n        if sig.ksize != ksize or sig.scale != scale:\n            raise ValueError(f\"Signature '{name}' has mismatched ksize or scale.\")\n\n    # Aggregate all hashes from all signatures\n    all_hashes = np.concatenate([sig.hashes for sig in signatures.values()])\n\n    # Count the occurrences of each hash\n    unique_hashes, counts = np.unique(all_hashes, return_counts=True)\n\n    # Identify hashes that are unique across all signatures (count == 1)\n    unique_across_all = unique_hashes[counts == 1]\n\n    # Convert to a set for faster membership testing\n    unique_set = set(unique_across_all)\n\n    unique_signatures = {}\n\n    for name, sig in signatures.items():\n        # Find hashes in the current signature that are unique across all signatures\n        mask_unique = np.isin(sig.hashes, list(unique_set))\n\n        # Extract unique hashes and their abundances\n        unique_hashes_sig = sig.hashes[mask_unique]\n        unique_abundances_sig = sig.abundances[mask_unique]\n\n        # Create a new SnipeSig instance with the unique hashes and abundances\n        unique_sig = SnipeSig.create_from_hashes_abundances(\n            hashes=unique_hashes_sig,\n            abundances=unique_abundances_sig,\n            ksize=ksize,\n            scale=scale,\n            name=f\"{name}_unique\",\n            filename=None,\n            enable_logging=False,  # Set to True if you want logging for the new signatures\n            sig_type=SigType.SAMPLE  # Adjust sig_type as needed\n        )\n\n        unique_signatures[name] = unique_sig\n\n    return unique_signatures\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.intersection_sigs","title":"<code>intersection_sigs(other)</code>","text":"<p>Compute the intersection of the current signature with another signature.</p> <p>This method keeps only the hashes that are common to both signatures, and retains the abundances from self.</p> <p>Mathematical Explanation:</p> <p>Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\), and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the intersection signature \\( C \\) has:</p> <ul> <li> <p>Hash set: $$ H_C = H_A \\cap H_B $$</p> </li> <li> <p>Abundance function: $$ a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C $$</p> </li> </ul> <p>Parameters:     - <code>other (SnipeSig)</code>: Another <code>SnipeSig</code> instance to intersect with.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the intersection of the two signatures.</p> <p>Raises:     - <code>ValueError</code>: If <code>ksize</code> or <code>scale</code> do not match between signatures.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def intersection_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Compute the intersection of the current signature with another signature.\n\n    This method keeps only the hashes that are common to both signatures, and retains the abundances from self.\n\n    **Mathematical Explanation**:\n\n    Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n    and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the intersection signature \\( C \\) has:\n\n    - Hash set:\n    $$\n    H_C = H_A \\cap H_B\n    $$\n\n    - Abundance function:\n    $$\n    a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C\n    $$\n\n    **Parameters**:\n        - `other (SnipeSig)`: Another `SnipeSig` instance to intersect with.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the two signatures.\n\n    **Raises**:\n        - `ValueError`: If `ksize` or `scale` do not match between signatures.\n    \"\"\"\n    self.__verify_snipe_signature(other)\n    self.__verify_matching_ksize_scale(other)\n\n    self.logger.debug(\"Intersecting signatures.\")\n\n    # Use numpy's intersect1d function\n    common_hashes, self_indices, _ = np.intersect1d(\n        self._hashes, other._hashes, assume_unique=True, return_indices=True\n    )\n\n    if common_hashes.size == 0:\n        self.logger.debug(\"No common hashes found. Returning an empty signature.\")\n        return self.create_from_hashes_abundances(\n            hashes=np.array([], dtype=np.uint64),\n            abundances=np.array([], dtype=np.uint32),\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_intersection_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    # Get the abundances from self\n    common_abundances = self._abundances[self_indices]\n\n    self.logger.debug(\"Intersection operation completed. Total common hashes: %d\", len(common_hashes))\n\n    # Create a new SnipeSig instance\n    return self.create_from_hashes_abundances(\n        hashes=common_hashes,\n        abundances=common_abundances,\n        ksize=self._ksize,\n        scale=self._scale,\n        name=f\"{self._name}_intersection_{other._name}\",\n        filename=None,\n        enable_logging=self.logger.level &lt;= logging.DEBUG\n    )\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.keep_max_abundance","title":"<code>keep_max_abundance(max_abundance)</code>","text":"<p>Keep only hashes with abundances less than or equal to a maximum threshold.</p> <p>This method removes hashes whose abundances are greater than the specified <code>max_abundance</code>.</p> <p>Mathematical Explanation:</p> <p>The updated hash set \\( H' \\) is: $$ H' = { h \\in H \\mid a(h) \\leq \\text{max_abundance} } $$</p> <p>Parameters:     - <code>max_abundance (int)</code>: The maximum abundance threshold.</p> <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance or if <code>max_abundance</code> is invalid.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def keep_max_abundance(self, max_abundance: int):\n    r\"\"\"\n    Keep only hashes with abundances less than or equal to a maximum threshold.\n\n    This method removes hashes whose abundances are greater than the specified `max_abundance`.\n\n    **Mathematical Explanation**:\n\n    The updated hash set \\( H' \\) is:\n    $$\n    H' = \\{ h \\in H \\mid a(h) \\leq \\text{max\\_abundance} \\}\n    $$\n\n    **Parameters**:\n        - `max_abundance (int)`: The maximum abundance threshold.\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance or if `max_abundance` is invalid.\n    \"\"\"\n    self._validate_abundance_operation(max_abundance, \"keep maximum abundance\")\n\n    mask = self._abundances &lt;= max_abundance\n    self._apply_mask(mask)\n    self.logger.debug(\"Kept hashes with abundance &lt;= %d.\", max_abundance)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.keep_min_abundance","title":"<code>keep_min_abundance(min_abundance)</code>","text":"<p>Keep only hashes with abundances greater than or equal to a minimum threshold.</p> <p>This method removes hashes whose abundances are less than the specified <code>min_abundance</code>.</p> <p>Mathematical Explanation:</p> <p>The updated hash set \\( H' \\) is: $$ H' = { h \\in H \\mid a(h) \\geq \\text{min_abundance} } $$</p> <p>Parameters:     - <code>min_abundance (int)</code>: The minimum abundance threshold.</p> <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance or if <code>min_abundance</code> is invalid.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def keep_min_abundance(self, min_abundance: int):\n    r\"\"\"\n    Keep only hashes with abundances greater than or equal to a minimum threshold.\n\n    This method removes hashes whose abundances are less than the specified `min_abundance`.\n\n    **Mathematical Explanation**:\n\n    The updated hash set \\( H' \\) is:\n    $$\n    H' = \\{ h \\in H \\mid a(h) \\geq \\text{min\\_abundance} \\}\n    $$\n\n    **Parameters**:\n        - `min_abundance (int)`: The minimum abundance threshold.\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance or if `min_abundance` is invalid.\n    \"\"\"\n    self._validate_abundance_operation(min_abundance, \"keep minimum abundance\")\n\n    mask = self._abundances &gt;= min_abundance\n    self._apply_mask(mask)\n    self.logger.debug(\"Kept hashes with abundance &gt;= %d.\", min_abundance)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.reset_abundance","title":"<code>reset_abundance(new_abundance=1)</code>","text":"<p>Reset all abundances to a specified value.</p> <p>This method sets the abundance of every hash in the signature to the specified <code>new_abundance</code> value.</p> <p>Mathematical Explanation:</p> <p>For each hash \\( h \\) in the signature, the abundance function is updated to: $$ a(h) = \\text{new_abundance} $$</p> <p>Parameters:     - <code>new_abundance (int)</code>: The new abundance value to set for all hashes. Default is 1.</p> <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance or if <code>new_abundance</code> is invalid.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def reset_abundance(self, new_abundance: int = 1):\n    r\"\"\"\n    Reset all abundances to a specified value.\n\n    This method sets the abundance of every hash in the signature to the specified `new_abundance` value.\n\n    **Mathematical Explanation**:\n\n    For each hash \\( h \\) in the signature, the abundance function is updated to:\n    $$\n    a(h) = \\text{new\\_abundance}\n    $$\n\n    **Parameters**:\n        - `new_abundance (int)`: The new abundance value to set for all hashes. Default is 1.\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance or if `new_abundance` is invalid.\n    \"\"\"\n\n    self._validate_abundance_operation(new_abundance, \"reset abundance\")\n\n    self._abundances[:] = new_abundance\n    self.logger.debug(\"Reset all abundances to %d.\", new_abundance)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.sum_signatures","title":"<code>sum_signatures(signatures, name='summed_signature', filename=None, enable_logging=False)</code>  <code>classmethod</code>","text":"<p>Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap. This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.</p> \\[ \\text{Sum}(A_1, A_2, \\dots, A_n) = \\bigcup_{i=1}^{n} A_i \\] <p>For each hash \\( h \\), its total abundance is: $$ \\text{abundance}(h) = \\sum_{i=1}^{n} \\text{abundance}_i(h) $$</p> <p>Mathematical Explanation:</p> <ul> <li> <p>Union of Signatures:     The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.</p> </li> <li> <p>Total Abundance Calculation:     For each unique hash \\( h \\), the total abundance is the sum of its abundances across all signatures where it appears.</p> </li> <li> <p>Algorithm Efficiency:     By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.</p> </li> </ul> <p>Parameters:     - <code>signatures (List[SnipeSig])</code>: List of <code>SnipeSig</code> instances to sum.     - <code>name (str)</code>: Optional name for the resulting signature.     - <code>filename (str)</code>: Optional filename for the resulting signature.     - <code>enable_logging (bool)</code>: Flag to enable detailed logging.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the sum of the signatures.</p> <p>Raises:     - <code>ValueError</code>: If the signatures list is empty or if <code>ksize</code>/<code>scale</code> do not match across signatures.     - <code>RuntimeError</code>: If an error occurs during the summation process.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>@classmethod\ndef sum_signatures(cls, signatures: List['SnipeSig'], name: str = \"summed_signature\",\n                   filename: str = None, enable_logging: bool = False) -&gt; 'SnipeSig':\n\n    r\"\"\"\n    Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap.\n    This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.\n\n    $$\n    \\text{Sum}(A_1, A_2, \\dots, A_n) = \\bigcup_{i=1}^{n} A_i\n    $$\n\n    For each hash \\( h \\), its total abundance is:\n    $$\n    \\text{abundance}(h) = \\sum_{i=1}^{n} \\text{abundance}_i(h)\n    $$\n\n    **Mathematical Explanation**:\n\n    - **Union of Signatures**:\n        The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.\n\n    - **Total Abundance Calculation**:\n        For each unique hash \\( h \\), the total abundance is the sum of its abundances across all signatures where it appears.\n\n    - **Algorithm Efficiency**:\n        By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.\n\n    **Parameters**:\n        - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to sum.\n        - `name (str)`: Optional name for the resulting signature.\n        - `filename (str)`: Optional filename for the resulting signature.\n        - `enable_logging (bool)`: Flag to enable detailed logging.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the sum of the signatures.\n\n    **Raises**:\n        - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.\n        - `RuntimeError`: If an error occurs during the summation process.\n    \"\"\"\n    if not signatures:\n        raise ValueError(\"No signatures provided for summation.\")\n\n    # Verify that all signatures have the same ksize, scale, and track_abundance\n    first_sig = signatures[0]\n    ksize = first_sig.ksize\n    scale = first_sig.scale\n    track_abundance = first_sig.track_abundance\n\n    for sig in signatures[1:]:\n        if sig.ksize != ksize or sig.scale != scale:\n            raise ValueError(\"All signatures must have the same ksize and scale.\")\n        if sig.track_abundance != track_abundance:\n            raise ValueError(\"All signatures must have the same track_abundance setting.\")\n\n    # Initialize iterators for each signature's hashes and abundances\n    iterators = []\n    for sig in signatures:\n        it = iter(zip(sig.hashes, sig.abundances))\n        try:\n            first_hash, first_abundance = next(it)\n            iterators.append((first_hash, first_abundance, it))\n        except StopIteration:\n            continue  # Skip empty signatures\n\n    if not iterators:\n        raise ValueError(\"All provided signatures are empty.\")\n\n    # Initialize the heap with the first element from each iterator\n    heap = []\n    for idx, (hash_val, abundance, it) in enumerate(iterators):\n        heap.append((hash_val, abundance, idx))\n    heapq.heapify(heap)\n\n    # Prepare lists to collect the summed hashes and abundances\n    summed_hashes = []\n    summed_abundances = []\n\n    while heap:\n        current_hash, current_abundance, idx = heapq.heappop(heap)\n        # Initialize total abundance for the current_hash\n        total_abundance = current_abundance\n\n        # Check if the next element in the heap has the same hash\n        while heap and heap[0][0] == current_hash:\n            _, abundance, same_idx = heapq.heappop(heap)\n            total_abundance += abundance\n            # Push the next element from the same iterator\n            try:\n                next_hash, next_abundance = next(iterators[same_idx][2])\n                heapq.heappush(heap, (next_hash, next_abundance, same_idx))\n            except StopIteration:\n                pass  # No more elements in this iterator\n\n        # Append the summed hash and abundance\n        summed_hashes.append(current_hash)\n        summed_abundances.append(total_abundance)\n\n        # Push the next element from the current iterator\n        try:\n            next_hash, next_abundance = next(iterators[idx][2])\n            heapq.heappush(heap, (next_hash, next_abundance, idx))\n        except StopIteration:\n            pass  # No more elements in this iterator\n\n    # Convert the results to NumPy arrays for efficient storage and processing\n    summed_hashes = np.array(summed_hashes, dtype=np.uint64)\n    summed_abundances = np.array(summed_abundances, dtype=np.uint32)\n\n    # Handle potential overflow by capping at the maximum value of uint32\n    summed_abundances = np.minimum(summed_abundances, np.iinfo(np.uint32).max)\n\n    # Create a new SnipeSig instance from the summed hashes and abundances\n    summed_signature = cls.create_from_hashes_abundances(\n        hashes=summed_hashes,\n        abundances=summed_abundances,\n        ksize=ksize,\n        scale=scale,\n        name=name,\n        filename=filename,\n        enable_logging=enable_logging\n    )\n\n    return summed_signature\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.symmetric_difference_sigs","title":"<code>symmetric_difference_sigs(other)</code>","text":"<p>Compute the symmetric difference of the current signature with another signature.</p> <p>This method retains hashes that are unique to each signature, with their respective abundances.</p> <p>Mathematical Explanation:</p> <p>Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\), and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the symmetric difference signature \\( C \\) has:</p> <ul> <li> <p>Hash set: $$ H_C = (H_A \\setminus H_B) \\cup (H_B \\setminus H_A) $$</p> </li> <li> <p>Abundance function: $$ a_C(h) = \\begin{cases} a_A(h), &amp; \\text{for } h \\in H_A \\setminus H_B \\ a_B(h), &amp; \\text{for } h \\in H_B \\setminus H_A \\ \\end{cases} $$</p> </li> </ul> <p>Parameters:     - <code>other (SnipeSig)</code>: Another <code>SnipeSig</code> instance to compute the symmetric difference with.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the symmetric difference of the two signatures.</p> <p>Raises:     - <code>ValueError</code>: If <code>ksize</code> or <code>scale</code> do not match between signatures.     - <code>RuntimeError</code>: If zero hashes remain after symmetric difference.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def symmetric_difference_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Compute the symmetric difference of the current signature with another signature.\n\n    This method retains hashes that are unique to each signature, with their respective abundances.\n\n    **Mathematical Explanation**:\n\n    Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n    and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the symmetric difference signature \\( C \\) has:\n\n    - Hash set:\n    $$\n    H_C = (H_A \\setminus H_B) \\cup (H_B \\setminus H_A)\n    $$\n\n    - Abundance function:\n    $$\n    a_C(h) =\n    \\begin{cases}\n    a_A(h), &amp; \\text{for } h \\in H_A \\setminus H_B \\\\\n    a_B(h), &amp; \\text{for } h \\in H_B \\setminus H_A \\\\\n    \\end{cases}\n    $$\n\n    **Parameters**:\n        - `other (SnipeSig)`: Another `SnipeSig` instance to compute the symmetric difference with.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the symmetric difference of the two signatures.\n\n    **Raises**:\n        - `ValueError`: If `ksize` or `scale` do not match between signatures.\n        - `RuntimeError`: If zero hashes remain after symmetric difference.\n    \"\"\"\n    self.__verify_snipe_signature(other)\n    self.__verify_matching_ksize_scale(other)\n\n    self.logger.debug(\"Computing symmetric difference of signatures.\")\n\n    # Hashes unique to self and other\n    unique_self_hashes = np.setdiff1d(self._hashes, other._hashes, assume_unique=True)\n    unique_other_hashes = np.setdiff1d(other._hashes, self._hashes, assume_unique=True)\n\n    # Abundances for unique hashes\n    mask_self = np.isin(self._hashes, unique_self_hashes, assume_unique=True)\n    unique_self_abundances = self._abundances[mask_self]\n\n    mask_other = np.isin(other._hashes, unique_other_hashes, assume_unique=True)\n    unique_other_abundances = other._abundances[mask_other]\n\n    # Handle the case where 'other' does not track abundance\n    if not other.track_abundance:\n        self.logger.debug(\"Other signature does not track abundance. Setting abundances to 1.\")\n        unique_other_abundances = np.ones_like(unique_other_abundances, dtype=np.uint32)\n\n    # Combine hashes and abundances\n    combined_hashes = np.concatenate((unique_self_hashes, unique_other_hashes))\n    combined_abundances = np.concatenate((unique_self_abundances, unique_other_abundances))\n\n    if combined_hashes.size == 0:\n        _e_msg = \"Symmetric difference operation resulted in zero hashes, which is not allowed.\"\n        self.logger.error(_e_msg)\n        raise RuntimeError(_e_msg)\n\n    # Sort combined hashes and abundances\n    sorted_indices = np.argsort(combined_hashes)\n    combined_hashes = combined_hashes[sorted_indices]\n    combined_abundances = combined_abundances[sorted_indices]\n\n    self.logger.debug(\"Symmetric difference operation completed. Total unique hashes: %d\", len(combined_hashes))\n\n    # Create a new SnipeSig instance\n    return self.create_from_hashes_abundances(\n        hashes=combined_hashes,\n        abundances=combined_abundances,\n        ksize=self._ksize,\n        scale=self._scale,\n        name=f\"{self._name}_symmetric_difference_{other._name}\",\n        filename=None,\n        enable_logging=self.logger.level &lt;= logging.DEBUG\n    )\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.trim_below_median","title":"<code>trim_below_median()</code>","text":"<p>Trim hashes with abundances below the median abundance.</p> <p>This method removes all hashes whose abundances are less than the median abundance of the signature.</p> <p>Mathematical Explanation:</p> <p>Let \\( m \\) be the median of \\( \\{ a(h) \\mid h \\in H \\} \\). The updated hash set \\( H' \\) is:</p> \\[ H' = \\\\{ h \\in H \\mid a(h) \\geq m \\\\} \\] <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def trim_below_median(self):\n    r\"\"\"\n    Trim hashes with abundances below the median abundance.\n\n    This method removes all hashes whose abundances are less than the median abundance of the signature.\n\n    **Mathematical Explanation**:\n\n    Let \\\\( m \\\\) be the median of \\\\( \\\\{ a(h) \\mid h \\in H \\\\} \\\\).\n    The updated hash set \\\\( H' \\\\) is:\n\n    $$\n    H' = \\\\{ h \\in H \\mid a(h) \\geq m \\\\}\n    $$\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance.\n    \"\"\"\n\n    self._validate_abundance_operation(None, \"trim below median\")\n\n    if len(self._abundances) == 0:\n        self.logger.debug(\"No hashes to trim based on median abundance.\")\n        return\n\n    median = np.median(self._abundances)\n    mask = self._abundances &gt;= median\n    self._apply_mask(mask)\n    self.logger.debug(\"Trimmed hashes with abundance below median (%f).\", median)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.trim_singletons","title":"<code>trim_singletons()</code>","text":"<p>Remove hashes with abundance equal to 1.</p> <p>This method removes all hashes that are singletons (abundance equals 1).</p> <p>Mathematical Explanation:</p> <p>The updated hash set \\( H' \\) is: $$ H' = { h \\in H \\mid a(h) \\neq 1 } $$</p> <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance.</p> Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def trim_singletons(self):\n    r\"\"\"\n    Remove hashes with abundance equal to 1.\n\n    This method removes all hashes that are singletons (abundance equals 1).\n\n    **Mathematical Explanation**:\n\n    The updated hash set \\( H' \\) is:\n    $$\n    H' = \\{ h \\in H \\mid a(h) \\neq 1 \\}\n    $$\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance.\n    \"\"\"\n    self._validate_abundance_operation(None, \"trim singletons\")\n\n    mask = self._abundances != 1\n    self._apply_mask(mask)\n    self.logger.debug(\"Trimmed hashes with abundance equal to 1.\")\n</code></pre>"},{"location":"SnipeSig/#snipe.api.SnipeSig.union_sigs","title":"<code>union_sigs(other)</code>","text":"<p>Combine this signature with another by summing abundances where hashes overlap.</p> <p>Given two signatures \\( A \\) and \\( B \\) with hash sets \\( H_A \\) and \\( H_B \\), and their corresponding abundance functions \\( a_A \\) and \\( a_B \\), the union signature \\( C \\) is defined as follows:</p> <ul> <li>Hash Set: </li> </ul> \\[ H_C = H_A \\cup H_B \\] <ul> <li>Abundance Function:</li> </ul> \\[ a_C(h) = \\begin{cases}      a_A(h) + a_B(h), &amp; \\text{if } h \\in H_A \\cap H_B \\\\     a_A(h), &amp; \\text{if } h \\in H_A \\setminus H_B \\\\     a_B(h), &amp; \\text{if } h \\in H_B \\setminus H_A \\end{cases} \\] Source code in <code>src/snipe/api/__init__.py</code> <pre><code>def union_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Combine this signature with another by summing abundances where hashes overlap.\n\n    Given two signatures \\( A \\) and \\( B \\) with hash sets \\( H_A \\) and \\( H_B \\),\n    and their corresponding abundance functions \\( a_A \\) and \\( a_B \\), the union\n    signature \\( C \\) is defined as follows:\n\n    - **Hash Set**: \n\n    $$\n    H_C = H_A \\cup H_B\n    $$\n\n    - **Abundance Function**:\n\n    $$\n    a_C(h) =\n    \\begin{cases} \n        a_A(h) + a_B(h), &amp; \\text{if } h \\in H_A \\cap H_B \\\\\n        a_A(h), &amp; \\text{if } h \\in H_A \\setminus H_B \\\\\n        a_B(h), &amp; \\text{if } h \\in H_B \\setminus H_A\n    \\end{cases}\n    $$\n    \"\"\"\n    self.__verify_snipe_signature(other)\n    self.__verify_matching_ksize_scale(other)\n\n    self.logger.debug(\"Unioning signatures (including all unique hashes).\")\n\n    # Access internal arrays directly\n    self_hashes = self._hashes\n    self_abundances = self._abundances\n    other_hashes = other._hashes\n    other_abundances = other._abundances\n\n    # Handle the case where 'other' does not track abundance\n    if not other.track_abundance:\n        self.logger.debug(\"Other signature does not track abundance. Setting abundances to 1.\")\n        other_abundances = np.ones_like(other_abundances, dtype=np.uint32)\n\n    # Combine hashes and abundances\n    combined_hashes = np.concatenate((self_hashes, other_hashes))\n    combined_abundances = np.concatenate((self_abundances, other_abundances))\n\n    # Use numpy's unique function with return_inverse to sum abundances efficiently\n    unique_hashes, inverse_indices = np.unique(combined_hashes, return_inverse=True)\n    summed_abundances = np.zeros_like(unique_hashes, dtype=np.uint32)\n\n    # Sum abundances for duplicate hashes\n    np.add.at(summed_abundances, inverse_indices, combined_abundances)\n\n    # Handle potential overflow\n    summed_abundances = np.minimum(summed_abundances, np.iinfo(np.uint32).max)\n\n    self.logger.debug(\"Union operation completed. Total hashes: %d\", len(unique_hashes))\n\n    # Create a new SnipeSig instance\n    return self.create_from_hashes_abundances(\n        hashes=unique_hashes,\n        abundances=summed_abundances,\n        ksize=self._ksize,\n        scale=self._scale,\n        name=f\"{self._name}_union_{other._name}\",\n        filename=None,\n        enable_logging=self.logger.level &lt;= logging.DEBUG\n    )\n</code></pre>"},{"location":"cli/","title":"Command Line Interface (CLI) Documentation","text":"<p>Below is the auto-generated CLI documentation from <code>click</code>.</p> <pre><code>snipe --help\n</code></pre>"}]}
\ No newline at end of file
+{"config":{"lang":["en"],"separator":"[\\s\\-]+","pipeline":["stopWordFilter"]},"docs":[{"location":"","title":"Welcome to MkDocs","text":""},{"location":"ReferenceQC/","title":"Python API Documentation","text":""},{"location":"ReferenceQC/#snipe.api.reference_QC.PreparedQC","title":"<code>PreparedQC</code>","text":"<p>               Bases: <code>ReferenceQC</code></p> <p>Class for quality control (QC) analysis of sample signature against prepared snipe profiles.</p> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>class PreparedQC(ReferenceQC):\n    r\"\"\"\n    Class for quality control (QC) analysis of sample signature against prepared snipe profiles.\n    \"\"\"\n\n    def __init__(self, *, sample_sig: SnipeSig, snipe_db_path: str = '~/.snipe/dbs/', ref_id: Optional[str] = None, amplicon_id: Optional[str] = None, enable_logging: bool = False, **kwargs):\n        \"\"\"\n        Initialize the PreparedQC instance.\n\n        **Parameters**\n\n        - `sample_sig` (`SnipeSig`): The sample k-mer signature.\n        - `snipe_db_path` (`str`): Path to the local Snipe database directory.\n        - `ref_id` (`Optional[str]`): Reference identifier for selecting specific profiles.\n        - `enable_logging` (`bool`): Flag to enable detailed logging.\n        - `**kwargs`: Additional keyword arguments.\n        \"\"\"\n        self.snipe_db_path = os.path.expanduser(snipe_db_path)\n        self.ref_id = ref_id\n\n        # Ensure the local database directory exists\n        os.makedirs(self.snipe_db_path, exist_ok=True)\n        if enable_logging:\n            self.logger.debug(f\"Local Snipe DB path set to: {self.snipe_db_path}\")\n        else:\n            self.logger.debug(\"Logging is disabled for PreparedQC.\")\n\n        # Initialize without a reference signature for now; it can be set after downloading\n        super().__init__(\n            sample_sig=sample_sig,\n            reference_sig=None,  # To be set after downloading\n            enable_logging=enable_logging,\n            **kwargs\n        )\n\n    def download_osf_db(self, url: str, save_path: str = '~/.snipe/dbs', force: bool = False) -&gt; Optional[str]:\n        \"\"\"\n        Download a file from OSF using the provided URL. The file is saved with its original name \n        as specified by the OSF server via the Content-Disposition header.\n\n        **Parameters**\n\n        - `url` (`str`): The OSF URL to download the file from.\n        - `save_path` (`str`): The directory path where the file will be saved. Supports user (~) and environment variables.\n                               Default is the local Snipe database directory.\n        - `force` (`bool`): If True, overwrite the file if it already exists. Default is False.\n\n        **Returns**\n\n        - `Optional[str]`: The path to the downloaded file if successful, else None.\n\n        **Raises**\n\n        - `requests.exceptions.RequestException`: If an error occurs during the HTTP request.\n        - `Exception`: For any other exceptions that may arise.\n        \"\"\"\n        try:\n            # Expand user (~) and environment variables in save_path\n            expanded_save_path = os.path.expanduser(os.path.expandvars(save_path))\n            self.logger.debug(f\"Expanded save path: {expanded_save_path}\")\n\n            # Ensure the download URL ends with '/download'\n            parsed_url = urlparse(url)\n            if not parsed_url.path.endswith('/download'):\n                download_url = f\"{url.rstrip('/')}/download\"\n            else:\n                download_url = url\n\n            self.logger.debug(f\"Download URL: {download_url}\")\n\n            # Ensure the save directory exists\n            os.makedirs(expanded_save_path, exist_ok=True)\n            self.logger.debug(f\"Save path verified/created: {expanded_save_path}\")\n\n            # Initiate the GET request with streaming\n            with requests.get(download_url, stream=True, allow_redirects=True) as response:\n                response.raise_for_status()  # Raise an exception for HTTP errors\n\n                # Attempt to extract filename from Content-Disposition\n                content_disposition = response.headers.get('Content-Disposition')\n                filename = self._extract_filename(content_disposition, parsed_url.path)\n                self.logger.debug(f\"Filename determined: {filename}\")\n\n                # Define the full save path\n                full_save_path = os.path.join(expanded_save_path, filename)\n                self.logger.debug(f\"Full save path: {full_save_path}\")\n\n                # Check if the file already exists\n                if os.path.exists(full_save_path):\n                    if force:\n                        self.logger.info(f\"Overwriting existing file: {full_save_path}\")\n                    else:\n                        self.logger.info(f\"File already exists: {full_save_path}. Skipping download.\")\n                        return full_save_path\n\n                # Get the total file size for the progress bar\n                total_size = int(response.headers.get('Content-Length', 0))\n\n                # Initialize the progress bar\n                with open(full_save_path, 'wb') as file, tqdm(\n                    total=total_size, \n                    unit='B', \n                    unit_scale=True, \n                    unit_divisor=1024,\n                    desc=filename,\n                    ncols=100\n                ) as bar:\n                    for chunk in response.iter_content(chunk_size=1024):\n                        if chunk:  # Filter out keep-alive chunks\n                            file.write(chunk)\n                            bar.update(len(chunk))\n\n                self.logger.info(f\"File downloaded successfully: {full_save_path}\")\n                return full_save_path\n\n        except requests.exceptions.RequestException as req_err:\n            self.logger.error(f\"Request error occurred while downloading {url}: {req_err}\")\n            raise\n        except Exception as e:\n            self.logger.error(f\"An unexpected error occurred while downloading {url}: {e}\")\n            raise\n\n    def _extract_filename(self, content_disposition: Optional[str], url_path: str) -&gt; str:\n        \"\"\"\n        Extract filename from Content-Disposition header or fallback to URL path.\n\n        **Parameters**\n\n        - `content_disposition` (`Optional[str]`): The Content-Disposition header value.\n        - `url_path` (`str`): The path component of the URL.\n\n        **Returns**\n\n        - `str`: The extracted filename.\n        \"\"\"\n        filename = None\n        if content_disposition:\n            self.logger.debug(\"Parsing Content-Disposition header for filename.\")\n            parts = content_disposition.split(';')\n            for part in parts:\n                part = part.strip()\n                if part.lower().startswith('filename*='):\n                    # Handle RFC 5987 encoding (e.g., filename*=UTF-8''example.txt)\n                    encoded_filename = part.split('=', 1)[1].strip()\n                    if \"''\" in encoded_filename:\n                        filename = encoded_filename.split(\"''\", 1)[1]\n                    else:\n                        filename = encoded_filename\n                    self.logger.debug(f\"Filename extracted from headers (RFC 5987): {filename}\")\n                    break\n                elif part.lower().startswith('filename='):\n                    # Remove 'filename=' and any surrounding quotes\n                    filename = part.split('=', 1)[1].strip(' \"')\n                    self.logger.debug(f\"Filename extracted from headers: {filename}\")\n                    break\n\n        if not filename:\n            self.logger.debug(\"Falling back to filename derived from URL path.\")\n            filename = os.path.basename(url_path)\n            if not filename:\n                filename = 'downloaded_file'\n            self.logger.debug(f\"Filename derived from URL: {filename}\")\n\n        return filename\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.PreparedQC.__init__","title":"<code>__init__(*, sample_sig, snipe_db_path='~/.snipe/dbs/', ref_id=None, amplicon_id=None, enable_logging=False, **kwargs)</code>","text":"<p>Initialize the PreparedQC instance.</p> <p>Parameters</p> <ul> <li><code>sample_sig</code> (<code>SnipeSig</code>): The sample k-mer signature.</li> <li><code>snipe_db_path</code> (<code>str</code>): Path to the local Snipe database directory.</li> <li><code>ref_id</code> (<code>Optional[str]</code>): Reference identifier for selecting specific profiles.</li> <li><code>enable_logging</code> (<code>bool</code>): Flag to enable detailed logging.</li> <li><code>**kwargs</code>: Additional keyword arguments.</li> </ul> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def __init__(self, *, sample_sig: SnipeSig, snipe_db_path: str = '~/.snipe/dbs/', ref_id: Optional[str] = None, amplicon_id: Optional[str] = None, enable_logging: bool = False, **kwargs):\n    \"\"\"\n    Initialize the PreparedQC instance.\n\n    **Parameters**\n\n    - `sample_sig` (`SnipeSig`): The sample k-mer signature.\n    - `snipe_db_path` (`str`): Path to the local Snipe database directory.\n    - `ref_id` (`Optional[str]`): Reference identifier for selecting specific profiles.\n    - `enable_logging` (`bool`): Flag to enable detailed logging.\n    - `**kwargs`: Additional keyword arguments.\n    \"\"\"\n    self.snipe_db_path = os.path.expanduser(snipe_db_path)\n    self.ref_id = ref_id\n\n    # Ensure the local database directory exists\n    os.makedirs(self.snipe_db_path, exist_ok=True)\n    if enable_logging:\n        self.logger.debug(f\"Local Snipe DB path set to: {self.snipe_db_path}\")\n    else:\n        self.logger.debug(\"Logging is disabled for PreparedQC.\")\n\n    # Initialize without a reference signature for now; it can be set after downloading\n    super().__init__(\n        sample_sig=sample_sig,\n        reference_sig=None,  # To be set after downloading\n        enable_logging=enable_logging,\n        **kwargs\n    )\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.PreparedQC.download_osf_db","title":"<code>download_osf_db(url, save_path='~/.snipe/dbs', force=False)</code>","text":"<p>Download a file from OSF using the provided URL. The file is saved with its original name  as specified by the OSF server via the Content-Disposition header.</p> <p>Parameters</p> <ul> <li><code>url</code> (<code>str</code>): The OSF URL to download the file from.</li> <li><code>save_path</code> (<code>str</code>): The directory path where the file will be saved. Supports user (~) and environment variables.                        Default is the local Snipe database directory.</li> <li><code>force</code> (<code>bool</code>): If True, overwrite the file if it already exists. Default is False.</li> </ul> <p>Returns</p> <ul> <li><code>Optional[str]</code>: The path to the downloaded file if successful, else None.</li> </ul> <p>Raises</p> <ul> <li><code>requests.exceptions.RequestException</code>: If an error occurs during the HTTP request.</li> <li><code>Exception</code>: For any other exceptions that may arise.</li> </ul> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def download_osf_db(self, url: str, save_path: str = '~/.snipe/dbs', force: bool = False) -&gt; Optional[str]:\n    \"\"\"\n    Download a file from OSF using the provided URL. The file is saved with its original name \n    as specified by the OSF server via the Content-Disposition header.\n\n    **Parameters**\n\n    - `url` (`str`): The OSF URL to download the file from.\n    - `save_path` (`str`): The directory path where the file will be saved. Supports user (~) and environment variables.\n                           Default is the local Snipe database directory.\n    - `force` (`bool`): If True, overwrite the file if it already exists. Default is False.\n\n    **Returns**\n\n    - `Optional[str]`: The path to the downloaded file if successful, else None.\n\n    **Raises**\n\n    - `requests.exceptions.RequestException`: If an error occurs during the HTTP request.\n    - `Exception`: For any other exceptions that may arise.\n    \"\"\"\n    try:\n        # Expand user (~) and environment variables in save_path\n        expanded_save_path = os.path.expanduser(os.path.expandvars(save_path))\n        self.logger.debug(f\"Expanded save path: {expanded_save_path}\")\n\n        # Ensure the download URL ends with '/download'\n        parsed_url = urlparse(url)\n        if not parsed_url.path.endswith('/download'):\n            download_url = f\"{url.rstrip('/')}/download\"\n        else:\n            download_url = url\n\n        self.logger.debug(f\"Download URL: {download_url}\")\n\n        # Ensure the save directory exists\n        os.makedirs(expanded_save_path, exist_ok=True)\n        self.logger.debug(f\"Save path verified/created: {expanded_save_path}\")\n\n        # Initiate the GET request with streaming\n        with requests.get(download_url, stream=True, allow_redirects=True) as response:\n            response.raise_for_status()  # Raise an exception for HTTP errors\n\n            # Attempt to extract filename from Content-Disposition\n            content_disposition = response.headers.get('Content-Disposition')\n            filename = self._extract_filename(content_disposition, parsed_url.path)\n            self.logger.debug(f\"Filename determined: {filename}\")\n\n            # Define the full save path\n            full_save_path = os.path.join(expanded_save_path, filename)\n            self.logger.debug(f\"Full save path: {full_save_path}\")\n\n            # Check if the file already exists\n            if os.path.exists(full_save_path):\n                if force:\n                    self.logger.info(f\"Overwriting existing file: {full_save_path}\")\n                else:\n                    self.logger.info(f\"File already exists: {full_save_path}. Skipping download.\")\n                    return full_save_path\n\n            # Get the total file size for the progress bar\n            total_size = int(response.headers.get('Content-Length', 0))\n\n            # Initialize the progress bar\n            with open(full_save_path, 'wb') as file, tqdm(\n                total=total_size, \n                unit='B', \n                unit_scale=True, \n                unit_divisor=1024,\n                desc=filename,\n                ncols=100\n            ) as bar:\n                for chunk in response.iter_content(chunk_size=1024):\n                    if chunk:  # Filter out keep-alive chunks\n                        file.write(chunk)\n                        bar.update(len(chunk))\n\n            self.logger.info(f\"File downloaded successfully: {full_save_path}\")\n            return full_save_path\n\n    except requests.exceptions.RequestException as req_err:\n        self.logger.error(f\"Request error occurred while downloading {url}: {req_err}\")\n        raise\n    except Exception as e:\n        self.logger.error(f\"An unexpected error occurred while downloading {url}: {e}\")\n        raise\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC","title":"<code>ReferenceQC</code>","text":"<p>Class for performing quality control of sequencing data against a reference genome.</p> <p>This class computes various metrics to assess the quality and characteristics of a sequencing sample, including coverage indices and abundance ratios, by comparing sample k-mer signatures with a reference genome and an optional amplicon signature.</p> <p>Parameters</p> <ul> <li><code>sample_sig</code> (<code>SnipeSig</code>): The sample k-mer signature (must be of type <code>SigType.SAMPLE</code>).</li> <li><code>reference_sig</code> (<code>SnipeSig</code>): The reference genome k-mer signature (must be of type <code>SigType.GENOME</code>).</li> <li><code>amplicon_sig</code> (<code>Optional[SnipeSig]</code>): The amplicon k-mer signature (must be of type <code>SigType.AMPLICON</code>), if applicable.</li> <li><code>enable_logging</code> (<code>bool</code>): Flag to enable detailed logging.</li> </ul> <p>Attributes</p> <ul> <li><code>sample_sig</code> (<code>SnipeSig</code>): The sample signature.</li> <li><code>reference_sig</code> (<code>SnipeSig</code>): The reference genome signature.</li> <li><code>amplicon_sig</code> (<code>Optional[SnipeSig]</code>): The amplicon signature.</li> <li><code>sample_stats</code> (<code>Dict[str, Any]</code>): Statistics of the sample signature.</li> <li><code>genome_stats</code> (<code>Dict[str, Any]</code>): Calculated genome-related statistics.</li> <li><code>amplicon_stats</code> (<code>Dict[str, Any]</code>): Calculated amplicon-related statistics (if <code>amplicon_sig</code> is provided).</li> <li><code>advanced_stats</code> (<code>Dict[str, Any]</code>): Calculated advanced statistics (optional).</li> <li><code>predicted_assay_type</code> (<code>str</code>): Predicted assay type based on metrics.</li> </ul> <p>Calculated Metrics</p> <p>The class calculates the following metrics:</p> <ul> <li> <p>Total unique k-mers</p> <ul> <li>Description: Number of unique k-mers in the sample signature.</li> <li>Calculation:   $$   \\text{Total unique k-mers} = \\left| \\text{Sample k-mer set} \\right|   $$</li> </ul> </li> <li> <p>k-mer total abundance</p> <ul> <li>Description: Sum of abundances of all k-mers in the sample signature.</li> <li>Calculation:   $$   \\text{k-mer total abundance} = \\sum_{k \\in \\text{Sample k-mer set}} \\text{abundance}(k)   $$</li> </ul> </li> <li> <p>k-mer mean abundance</p> <ul> <li>Description: Average abundance of k-mers in the sample signature.</li> <li>Calculation:   $$   \\text{k-mer mean abundance} = \\frac{\\text{k-mer total abundance}}{\\text{Total unique k-mers}}   $$</li> </ul> </li> <li> <p>k-mer median abundance</p> <ul> <li>Description: Median abundance of k-mers in the sample signature.</li> <li>Calculation: Median of abundances in the sample k-mers.</li> </ul> </li> <li> <p>Number of singletons</p> <ul> <li>Description: Number of k-mers with an abundance of 1 in the sample signature.</li> <li>Calculation:   $$   \\text{Number of singletons} = \\left| { k \\in \\text{Sample k-mer set} \\mid \\text{abundance}(k) = 1 } \\right|   $$</li> </ul> </li> <li> <p>Genomic unique k-mers</p> <ul> <li>Description: Number of k-mers shared between the sample and the reference genome.</li> <li>Calculation:   $$   \\text{Genomic unique k-mers} = \\left| \\text{Sample k-mer set} \\cap \\text{Reference genome k-mer set} \\right|   $$</li> </ul> </li> <li> <p>Genome coverage index</p> <ul> <li>Description: Proportion of the reference genome's k-mers that are present in the sample.</li> <li>Calculation:   $$   \\text{Genome coverage index} = \\frac{\\text{Genomic unique k-mers}}{\\left| \\text{Reference genome k-mer set} \\right|}   $$</li> </ul> </li> <li> <p>Genomic k-mers total abundance</p> <ul> <li>Description: Sum of abundances for k-mers shared with the reference genome.</li> <li>Calculation:   $$   \\text{Genomic k-mers total abundance} = \\sum_{k \\in \\text{Sample k-mer set} \\cap \\text{Reference genome k-mer set}} \\text{abundance}(k)   $$</li> </ul> </li> <li> <p>Genomic k-mers mean abundance</p> <ul> <li>Description: Average abundance of k-mers shared with the reference genome.</li> <li>Calculation:   $$   \\text{Genomic k-mers mean abundance} = \\frac{\\text{Genomic k-mers total abundance}}{\\text{Genomic unique k-mers}}   $$</li> </ul> </li> <li> <p>Mapping index</p> <ul> <li>Description: Proportion of the sample's total k-mer abundance that maps to the reference genome.</li> <li>Calculation:   $$   \\text{Mapping index} = \\frac{\\text{Genomic k-mers total abundance}}{\\text{k-mer total abundance}}   $$</li> </ul> </li> </ul> <p>If <code>amplicon_sig</code> is provided, additional metrics are calculated:</p> <ul> <li> <p>Amplicon unique k-mers</p> <ul> <li>Description: Number of k-mers shared between the sample and the amplicon.</li> <li>Calculation:   $$   \\text{Amplicon unique k-mers} = \\left| \\text{Sample k-mer set} \\cap \\text{Amplicon k-mer set} \\right|   $$</li> </ul> </li> <li> <p>Amplicon coverage index</p> <ul> <li>Description: Proportion of the amplicon's k-mers that are present in the sample.</li> <li>Calculation:   $$   \\text{Amplicon coverage index} = \\frac{\\text{Amplicon unique k-mers}}{\\left| \\text{Amplicon k-mer set} \\right|}   $$</li> </ul> </li> <li> <p>Amplicon k-mers total abundance</p> <ul> <li>Description: Sum of abundances for k-mers shared with the amplicon.</li> <li>Calculation:   $$   \\text{Amplicon k-mers total abundance} = \\sum_{k \\in \\text{Sample k-mer set} \\cap \\text{Amplicon k-mer set}} \\text{abundance}(k)   $$</li> </ul> </li> <li> <p>Amplicon k-mers mean abundance</p> <ul> <li>Description: Average abundance of k-mers shared with the amplicon.</li> <li>Calculation:   $$   \\text{Amplicon k-mers mean abundance} = \\frac{\\text{Amplicon k-mers total abundance}}{\\text{Amplicon unique k-mers}}   $$</li> </ul> </li> <li> <p>Relative total abundance</p> <ul> <li>Description: Ratio of the amplicon k-mers total abundance to the genomic k-mers total abundance.</li> <li>Calculation:   $$   \\text{Relative total abundance} = \\frac{\\text{Amplicon k-mers total abundance}}{\\text{Genomic k-mers total abundance}}   $$</li> </ul> </li> <li> <p>Relative coverage</p> <ul> <li>Description: Ratio of the amplicon coverage index to the genome coverage index.</li> <li>Calculation:   $$   \\text{Relative coverage} = \\frac{\\text{Amplicon coverage index}}{\\text{Genome coverage index}}   $$</li> </ul> </li> <li> <p>Predicted Assay Type</p> <ul> <li>Description: Predicted assay type based on the <code>Relative total abundance</code>.</li> <li>Calculation:</li> <li>If \\(\\text{Relative total abundance} \\leq 0.0809\\), then WGS (Whole Genome Sequencing).</li> <li>If \\(\\text{Relative total abundance} \\geq 0.1188\\), then WXS (Whole Exome Sequencing).</li> <li>If between these values, assign based on the closest threshold.</li> </ul> </li> </ul> <p>Advanced Metrics (optional, calculated if <code>include_advanced</code> is <code>True</code>):</p> <ul> <li> <p>Median-trimmed unique k-mers</p> <ul> <li>Description: Number of unique k-mers in the sample after removing k-mers with abundance below the median.</li> <li>Calculation:</li> <li>Remove k-mers where \\(\\text{abundance}(k) &lt; \\text{Median abundance}\\).</li> <li>Count the remaining k-mers.</li> </ul> </li> <li> <p>Median-trimmed total abundance</p> <ul> <li>Description: Sum of abundances after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed total abundance} = \\sum_{k \\in \\text{Median-trimmed Sample k-mer set}} \\text{abundance}(k)   $$</li> </ul> </li> <li> <p>Median-trimmed mean abundance</p> <ul> <li>Description: Average abundance after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed mean abundance} = \\frac{\\text{Median-trimmed total abundance}}{\\text{Median-trimmed unique k-mers}}   $$</li> </ul> </li> <li> <p>Median-trimmed median abundance</p> <ul> <li>Description: Median abundance after median trimming.</li> <li>Calculation: Median of abundances in the median-trimmed sample.</li> </ul> </li> <li> <p>Median-trimmed Genomic unique k-mers</p> <ul> <li>Description: Number of genomic k-mers in the median-trimmed sample.</li> <li>Calculation:   $$   \\text{Median-trimmed Genomic unique k-mers} = \\left| \\text{Median-trimmed Sample k-mer set} \\cap \\text{Reference genome k-mer set} \\right|   $$</li> </ul> </li> <li> <p>Median-trimmed Genome coverage index</p> <ul> <li>Description: Genome coverage index after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed Genome coverage index} = \\frac{\\text{Median-trimmed Genomic unique k-mers}}{\\left| \\text{Reference genome k-mer set} \\right|}   $$</li> </ul> </li> <li> <p>Median-trimmed Amplicon unique k-mers (if <code>amplicon_sig</code> is provided)</p> <ul> <li>Description: Number of amplicon k-mers in the median-trimmed sample.</li> <li>Calculation:   $$   \\text{Median-trimmed Amplicon unique k-mers} = \\left| \\text{Median-trimmed Sample k-mer set} \\cap \\text{Amplicon k-mer set} \\right|   $$</li> </ul> </li> <li> <p>Median-trimmed Amplicon coverage index</p> <ul> <li>Description: Amplicon coverage index after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed Amplicon coverage index} = \\frac{\\text{Median-trimmed Amplicon unique k-mers}}{\\left| \\text{Amplicon k-mer set} \\right|}   $$</li> </ul> </li> <li> <p>Median-trimmed relative coverage</p> <ul> <li>Description: Relative coverage after median trimming.</li> <li>Calculation:   $$   \\text{Median-trimmed relative coverage} = \\frac{\\text{Median-trimmed Amplicon coverage index}}{\\text{Median-trimmed Genome coverage index}}   $$</li> </ul> </li> <li> <p>Median-trimmed relative mean abundance</p> <ul> <li>Description: Ratio of median-trimmed amplicon mean abundance to median-trimmed genomic mean abundance.</li> <li>Calculation:   $$   \\text{Median-trimmed relative mean abundance} = \\frac{\\text{Median-trimmed Amplicon mean abundance}}{\\text{Median-trimmed Genomic mean abundance}}   $$</li> </ul> </li> </ul> <p>Usage Example</p> <pre><code>qc = ReferenceQC(\n    sample_sig=sample_signature,\n    reference_sig=reference_signature,\n    amplicon_sig=amplicon_signature,\n    enable_logging=True\n)\n\nstats = qc.get_aggregated_stats(include_advanced=True)\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>class ReferenceQC:\n    r\"\"\"\n    Class for performing quality control of sequencing data against a reference genome.\n\n    This class computes various metrics to assess the quality and characteristics of a sequencing sample, including coverage indices and abundance ratios, by comparing sample k-mer signatures with a reference genome and an optional amplicon signature.\n\n    **Parameters**\n\n    - `sample_sig` (`SnipeSig`): The sample k-mer signature (must be of type `SigType.SAMPLE`).\n    - `reference_sig` (`SnipeSig`): The reference genome k-mer signature (must be of type `SigType.GENOME`).\n    - `amplicon_sig` (`Optional[SnipeSig]`): The amplicon k-mer signature (must be of type `SigType.AMPLICON`), if applicable.\n    - `enable_logging` (`bool`): Flag to enable detailed logging.\n\n    **Attributes**\n\n    - `sample_sig` (`SnipeSig`): The sample signature.\n    - `reference_sig` (`SnipeSig`): The reference genome signature.\n    - `amplicon_sig` (`Optional[SnipeSig]`): The amplicon signature.\n    - `sample_stats` (`Dict[str, Any]`): Statistics of the sample signature.\n    - `genome_stats` (`Dict[str, Any]`): Calculated genome-related statistics.\n    - `amplicon_stats` (`Dict[str, Any]`): Calculated amplicon-related statistics (if `amplicon_sig` is provided).\n    - `advanced_stats` (`Dict[str, Any]`): Calculated advanced statistics (optional).\n    - `predicted_assay_type` (`str`): Predicted assay type based on metrics.\n\n    **Calculated Metrics**\n\n    The class calculates the following metrics:\n\n    - **Total unique k-mers**\n        - Description: Number of unique k-mers in the sample signature.\n        - Calculation:\n          $$\n          \\text{Total unique k-mers} = \\left| \\text{Sample k-mer set} \\right|\n          $$\n\n    - **k-mer total abundance**\n        - Description: Sum of abundances of all k-mers in the sample signature.\n        - Calculation:\n          $$\n          \\text{k-mer total abundance} = \\sum_{k \\in \\text{Sample k-mer set}} \\text{abundance}(k)\n          $$\n\n    - **k-mer mean abundance**\n        - Description: Average abundance of k-mers in the sample signature.\n        - Calculation:\n          $$\n          \\text{k-mer mean abundance} = \\frac{\\text{k-mer total abundance}}{\\text{Total unique k-mers}}\n          $$\n\n    - **k-mer median abundance**\n        - Description: Median abundance of k-mers in the sample signature.\n        - Calculation: Median of abundances in the sample k-mers.\n\n    - **Number of singletons**\n        - Description: Number of k-mers with an abundance of 1 in the sample signature.\n        - Calculation:\n          $$\n          \\text{Number of singletons} = \\left| \\{ k \\in \\text{Sample k-mer set} \\mid \\text{abundance}(k) = 1 \\} \\right|\n          $$\n\n    - **Genomic unique k-mers**\n        - Description: Number of k-mers shared between the sample and the reference genome.\n        - Calculation:\n          $$\n          \\text{Genomic unique k-mers} = \\left| \\text{Sample k-mer set} \\cap \\text{Reference genome k-mer set} \\right|\n          $$\n\n    - **Genome coverage index**\n        - Description: Proportion of the reference genome's k-mers that are present in the sample.\n        - Calculation:\n          $$\n          \\text{Genome coverage index} = \\frac{\\text{Genomic unique k-mers}}{\\left| \\text{Reference genome k-mer set} \\right|}\n          $$\n\n    - **Genomic k-mers total abundance**\n        - Description: Sum of abundances for k-mers shared with the reference genome.\n        - Calculation:\n          $$\n          \\text{Genomic k-mers total abundance} = \\sum_{k \\in \\text{Sample k-mer set} \\cap \\text{Reference genome k-mer set}} \\text{abundance}(k)\n          $$\n\n    - **Genomic k-mers mean abundance**\n        - Description: Average abundance of k-mers shared with the reference genome.\n        - Calculation:\n          $$\n          \\text{Genomic k-mers mean abundance} = \\frac{\\text{Genomic k-mers total abundance}}{\\text{Genomic unique k-mers}}\n          $$\n\n    - **Mapping index**\n        - Description: Proportion of the sample's total k-mer abundance that maps to the reference genome.\n        - Calculation:\n          $$\n          \\text{Mapping index} = \\frac{\\text{Genomic k-mers total abundance}}{\\text{k-mer total abundance}}\n          $$\n\n    If `amplicon_sig` is provided, additional metrics are calculated:\n\n    - **Amplicon unique k-mers**\n        - Description: Number of k-mers shared between the sample and the amplicon.\n        - Calculation:\n          $$\n          \\text{Amplicon unique k-mers} = \\left| \\text{Sample k-mer set} \\cap \\text{Amplicon k-mer set} \\right|\n          $$\n\n    - **Amplicon coverage index**\n        - Description: Proportion of the amplicon's k-mers that are present in the sample.\n        - Calculation:\n          $$\n          \\text{Amplicon coverage index} = \\frac{\\text{Amplicon unique k-mers}}{\\left| \\text{Amplicon k-mer set} \\right|}\n          $$\n\n    - **Amplicon k-mers total abundance**\n        - Description: Sum of abundances for k-mers shared with the amplicon.\n        - Calculation:\n          $$\n          \\text{Amplicon k-mers total abundance} = \\sum_{k \\in \\text{Sample k-mer set} \\cap \\text{Amplicon k-mer set}} \\text{abundance}(k)\n          $$\n\n    - **Amplicon k-mers mean abundance**\n        - Description: Average abundance of k-mers shared with the amplicon.\n        - Calculation:\n          $$\n          \\text{Amplicon k-mers mean abundance} = \\frac{\\text{Amplicon k-mers total abundance}}{\\text{Amplicon unique k-mers}}\n          $$\n\n    - **Relative total abundance**\n        - Description: Ratio of the amplicon k-mers total abundance to the genomic k-mers total abundance.\n        - Calculation:\n          $$\n          \\text{Relative total abundance} = \\frac{\\text{Amplicon k-mers total abundance}}{\\text{Genomic k-mers total abundance}}\n          $$\n\n    - **Relative coverage**\n        - Description: Ratio of the amplicon coverage index to the genome coverage index.\n        - Calculation:\n          $$\n          \\text{Relative coverage} = \\frac{\\text{Amplicon coverage index}}{\\text{Genome coverage index}}\n          $$\n\n    - **Predicted Assay Type**\n        - Description: Predicted assay type based on the `Relative total abundance`.\n        - Calculation:\n          - If \\(\\text{Relative total abundance} \\leq 0.0809\\), then **WGS** (Whole Genome Sequencing).\n          - If \\(\\text{Relative total abundance} \\geq 0.1188\\), then **WXS** (Whole Exome Sequencing).\n          - If between these values, assign based on the closest threshold.\n\n    **Advanced Metrics** (optional, calculated if `include_advanced` is `True`):\n\n    - **Median-trimmed unique k-mers**\n        - Description: Number of unique k-mers in the sample after removing k-mers with abundance below the median.\n        - Calculation:\n          - Remove k-mers where \\(\\text{abundance}(k) &lt; \\text{Median abundance}\\).\n          - Count the remaining k-mers.\n\n    - **Median-trimmed total abundance**\n        - Description: Sum of abundances after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed total abundance} = \\sum_{k \\in \\text{Median-trimmed Sample k-mer set}} \\text{abundance}(k)\n          $$\n\n    - **Median-trimmed mean abundance**\n        - Description: Average abundance after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed mean abundance} = \\frac{\\text{Median-trimmed total abundance}}{\\text{Median-trimmed unique k-mers}}\n          $$\n\n    - **Median-trimmed median abundance**\n        - Description: Median abundance after median trimming.\n        - Calculation: Median of abundances in the median-trimmed sample.\n\n    - **Median-trimmed Genomic unique k-mers**\n        - Description: Number of genomic k-mers in the median-trimmed sample.\n        - Calculation:\n          $$\n          \\text{Median-trimmed Genomic unique k-mers} = \\left| \\text{Median-trimmed Sample k-mer set} \\cap \\text{Reference genome k-mer set} \\right|\n          $$\n\n    - **Median-trimmed Genome coverage index**\n        - Description: Genome coverage index after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed Genome coverage index} = \\frac{\\text{Median-trimmed Genomic unique k-mers}}{\\left| \\text{Reference genome k-mer set} \\right|}\n          $$\n\n    - **Median-trimmed Amplicon unique k-mers** (if `amplicon_sig` is provided)\n        - Description: Number of amplicon k-mers in the median-trimmed sample.\n        - Calculation:\n          $$\n          \\text{Median-trimmed Amplicon unique k-mers} = \\left| \\text{Median-trimmed Sample k-mer set} \\cap \\text{Amplicon k-mer set} \\right|\n          $$\n\n    - **Median-trimmed Amplicon coverage index**\n        - Description: Amplicon coverage index after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed Amplicon coverage index} = \\frac{\\text{Median-trimmed Amplicon unique k-mers}}{\\left| \\text{Amplicon k-mer set} \\right|}\n          $$\n\n    - **Median-trimmed relative coverage**\n        - Description: Relative coverage after median trimming.\n        - Calculation:\n          $$\n          \\text{Median-trimmed relative coverage} = \\frac{\\text{Median-trimmed Amplicon coverage index}}{\\text{Median-trimmed Genome coverage index}}\n          $$\n\n    - **Median-trimmed relative mean abundance**\n        - Description: Ratio of median-trimmed amplicon mean abundance to median-trimmed genomic mean abundance.\n        - Calculation:\n          $$\n          \\text{Median-trimmed relative mean abundance} = \\frac{\\text{Median-trimmed Amplicon mean abundance}}{\\text{Median-trimmed Genomic mean abundance}}\n          $$\n\n    **Usage Example**\n\n    ```python\n    qc = ReferenceQC(\n        sample_sig=sample_signature,\n        reference_sig=reference_signature,\n        amplicon_sig=amplicon_signature,\n        enable_logging=True\n    )\n\n    stats = qc.get_aggregated_stats(include_advanced=True)\n    ```\n    \"\"\"\n\n    def __init__(self, *,\n                 sample_sig: SnipeSig,\n                 reference_sig: SnipeSig,\n                 amplicon_sig: Optional[SnipeSig] = None,\n                 enable_logging: bool = False,\n                 **kwargs):\n        # Initialize logger\n        self.logger = logging.getLogger(self.__class__.__name__)\n\n        # Initialize split cache\n        self._split_cache: Dict[int, List[SnipeSig]] = {}\n        self.logger.debug(\"Initialized split cache.\")\n\n\n        if enable_logging:\n            self.logger.setLevel(logging.DEBUG)\n            if not self.logger.hasHandlers():\n                ch = logging.StreamHandler()\n                ch.setLevel(logging.DEBUG)\n                formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')\n                ch.setFormatter(formatter)\n                self.logger.addHandler(ch)\n            self.logger.debug(\"Logging is enabled for ReferenceQC.\")\n        else:\n            self.logger.setLevel(logging.CRITICAL)\n\n        # logging all passed parameters\n        self.logger.debug(\"passed parameters:\\n\")\n        for key, value in locals().items():\n            self.logger.debug(\"\\t%s: %s\", key, value)\n\n\n        # Validate that all signatures have the same ksize and scale\n        self.logger.debug(\"Validating ksize and scale across signatures.\")\n        if sample_sig.ksize != reference_sig.ksize:\n            self.logger.error(\"K-mer sizes do not match: sample_sig.ksize=%d vs reference_sig.ksize=%d\",\n                              sample_sig.ksize, reference_sig.ksize)\n            raise ValueError(f\"sample_sig kszie ({sample_sig.ksize}) does not match reference_sig ksize ({reference_sig.ksize}).\")\n        if sample_sig.scale != reference_sig.scale:\n            self.logger.error(\"Scale values do not match: sample_sig.scale=%d vs reference_sig.scale=%d\",\n                              sample_sig.scale, reference_sig.scale)\n            raise ValueError(f\"sample_sig scale ({sample_sig.scale}) does not match reference_sig scale ({reference_sig.scale}).\")\n\n        if amplicon_sig is not None:\n            if amplicon_sig.ksize != sample_sig.ksize:\n                self.logger.error(\"K-mer sizes do not match: amplicon_sig.ksize=%d vs sample_sig.ksize=%d\",\n                                  amplicon_sig.ksize, sample_sig.ksize)\n                raise ValueError(f\"amplicon_sig ksize ({amplicon_sig.ksize}) does not match sample_sig ksize ({sample_sig.ksize}).\")\n            if amplicon_sig.scale != sample_sig.scale:\n                self.logger.error(\"Scale values do not match: amplicon_sig.scale=%d vs sample_sig.scale=%d\",\n                                  amplicon_sig.scale, sample_sig.scale)\n                raise ValueError(f\"amplicon_sig scale ({amplicon_sig.scale}) does not match sample_sig scale ({sample_sig.scale}).\")\n\n        self.logger.debug(\"All signatures have matching ksize and scale.\")\n\n\n        # Verify signature types\n        if sample_sig._type != SigType.SAMPLE:\n            self.logger.error(\"Invalid signature type for sample_sig: %s | %s\", sample_sig.sigtype, sample_sig._type)\n            raise ValueError(f\"sample_sig must be of type {SigType.SAMPLE}, got {sample_sig.sigtype}\")\n\n        if reference_sig.sigtype != SigType.GENOME:\n            self.logger.error(\"Invalid signature type for reference_sig: %s\", reference_sig.sigtype)\n            raise ValueError(f\"reference_sig must be of type {SigType.GENOME}, got {reference_sig.sigtype}\")\n\n        if amplicon_sig is not None and amplicon_sig.sigtype != SigType.AMPLICON:\n            self.logger.error(\"Invalid signature type for amplicon_sig: %s\", amplicon_sig.sigtype)\n            raise ValueError(f\"amplicon_sig must be of type {SigType.AMPLICON}, got {amplicon_sig.sigtype}\")\n\n\n        self.logger.debug(\"Chromosome specific signatures provided.\")\n        self.flag_activate_sex_metrics = True\n\n\n        self.sample_sig = sample_sig\n        self.reference_sig = reference_sig\n        self.amplicon_sig = amplicon_sig\n        self.enable_logging = enable_logging\n\n        # Initialize attributes\n        self.sample_stats: Dict[str, Any] = {}\n        self.genome_stats: Dict[str, Any] = {}\n        self.amplicon_stats: Dict[str, Any] = {}\n        self.advanced_stats: Dict[str, Any] = {}\n        self.chrs_stats: Dict[str, Dict[str, Any]] = {}\n        self.sex_stats: Dict[str, Any] = {}\n        self.predicted_error_contamination_index: Dict[str, Any] = {}\n        self.vars_nonref_stats: Dict[str, Any] = {}\n        self.predicted_assay_type: str = \"\"\n\n        # Set grey zone thresholds\n        self.relative_total_abundance_grey_zone = [0.08092723407173719, 0.11884490500267662]\n\n        # Get sample statistics\n        self.logger.debug(\"Getting sample statistics.\")\n        self.sample_stats_raw = self.sample_sig.get_sample_stats\n\n        # Get reference genome statistics\n        self.logger.debug(\"Getting reference genome statistics.\")\n        self.genome_sig_stats = self.reference_sig.get_sample_stats\n\n        # If amplicon_sig is provided, get its stats\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"Getting amplicon statistics.\")\n            self.amplicon_sig_stats = self.amplicon_sig.get_sample_stats\n\n        # Compute metrics\n        self.logger.debug(\"Calculating statistics.\")\n        self._calculate_stats()\n\n\n    def _calculate_stats(self):\n        r\"\"\"\n        Calculate the various metrics based on the sample, reference, and optional amplicon signatures.\n        \"\"\"\n        # ============= SAMPLE STATS =============\n        self.logger.debug(\"Processing sample statistics.\")\n        self.sample_stats = {\n            \"Total unique k-mers\": self.sample_stats_raw[\"num_hashes\"],\n            \"k-mer total abundance\": self.sample_stats_raw[\"total_abundance\"],\n            \"k-mer mean abundance\": self.sample_stats_raw[\"mean_abundance\"],\n            \"k-mer median abundance\": self.sample_stats_raw[\"median_abundance\"],\n            \"num_singletons\": self.sample_stats_raw[\"num_singletons\"],\n            \"ksize\": self.sample_stats_raw[\"ksize\"],\n            \"scale\": self.sample_stats_raw[\"scale\"],\n            \"name\": self.sample_stats_raw[\"name\"],\n            \"filename\": self.sample_stats_raw[\"filename\"],\n        }\n\n        # ============= GENOME STATS =============\n        self.logger.debug(\"Calculating genome statistics.\")\n        # Compute intersection of sample and reference genome\n        self.logger.debug(\"Type of sample_sig: %s | Type of reference_sig: %s\", self.sample_sig.sigtype, self.reference_sig.sigtype)\n        sample_genome = self.sample_sig &amp; self.reference_sig\n        # Get stats (call get_sample_stats only once)\n\n        # Log hashes and abundances for both sample and reference\n        # self.logger.debug(\"Sample hashes: %s\", self.sample_sig.hashes)\n        # self.logger.debug(\"Sample abundances: %s\", self.sample_sig.abundances)\n        # self.logger.debug(\"Reference hashes: %s\", self.reference_sig.hashes)\n        # self.logger.debug(\"Reference abundances: %s\", self.reference_sig.abundances)\n\n        sample_genome_stats = sample_genome.get_sample_stats\n\n        self.genome_stats = {\n            \"Genomic unique k-mers\": sample_genome_stats[\"num_hashes\"],\n            \"Genomic k-mers total abundance\": sample_genome_stats[\"total_abundance\"],\n            \"Genomic k-mers mean abundance\": sample_genome_stats[\"mean_abundance\"],\n            \"Genomic k-mers median abundance\": sample_genome_stats[\"median_abundance\"],\n            # Genome coverage index\n            \"Genome coverage index\": (\n                sample_genome_stats[\"num_hashes\"] / self.genome_sig_stats[\"num_hashes\"]\n                if self.genome_sig_stats[\"num_hashes\"] &gt; 0 else 0\n            ),\n            # Mapping index\n            \"Mapping index\": (\n                sample_genome_stats[\"total_abundance\"] / self.sample_stats[\"k-mer total abundance\"]\n                if self.sample_stats[\"k-mer total abundance\"] &gt; 0 else 0\n            ),\n        }\n\n        # ============= AMPLICON STATS =============\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"Calculating amplicon statistics.\")\n            # Compute intersection of sample and amplicon\n            sample_amplicon = self.sample_sig &amp; self.amplicon_sig\n            # Get stats (call get_sample_stats only once)\n            sample_amplicon_stats = sample_amplicon.get_sample_stats\n\n            self.amplicon_stats = {\n                \"Amplicon unique k-mers\": sample_amplicon_stats[\"num_hashes\"],\n                \"Amplicon k-mers total abundance\": sample_amplicon_stats[\"total_abundance\"],\n                \"Amplicon k-mers mean abundance\": sample_amplicon_stats[\"mean_abundance\"],\n                \"Amplicon k-mers median abundance\": sample_amplicon_stats[\"median_abundance\"],\n                # Amplicon coverage index\n                \"Amplicon coverage index\": (\n                    sample_amplicon_stats[\"num_hashes\"] / self.amplicon_sig_stats[\"num_hashes\"]\n                    if self.amplicon_sig_stats[\"num_hashes\"] &gt; 0 else 0\n                ),\n            }\n\n            # ============= RELATIVE STATS =============\n            self.amplicon_stats[\"Relative total abundance\"] = (\n                self.amplicon_stats[\"Amplicon k-mers total abundance\"] / self.genome_stats[\"Genomic k-mers total abundance\"]\n                if self.genome_stats[\"Genomic k-mers total abundance\"] &gt; 0 else 0\n            )\n            self.amplicon_stats[\"Relative coverage\"] = (\n                self.amplicon_stats[\"Amplicon coverage index\"] / self.genome_stats[\"Genome coverage index\"]\n                if self.genome_stats[\"Genome coverage index\"] &gt; 0 else 0\n            )\n\n            relative_total_abundance = self.amplicon_stats[\"Relative total abundance\"]\n            if relative_total_abundance &lt;= self.relative_total_abundance_grey_zone[0]:\n                self.predicted_assay_type = \"WGS\"\n            elif relative_total_abundance &gt;= self.relative_total_abundance_grey_zone[1]:\n                self.predicted_assay_type = \"WXS\"\n            else:\n                # Assign based on the closest threshold\n                distance_to_wgs = abs(relative_total_abundance - self.relative_total_abundance_grey_zone[0])\n                distance_to_wxs = abs(relative_total_abundance - self.relative_total_abundance_grey_zone[1])\n                self.predicted_assay_type = \"WGS\" if distance_to_wgs &lt; distance_to_wxs else \"WXS\"\n\n\n            self.logger.debug(\"Predicted assay type: %s\", self.predicted_assay_type)\n\n        self.logger.debug(\"Calculuating error and contamination indices.\")\n        try:\n            sample_nonref = self.sample_sig - self.reference_sig\n            sample_nonref_singletons = sample_nonref.count_singletons()\n            sample_nonref_non_singletons = sample_nonref.total_abundance - sample_nonref_singletons\n            sample_total_abundance = self.sample_sig.total_abundance\n\n            predicted_error_index = sample_nonref_singletons / sample_total_abundance\n            predicted_contamination_index = sample_nonref_non_singletons / sample_total_abundance\n\n            # predict error and contamination index\n            self.predicted_error_contamination_index[\"Predicted contamination index\"] = predicted_contamination_index\n            self.predicted_error_contamination_index[\"Sequencing errors index\"] = predicted_error_index\n        # except zero division error\n        except ZeroDivisionError:\n            self.logger.error(\"Please check the sample signature, it seems to be empty.\")\n\n\n    def get_aggregated_stats(self, include_advanced: bool = False) -&gt; Dict[str, Any]:\n        r\"\"\"\n        Retrieve aggregated statistics from the quality control analysis.\n\n        **Parameters**\n\n        - `include_advanced (bool)`:  \n          If set to `True`, includes advanced metrics in the aggregated statistics.\n\n        **Returns**\n\n        - `Dict[str, Any]`:  \n          A dictionary containing the aggregated statistics, which may include:\n          - Sample statistics\n          - Genome statistics\n          - Amplicon statistics (if provided)\n          - Predicted assay type\n          - Advanced statistics (if `include_advanced` is `True`)\n        \"\"\"\n        aggregated_stats: Dict[str, Any] = {}\n        # Include sample_stats\n        aggregated_stats.update(self.sample_stats)\n        # Include genome_stats\n        aggregated_stats.update(self.genome_stats)\n        # Include amplicon_stats if available\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"While aggregating stats; amplicon signature provided.\")\n            aggregated_stats.update(self.amplicon_stats)\n            aggregated_stats[\"Predicted Assay Type\"] = self.predicted_assay_type\n\n        if self.chrs_stats:\n            aggregated_stats.update(self.chrs_stats)\n\n        if self.sex_stats:\n            aggregated_stats.update(self.sex_stats)\n\n        if self.vars_nonref_stats:\n            aggregated_stats.update(self.vars_nonref_stats)\n\n        # Include advanced_stats if requested\n        if include_advanced:\n            self._calculate_advanced_stats()\n            aggregated_stats.update(self.advanced_stats)\n\n        if self.predicted_error_contamination_index:\n            aggregated_stats.update(self.predicted_error_contamination_index)\n\n        return aggregated_stats\n\n    def _calculate_advanced_stats(self):\n        r\"\"\"\n        Calculate advanced statistics, such as median-trimmed metrics.\n        \"\"\"\n        self.logger.debug(\"Calculating advanced statistics.\")\n\n        # Copy sample signature to avoid modifying the original\n        median_trimmed_sample_sig = self.sample_sig.copy()\n        # Trim below median\n        median_trimmed_sample_sig.trim_below_median()\n        # Get stats\n        median_trimmed_sample_stats = median_trimmed_sample_sig.get_sample_stats\n        self.advanced_stats.update({\n            \"Median-trimmed unique k-mers\": median_trimmed_sample_stats[\"num_hashes\"],\n            \"Median-trimmed total abundance\": median_trimmed_sample_stats[\"total_abundance\"],\n            \"Median-trimmed mean abundance\": median_trimmed_sample_stats[\"mean_abundance\"],\n            \"Median-trimmed median abundance\": median_trimmed_sample_stats[\"median_abundance\"],\n        })\n\n        # Genome stats for median-trimmed sample\n        median_trimmed_sample_genome = median_trimmed_sample_sig &amp; self.reference_sig\n        median_trimmed_sample_genome_stats = median_trimmed_sample_genome.get_sample_stats\n        self.advanced_stats.update({\n            \"Median-trimmed Genomic unique k-mers\": median_trimmed_sample_genome_stats[\"num_hashes\"],\n            \"Median-trimmed Genomic total abundance\": median_trimmed_sample_genome_stats[\"total_abundance\"],\n            \"Median-trimmed Genomic mean abundance\": median_trimmed_sample_genome_stats[\"mean_abundance\"],\n            \"Median-trimmed Genomic median abundance\": median_trimmed_sample_genome_stats[\"median_abundance\"],\n            \"Median-trimmed Genome coverage index\": (\n                median_trimmed_sample_genome_stats[\"num_hashes\"] / self.genome_sig_stats[\"num_hashes\"]\n                if self.genome_sig_stats[\"num_hashes\"] &gt; 0 else 0\n            ),\n        })\n\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"Calculating advanced amplicon statistics.\")\n            # Amplicon stats for median-trimmed sample\n            median_trimmed_sample_amplicon = median_trimmed_sample_sig &amp; self.amplicon_sig\n            median_trimmed_sample_amplicon_stats = median_trimmed_sample_amplicon.get_sample_stats\n            self.advanced_stats.update({\n                \"Median-trimmed Amplicon unique k-mers\": median_trimmed_sample_amplicon_stats[\"num_hashes\"],\n                \"Median-trimmed Amplicon total abundance\": median_trimmed_sample_amplicon_stats[\"total_abundance\"],\n                \"Median-trimmed Amplicon mean abundance\": median_trimmed_sample_amplicon_stats[\"mean_abundance\"],\n                \"Median-trimmed Amplicon median abundance\": median_trimmed_sample_amplicon_stats[\"median_abundance\"],\n                \"Median-trimmed Amplicon coverage index\": (\n                    median_trimmed_sample_amplicon_stats[\"num_hashes\"] / self.amplicon_sig_stats[\"num_hashes\"]\n                    if self.amplicon_sig_stats[\"num_hashes\"] &gt; 0 else 0\n                ),\n            })\n            # Additional advanced relative metrics\n            self.logger.debug(\"Calculating advanced relative metrics.\")\n            self.amplicon_stats[\"Median-trimmed relative coverage\"] = (\n                self.advanced_stats[\"Median-trimmed Amplicon coverage index\"] / self.advanced_stats[\"Median-trimmed Genome coverage index\"]\n                if self.advanced_stats[\"Median-trimmed Genome coverage index\"] &gt; 0 else 0\n            )\n            self.amplicon_stats[\"Median-trimmed relative mean abundance\"] = (\n                self.advanced_stats[\"Median-trimmed Amplicon mean abundance\"] / self.advanced_stats[\"Median-trimmed Genomic mean abundance\"]\n                if self.advanced_stats[\"Median-trimmed Genomic mean abundance\"] &gt; 0 else 0\n            )\n            # Update amplicon_stats with advanced metrics\n            self.amplicon_stats.update({\n                \"Median-trimmed relative coverage\": self.amplicon_stats[\"Median-trimmed relative coverage\"],\n                \"Median-trimmed relative mean abundance\": self.amplicon_stats[\"Median-trimmed relative mean abundance\"],\n            })\n\n            self.advanced_stats.update(self.amplicon_stats)\n\n    def _calculate_advanced_stats(self):\n        r\"\"\"\n        Calculate advanced statistics, such as median-trimmed metrics.\n        \"\"\"\n        self.logger.debug(\"Calculating advanced statistics.\")\n\n        # Copy sample signature to avoid modifying the original\n        median_trimmed_sample_sig = self.sample_sig.copy()\n        # Trim below median\n        median_trimmed_sample_sig.trim_below_median()\n        # Get stats\n        median_trimmed_sample_stats = median_trimmed_sample_sig.get_sample_stats\n        self.advanced_stats.update({\n            \"Median-trimmed unique k-mers\": median_trimmed_sample_stats[\"num_hashes\"],\n            \"Median-trimmed total abundance\": median_trimmed_sample_stats[\"total_abundance\"],\n            \"Median-trimmed mean abundance\": median_trimmed_sample_stats[\"mean_abundance\"],\n            \"Median-trimmed median abundance\": median_trimmed_sample_stats[\"median_abundance\"],\n        })\n\n        # Genome stats for median-trimmed sample\n        median_trimmed_sample_genome = median_trimmed_sample_sig &amp; self.reference_sig\n        median_trimmed_sample_genome_stats = median_trimmed_sample_genome.get_sample_stats\n        self.advanced_stats.update({\n            \"Median-trimmed Genomic unique k-mers\": median_trimmed_sample_genome_stats[\"num_hashes\"],\n            \"Median-trimmed Genomic total abundance\": median_trimmed_sample_genome_stats[\"total_abundance\"],\n            \"Median-trimmed Genomic mean abundance\": median_trimmed_sample_genome_stats[\"mean_abundance\"],\n            \"Median-trimmed Genomic median abundance\": median_trimmed_sample_genome_stats[\"median_abundance\"],\n            \"Median-trimmed Genome coverage index\": (\n                median_trimmed_sample_genome_stats[\"num_hashes\"] / self.genome_sig_stats[\"num_hashes\"]\n                if self.genome_sig_stats[\"num_hashes\"] &gt; 0 else 0\n            ),\n        })\n\n        if self.amplicon_sig is not None:\n            self.logger.debug(\"Calculating advanced amplicon statistics.\")\n            # Amplicon stats for median-trimmed sample\n            median_trimmed_sample_amplicon = median_trimmed_sample_sig &amp; self.amplicon_sig\n            median_trimmed_sample_amplicon_stats = median_trimmed_sample_amplicon.get_sample_stats\n            self.advanced_stats.update({\n                \"Median-trimmed Amplicon unique k-mers\": median_trimmed_sample_amplicon_stats[\"num_hashes\"],\n                \"Median-trimmed Amplicon total abundance\": median_trimmed_sample_amplicon_stats[\"total_abundance\"],\n                \"Median-trimmed Amplicon mean abundance\": median_trimmed_sample_amplicon_stats[\"mean_abundance\"],\n                \"Median-trimmed Amplicon median abundance\": median_trimmed_sample_amplicon_stats[\"median_abundance\"],\n                \"Median-trimmed Amplicon coverage index\": (\n                    median_trimmed_sample_amplicon_stats[\"num_hashes\"] / self.amplicon_sig_stats[\"num_hashes\"]\n                    if self.amplicon_sig_stats[\"num_hashes\"] &gt; 0 else 0\n                ),\n            })\n            # Additional advanced relative metrics\n            self.logger.debug(\"Calculating advanced relative metrics.\")\n            self.amplicon_stats[\"Median-trimmed relative coverage\"] = (\n                self.advanced_stats[\"Median-trimmed Amplicon coverage index\"] / self.advanced_stats[\"Median-trimmed Genome coverage index\"]\n                if self.advanced_stats[\"Median-trimmed Genome coverage index\"] &gt; 0 else 0\n            )\n            self.amplicon_stats[\"Median-trimmed relative mean abundance\"] = (\n                self.advanced_stats[\"Median-trimmed Amplicon mean abundance\"] / self.advanced_stats[\"Median-trimmed Genomic mean abundance\"]\n                if self.advanced_stats[\"Median-trimmed Genomic mean abundance\"] &gt; 0 else 0\n            )\n            # Update amplicon_stats with advanced metrics\n            self.amplicon_stats.update({\n                \"Median-trimmed relative coverage\": self.amplicon_stats[\"Median-trimmed relative coverage\"],\n                \"Median-trimmed relative mean abundance\": self.amplicon_stats[\"Median-trimmed relative mean abundance\"],\n            })\n\n            self.advanced_stats.update(self.amplicon_stats)\n\n    def split_sig_randomly(self, n: int) -&gt; List[SnipeSig]:\n        r\"\"\"\n        Split the sample signature into `n` random parts based on abundances.\n\n        This method distributes the k-mers of the sample signature into `n` parts using a multinomial distribution\n        based on their abundances. Each k-mer's abundance is split across the `n` parts proportionally.\n\n        **Mathematical Explanation**:\n\n        For each k-mer with hash \\( h \\) and abundance \\( a_h \\), its abundance is distributed into \\( n \\) parts\n        according to a multinomial distribution. Specifically, the abundance in each part \\( i \\) is given by:\n\n        $$\n        a_{h,i} \\sim \\text{Multinomial}(a_h, \\frac{1}{n}, \\frac{1}{n}, \\dots, \\frac{1}{n})\n        $$\n\n        Where:\n        - \\( a_{h,i} \\) is the abundance of k-mer \\( h \\) in part \\( i \\).\n        - Each \\( a_{h,i} \\) is a non-negative integer such that \\( \\sum_{i=1}^{n} a_{h,i} = a_h \\).\n\n        **Parameters**:\n\n        - `n` (`int`): Number of parts to split into.\n\n        **Returns**:\n\n        - `List[SnipeSig]`:  \n          List of `SnipeSig` instances representing the split parts.\n\n        **Usage Example**:\n\n        ```python\n        split_sigs = qc.split_sig_randomly(n=3)\n        for idx, sig in enumerate(split_sigs, 1):\n            print(f\"Signature part {idx}: {sig}\")\n        ```\n        \"\"\"\n        self.logger.debug(\"Attempting to split sample signature into %d random parts.\", n)\n\n        # Check if the split for this n is already cached\n        if n in self._split_cache:\n            self.logger.debug(\"Using cached split signatures for n=%d.\", n)\n            # Return deep copies to prevent external modifications\n            return [sig.copy() for sig in self._split_cache[n]]\n\n        self.logger.debug(\"No cached splits found for n=%d. Proceeding to split.\", n)\n        # Get k-mers and abundances\n        hash_to_abund = dict(zip(self.sample_sig.hashes, self.sample_sig.abundances))\n        random_split_sigs = self.distribute_kmers_random(hash_to_abund, n)\n        split_sigs = [\n            SnipeSig.create_from_hashes_abundances(\n                hashes=np.array(list(kmer_dict.keys()), dtype=np.uint64),\n                abundances=np.array(list(kmer_dict.values()), dtype=np.uint32),\n                ksize=self.sample_sig.ksize,\n                scale=self.sample_sig.scale,\n                name=f\"{self.sample_sig.name}_part_{i+1}\",\n                filename=self.sample_sig.filename,\n                enable_logging=self.enable_logging\n            )\n            for i, kmer_dict in enumerate(random_split_sigs)\n        ]\n\n        # Cache the split signatures\n        self._split_cache[n] = split_sigs\n        self.logger.debug(\"Cached split signatures for n=%d.\", n)\n\n        return split_sigs\n\n    @staticmethod\n    def distribute_kmers_random(original_dict: Dict[int, int], n: int) -&gt; List[Dict[int, int]]:\n        r\"\"\"\n        Distribute the k-mers randomly into `n` parts based on their abundances.\n\n        This helper method performs the actual distribution of k-mers using a multinomial distribution.\n\n        **Mathematical Explanation**:\n\n        Given a k-mer with hash \\( h \\) and abundance \\( a_h \\), the distribution of its abundance across \\( n \\)\n        parts is modeled as:\n\n        $$\n        a_{h,1}, a_{h,2}, \\dots, a_{h,n} \\sim \\text{Multinomial}(a_h, p_1, p_2, \\dots, p_n)\n        $$\n\n        Where \\( p_i = \\frac{1}{n} \\) for all \\( i \\).\n\n        **Parameters**:\n\n        - `original_dict` (`Dict[int, int]`):  \n          Dictionary mapping k-mer hashes to their abundances.\n        - `n` (`int`): Number of parts to split into.\n\n        **Returns**:\n\n        - `List[Dict[int, int]]`:  \n          List of dictionaries, each mapping k-mer hashes to their abundances in that part.\n\n        **Usage Example**:\n\n        ```python\n        distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)\n        ```\n        \"\"\"\n        # Initialize the resulting dictionaries\n        distributed_dicts = [{} for _ in range(n)]\n\n        # For each k-mer and its abundance\n        for kmer_hash, abundance in original_dict.items():\n            if abundance == 0:\n                continue  # Skip zero abundances\n            # Generate multinomial split of abundance\n            counts = np.random.multinomial(abundance, [1.0 / n] * n)\n            # Update each dictionary\n            for i in range(n):\n                if counts[i] &gt; 0:\n                    distributed_dicts[i][kmer_hash] = counts[i]\n\n        return distributed_dicts\n\n    def calculate_coverage_vs_depth(self, n: int = 30) -&gt; List[Dict[str, Any]]:\n        r\"\"\"\n        Calculate cumulative coverage index vs cumulative sequencing depth.\n\n        This method simulates incremental sequencing by splitting the sample signature into `n` parts and\n        calculating the cumulative coverage index at each step. It helps in understanding how coverage\n        improves with increased sequencing depth.\n\n        **Mathematical Explanation**:\n\n        For each cumulative part \\( i \\) (where \\( 1 \\leq i \\leq n \\)):\n\n        - **Cumulative Sequencing Depth** (\\( D_i \\)):\n          $$\n          D_i = \\sum_{j=1}^{i} a_j\n          $$\n          Where \\( a_j \\) is the total abundance of the \\( j^{th} \\) part.\n\n        - **Cumulative Coverage Index** (\\( C_i \\)):\n          $$\n          C_i = \\frac{\\text{Number of genomic unique k-mers in first } i \\text{ parts}}{\\left| \\text{Reference genome k-mer set} \\right|}\n          $$\n\n        **Parameters**:\n\n        - `n` (`int`): Number of parts to split the signature into.\n\n        **Returns**:\n\n        - `List[Dict[str, Any]]`:  \n          List of dictionaries containing:\n            - `\"cumulative_parts\"` (`int`): Number of parts included.\n            - `\"cumulative_total_abundance\"` (`int`): Total sequencing depth up to this part.\n            - `\"cumulative_coverage_index\"` (`float`): Coverage index up to this part.\n\n        **Usage Example**:\n\n        ```python\n        coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)\n        for data in coverage_depth_data:\n            print(data)\n        ```\n        \"\"\"\n        self.logger.debug(\"Calculating coverage vs depth with %d parts.\", n)\n        # Determine the ROI reference signature\n        if isinstance(self.amplicon_sig, SnipeSig):\n            roi_reference_sig = self.amplicon_sig\n            self.logger.debug(\"Using amplicon signature as ROI reference.\")\n        else:\n            roi_reference_sig = self.reference_sig\n            self.logger.debug(\"Using reference genome signature as ROI reference.\")\n\n        # Split the sample signature into n random parts (cached if available)\n        split_sigs = self.split_sig_randomly(n)\n\n        coverage_depth_data = []\n\n        if not split_sigs:\n            self.logger.error(\"No split signatures available. Cannot calculate coverage vs depth.\")\n            return coverage_depth_data\n\n        cumulative_snipe_sig = split_sigs[0].copy()\n        cumulative_total_abundance = cumulative_snipe_sig.total_abundance\n\n        # Force conversion to GENOME\n        roi_reference_sig.sigtype = SigType.GENOME\n\n        # Compute initial coverage index\n        cumulative_qc = ReferenceQC(\n            sample_sig=cumulative_snipe_sig,\n            reference_sig=roi_reference_sig,\n            enable_logging=self.enable_logging\n        )\n        cumulative_stats = cumulative_qc.get_aggregated_stats()\n        cumulative_coverage_index = cumulative_stats.get(\"Genome coverage index\", 0.0)\n\n        coverage_depth_data.append({\n            \"cumulative_parts\": 1,\n            \"cumulative_total_abundance\": cumulative_total_abundance,\n            \"cumulative_coverage_index\": cumulative_coverage_index,\n        })\n\n        self.logger.debug(\"Added initial coverage depth data for part 1.\")\n\n        # Iterate over the rest of the parts\n        for i in range(1, n):\n            current_part = split_sigs[i]\n\n            # Add current part to cumulative signature\n            cumulative_snipe_sig += current_part\n            cumulative_total_abundance += current_part.total_abundance\n\n            # Compute new coverage index\n            cumulative_qc = ReferenceQC(\n                sample_sig=cumulative_snipe_sig,\n                reference_sig=roi_reference_sig,\n                enable_logging=self.enable_logging\n            )\n            cumulative_stats = cumulative_qc.get_aggregated_stats()\n            cumulative_coverage_index = cumulative_stats.get(\"Genome coverage index\", 0.0)\n\n            coverage_depth_data.append({\n                \"cumulative_parts\": i + 1,\n                \"cumulative_total_abundance\": cumulative_total_abundance,\n                \"cumulative_coverage_index\": cumulative_coverage_index,\n            })\n\n            self.logger.debug(\"Added coverage depth data for part %d.\", i + 1)\n\n        self.logger.debug(\"Coverage vs depth calculation completed.\")\n        return coverage_depth_data\n\n    def predict_coverage(self, extra_fold: float, n: int = 30) -&gt; float:\n        r\"\"\"\n        Predict the coverage index if additional sequencing is performed.\n\n        This method estimates the potential increase in the genome coverage index when the sequencing depth\n        is increased by a specified fold (extra sequencing). It does so by:\n\n        1. **Cumulative Coverage Calculation**:\n        - Splitting the sample signature into `n` random parts to simulate incremental sequencing data.\n        - Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.\n\n        2. **Saturation Curve Fitting**:\n        - Modeling the relationship between cumulative coverage and cumulative sequencing depth using\n            a hyperbolic saturation function.\n        - The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.\n\n        3. **Coverage Prediction**:\n        - Using the fitted model to predict the coverage index at an increased sequencing depth (current depth\n            multiplied by `1 + extra_fold`).\n\n        **Mathematical Explanation**:\n\n        - **Saturation Model**:\n        The coverage index \\( C \\) as a function of sequencing depth \\( D \\) is modeled using the function:\n\n        $$\n        C(D) = \\frac{a \\cdot D}{b + D}\n        $$\n\n        Where:\n        - \\( a \\) and \\( b \\) are parameters estimated from the data.\n        - \\( D \\) is the cumulative sequencing depth (total abundance).\n        - \\( C(D) \\) is the cumulative coverage index at depth \\( D \\).\n\n        - **Parameter Estimation**:\n        The parameters \\( a \\) and \\( b \\) are determined by fitting the model to the observed cumulative\n        coverage and depth data using non-linear least squares optimization.\n\n        - **Coverage Prediction**:\n        The predicted coverage index \\( C_{\\text{pred}} \\) at an increased sequencing depth \\( D_{\\text{pred}} \\)\n        is calculated as:\n\n        $$\n        D_{\\text{pred}} = D_{\\text{current}} \\times (1 + \\text{extra\\_fold})\n        $$\n\n        $$\n        C_{\\text{pred}} = \\frac{a \\cdot D_{\\text{pred}}}{b + D_{\\text{pred}}}\n        $$\n\n        **Parameters**:\n\n        - `extra_fold` (*float*):  \n          The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling\n          the current sequencing depth.\n\n        - `n` (*int, optional*):  \n          The number of parts to split the sample signature into for modeling the saturation curve.\n          Default is 30.\n\n        **Returns**:\n            - `float`:  \n              The predicted genome coverage index at the increased sequencing depth.\n\n        **Raises**:\n            - `RuntimeError`:  \n              If the saturation model fails to converge during curve fitting.\n\n        **Usage Example**:\n\n        ```python\n        # Create a ReferenceQC instance with sample and reference signatures\n        qc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)\n\n        # Predict coverage index after increasing sequencing depth by 50%\n        predicted_coverage = qc.predict_coverage(extra_fold=0.5)\n\n        print(f\"Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}\")\n        ```\n\n        **Implementation Details**:\n\n        - **Splitting the Sample Signature**:\n            - The sample signature is split into `n` random parts using a multinomial distribution based on k-mer abundances.\n            - Each part represents an incremental addition of sequencing data.\n\n        - **Cumulative Calculations**:\n            - At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.\n\n        - **Curve Fitting**:\n            - The `scipy.optimize.curve_fit` function is used to fit the saturation model to the cumulative data.\n            - Initial parameter guesses are based on the observed data to aid convergence.\n        \"\"\"\n        if extra_fold &lt; 1:\n            raise ValueError(\"extra_fold must be &gt;= 1.0.\")\n\n        if n &lt; 1 or not isinstance(n, int):\n            raise ValueError(\"n must be a positive integer.\")\n\n        self.logger.debug(\"Predicting coverage with extra fold: %f\", extra_fold)\n        coverage_depth_data = self.calculate_coverage_vs_depth(n=n)\n\n        # Extract cumulative total abundance and coverage index\n        x_data = np.array([d[\"cumulative_total_abundance\"] for d in coverage_depth_data])\n        y_data = np.array([d[\"cumulative_coverage_index\"] for d in coverage_depth_data])\n\n        # Saturation model function\n        def saturation_model(x, a, b):\n            return a * x / (b + x)\n\n        # Initial parameter guesses\n        initial_guess = [y_data[-1], x_data[int(len(x_data) / 2)]]\n\n        # Fit the model to the data\n        try:\n            with warnings.catch_warnings():\n                warnings.simplefilter(\"error\", OptimizeWarning)\n                params, covariance = curve_fit(\n                    saturation_model,\n                    x_data,\n                    y_data,\n                    p0=initial_guess,\n                    bounds=(0, np.inf),\n                    maxfev=10000\n                )\n        except (RuntimeError, OptimizeWarning) as exc:\n            self.logger.error(\"Curve fitting failed.\")\n            raise RuntimeError(\"Saturation model fitting failed. Cannot predict coverage.\") from exc\n\n        # Check if covariance contains inf or nan\n        if np.isinf(covariance).any() or np.isnan(covariance).any():\n            self.logger.error(\"Covariance of parameters could not be estimated.\")\n            raise RuntimeError(\"Saturation model fitting failed. Cannot predict coverage.\")\n\n        a, b = params\n\n        # Predict coverage at increased sequencing depth\n        total_abundance = x_data[-1]\n        predicted_total_abundance = total_abundance * (1 + extra_fold)\n        predicted_coverage = saturation_model(predicted_total_abundance, a, b)\n\n        # Ensure the predicted coverage does not exceed maximum possible coverage\n        max_coverage = 1.0  # Coverage index cannot exceed 1\n        predicted_coverage = min(predicted_coverage, max_coverage)\n\n        self.logger.debug(\"Predicted coverage at %.2f-fold increase: %f\", extra_fold, predicted_coverage)\n        return predicted_coverage\n\n    def calculate_chromosome_metrics(self, chr_to_sig: Dict[str, SnipeSig]) -&gt; Dict[str, Any]:\n        r\"\"\"\n        Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.\n\n        This method computes the CV to assess the variability of mean abundances among autosomal chromosomes,\n        excluding any sex chromosomes.\n\n        **Mathematical Explanation**:\n\n        The Coefficient of Variation (CV) is defined as:\n\n        $$\n        \\text{CV} = \\frac{\\sigma}{\\mu}\n        $$\n\n        Where:\n        - \\( \\sigma \\) is the standard deviation of the mean abundances across autosomal chromosomes.\n        - \\( \\mu \\) is the mean of the mean abundances across autosomal chromosomes.\n\n        **Parameters**:\n\n        - `chr_to_sig` (`Dict[str, SnipeSig]`):  \n          A dictionary mapping chromosome names (e.g., `'autosomal-1'`, `'autosomal-2'`, `'sex-x'`, `'sex-y'`) to their corresponding\n          `SnipeSig` instances. Each `SnipeSig` should represent the k-mer signature of a specific chromosome.\n\n        **Returns**:\n\n        - `Dict[str, Any]`:  \n          A dictionary containing the computed metrics:\n              - `\"Autosomal_CV\"` (`float`):  \n                The coefficient of variation of mean abundances across autosomal chromosomes.\n\n        **Raises**:\n\n        - `ValueError`:  \n          If `chr_to_sig` is empty or if there is an inconsistency in the signatures' parameters.\n\n        **Usage Example**:\n\n        ```python\n        # Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances\n        chr_signatures = {\n            \"1\": sig_chr1,\n            \"2\": sig_chr2,\n            \"X\": sig_chrX,\n            \"Y\": sig_chrY\n        }\n\n        # Calculate chromosome metrics\n        metrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)\n\n        print(metrics)\n        # Output:\n        # {'Autosomal_CV': 0.15}\n        ```\n\n        **Notes**:\n\n        - **Exclusion of Sex Chromosomes**:  \n          Chromosomes with names containing the substring `\"sex\"` (e.g., `'sex-y'`, `'sex-x'`) are excluded from the CV calculation to focus solely on autosomal chromosomes.\n\n        - **Mean Abundance Calculation**:  \n          The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.\n        \"\"\"\n\n        # Implementation of the method\n        # let's make sure all chromosome sigs are unique\n        self.logger.debug(\"Computing specific chromosome hashes for %s.\", ','.join(chr_to_sig.keys()))\n        self.logger.debug(f\"\\t-All hashes for chromosomes before getting unique sigs {len(SnipeSig.sum_signatures(list(chr_to_sig.values())))}\")\n        specific_chr_to_sig = SnipeSig.get_unique_signatures(chr_to_sig)\n        self.logger.debug(f\"\\t-All hashes for chromosomes after getting unique sigs {len(SnipeSig.sum_signatures(list(specific_chr_to_sig.values())))}\")\n\n        # calculate mean abundance for each chromosome and loaded sample sig\n        chr_to_mean_abundance = {}\n        self.logger.debug(\"Calculating mean abundance for each chromosome.\")\n        for chr_name, chr_sig in specific_chr_to_sig.items():\n            self.logger.debug(\"Intersecting %s (%d) with %s (%d)\", self.sample_sig.name, len(self.sample_sig), chr_name, len(chr_sig))\n            chr_sample_sig = self.sample_sig &amp; chr_sig\n            chr_stats = chr_sample_sig.get_sample_stats\n            chr_to_mean_abundance[chr_name] = chr_stats[\"mean_abundance\"]\n            self.logger.debug(\"\\t-Mean abundance for %s: %f\", chr_name, chr_stats[\"mean_abundance\"])\n\n        self.chrs_stats.update(chr_to_mean_abundance)\n\n        # chr_to_mean_abundance but without any chr with partial name sex\n        autosomal_chr_to_mean_abundance = {}\n        for chr_name, mean_abundance in chr_to_mean_abundance.items():\n            if \"sex\" in chr_name.lower():\n                continue\n            autosomal_chr_to_mean_abundance[chr_name] = mean_abundance\n\n\n        # calculate the CV for the whole sample\n        if autosomal_chr_to_mean_abundance:\n            mean_abundances = np.array(list(autosomal_chr_to_mean_abundance.values()), dtype=float)\n            cv = np.std(mean_abundances) / np.mean(mean_abundances) if np.mean(mean_abundances) != 0 else 0.0\n            self.chrs_stats.update({\"Autosomal_CV\": cv})\n            self.logger.debug(\"Calculated Autosomal CV: %f\", cv)\n        else:\n            self.logger.warning(\"No autosomal chromosomes were processed. 'Autosomal_CV' set to None.\")\n            self.chrs_stats.update({\"Autosomal_CV\": None})\n\n        # optional return, not required\n        return self.chrs_stats\n\n\n    def calculate_sex_chrs_metrics(self, genome_and_chr_to_sig: Dict[str, SnipeSig]) -&gt; Dict[str, Any]:\n        r\"\"\"\n        Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.\n\n        This method processes a collection of genome and chromosome-specific `SnipeSig` instances to compute\n        metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains\n        only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome.\n        The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to\n        accurately assess sex chromosome metrics.\n\n        **Mathematical Explanation**:\n\n        - **X-Ploidy Score**:\n\n          The X-Ploidy score is calculated using the formula:\n\n          $$\n          \\text{X-Ploidy} = \\left(\\frac{\\mu_X}{\\mu_{\\text{autosomal}}}\\right) \\times \\left(\\frac{N_{\\text{autosomal}}}{N_X}\\right)\n          $$\n\n          Where:\n          - \\( \\mu_X \\) is the mean abundance of X chromosome-specific k-mers in the sample.\n          - \\( \\mu_{\\text{autosomal}} \\) is the mean abundance of autosomal k-mers in the sample.\n          - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.\n          - \\( N_X \\) is the number of X chromosome-specific k-mers in the reference genome.\n\n        - **Y-Coverage**:\n\n          The Y-Coverage is calculated using the formula:\n\n          $$\n          \\text{Y-Coverage} = \\frac{\\left(\\frac{N_Y^{\\text{sample}}}{N_Y}\\right)}{\\left(\\frac{N_{\\text{autosomal}}^{\\text{sample}}}{N_{\\text{autosomal}}}\\right)}\n          $$\n\n          Where:\n          - \\( N_Y^{\\text{sample}} \\) is the number of Y chromosome-specific k-mers in the sample.\n          - \\( N_Y \\) is the number of Y chromosome-specific k-mers in the reference genome.\n          - \\( N_{\\text{autosomal}}^{\\text{sample}} \\) is the number of autosomal k-mers in the sample.\n          - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.\n\n        **Parameters**:\n\n            - `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  \n              A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include\n              the autosomal genome signature (with a name ending in `'-snipegenome'`) and chromosome-specific\n              signatures (e.g., `'sex-x'`, `'sex-y'`, `'autosome-1'`, `'autosome-2'`, etc.).\n\n        **Returns**:\n\n            - `Dict[str, Any]`:  \n              A dictionary containing the calculated sex-related metrics:\n                  - `\"X-Ploidy score\"` (`float`):  \n                    The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance\n                    to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.\n                  - `\"Y-Coverage\"` (`float`, optional):  \n                    The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.\n                    This key is present only if a Y chromosome signature is provided.\n\n        **Raises**:\n\n            - `ValueError`:  \n              - If the `'sex-x'` chromosome signature is not found in `genome_and_chr_to_sig`.\n              - If the autosomal genome signature is not found or improperly labeled.\n\n        **Usage Example**:\n\n        ```python\n        # Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances\n        genome_and_chr_signatures = {\n            \"autosomal-snipegenome\": sig_autosomal_genome,\n            \"1\": sig_chr1,\n            \"2\": sig_chr2,\n            \"sex-x\": sig_sex_x,\n            \"sex-y\": sig_sex_y\n        }\n\n        # Calculate sex chromosome metrics\n        metrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)\n\n        print(metrics)\n        # Output Example:\n        # {\n        #     \"X-Ploidy score\": 2.6667,\n        #     \"Y-Coverage\": 0.0\n        # }\n        ```\n\n        **Notes**:\n\n            - **Signature Naming Convention**:  \n              The autosomal genome signature must have a name ending with `'-snipegenome'`. Chromosome-specific\n              signatures should be named accordingly (e.g., `'sex-x'`, `'sex-y'`, `'autosomal-1'`, `'autosomal-2'`, etc.).\n\n            - **Exclusion of Sex Chromosomes from Autosomal Genome**:  \n              The Y chromosome signature (`'sex-y'`) is subtracted from the autosomal genome signature to ensure\n              that Y chromosome k-mers are not counted towards autosomal metrics.\n\n            - **Robustness**:  \n              The method includes comprehensive logging for debugging purposes, tracking each major step and\n              any exclusions made during processing.\n        \"\"\"\n\n        # Ensure that the chromosome X signature exists\n        if 'sex-x' not in genome_and_chr_to_sig:\n            self.logger.warning(\"Chromosome X ('sex-x') not found in the provided signatures. X-Ploidy score will be set to zero.\")\n            # set sex-x to an empty signature\n            genome_and_chr_to_sig['sex-x'] = SnipeSig.create_from_hashes_abundances(\n                hashes=np.array([], dtype=np.uint64),\n                abundances=np.array([], dtype=np.uint32),\n                ksize=genome_and_chr_to_sig[list(genome_and_chr_to_sig.keys())[0]].ksize,\n                scale=genome_and_chr_to_sig[list(genome_and_chr_to_sig.keys())[0]].scale,\n            )\n\n        # Separate the autosomal genome signature from chromosome-specific signatures\n        chr_to_sig: Dict[str, SnipeSig] = {}\n        autosomals_genome_sig: Optional[SnipeSig] = None\n        self.logger.debug(\"Separating autosomal genome signature from chromosome-specific signatures.\")\n\n        for name, sig in genome_and_chr_to_sig.items():\n            if name.endswith('-snipegenome'):\n                self.logger.debug(\"\\t- Identified autosomal genome signature: '%s'.\", name)\n                autosomals_genome_sig = sig\n            else:\n                chr_to_sig[name] = sig\n\n        if autosomals_genome_sig is None:\n            self.logger.error(\"Autosomal genome signature (ending with '-snipegenome') not found.\")\n            raise ValueError(\"Autosomal genome signature (ending with '-snipegenome') not found.\")\n\n        # Ensure all chromosome signatures have unique hashes\n        specific_chr_to_sig = SnipeSig.get_unique_signatures(chr_to_sig)\n\n        # Exclude Y chromosome from the autosomal genome signature if present\n        if 'sex-y' in chr_to_sig:\n            self.logger.debug(\"Y chromosome ('sex-y') detected. Removing its hashes from the autosomal genome signature.\")\n            self.logger.debug(\"\\t- Original autosomal genome size: %d hashes.\", len(autosomals_genome_sig))\n            autosomals_genome_sig = autosomals_genome_sig - chr_to_sig['sex-y']\n            self.logger.debug(\"\\t- Updated autosomal genome size after removing Y chromosome: %d hashes.\", len(autosomals_genome_sig))\n\n        # Remove X chromosome hashes from the autosomal genome signature\n        self.logger.debug(\"Removing X chromosome ('sex-x') hashes from the autosomal genome signature.\")\n        autosomals_genome_sig = autosomals_genome_sig - chr_to_sig['sex-x']\n        self.logger.debug(\"\\t- Updated autosomal genome size after removing X chromosome: %d hashes.\", len(autosomals_genome_sig))\n\n        # Derive the X chromosome-specific signature by subtracting autosomal genome hashes\n        specific_xchr_sig = specific_chr_to_sig[\"sex-x\"] - autosomals_genome_sig\n        self.logger.debug(\"\\t-Derived X chromosome-specific signature size: %d hashes.\", len(specific_xchr_sig))\n\n        # Intersect the sample signature with chromosome-specific signatures\n        sample_specific_xchr_sig = self.sample_sig &amp; specific_xchr_sig\n        if len(sample_specific_xchr_sig) == 0:\n            self.logger.warning(\"No X chromosome-specific k-mers found in the sample signature.\")\n        self.logger.debug(\"\\t-Intersected sample signature with X chromosome-specific k-mers = %d hashes.\", len(sample_specific_xchr_sig))\n        sample_autosomal_sig = self.sample_sig &amp; autosomals_genome_sig\n        self.logger.debug(\"\\t-Intersected sample signature with autosomal genome k-mers = %d hashes.\", len(sample_autosomal_sig))\n\n        # Retrieve mean abundances\n        xchr_mean_abundance = sample_specific_xchr_sig.get_sample_stats.get(\"mean_abundance\", 0.0)\n        autosomal_mean_abundance = sample_autosomal_sig.get_sample_stats.get(\"mean_abundance\", 0.0)\n\n        # Calculate X-Ploidy score\n        if autosomal_mean_abundance == 0:\n            self.logger.warning(\"Autosomal mean abundance is zero. Setting X-Ploidy score to zero to avoid division by zero.\")\n            xploidy_score = 0.0\n        else:\n            xploidy_score = (xchr_mean_abundance / autosomal_mean_abundance) * \\\n                            (len(autosomals_genome_sig) / len(specific_xchr_sig) if len(specific_xchr_sig) &gt; 0 else 0.0)\n\n        self.logger.debug(\"Calculated X-Ploidy score: %.4f\", xploidy_score)\n        self.sex_stats.update({\"X-Ploidy score\": xploidy_score})\n\n        # Calculate Y-Coverage if Y chromosome is present\n        if 'sex-y' in specific_chr_to_sig:\n            self.logger.debug(\"Calculating Y-Coverage based on Y chromosome-specific k-mers.\")\n\n            # Derive Y chromosome-specific k-mers by excluding autosomal and X chromosome k-mers\n            ychr_specific_kmers = chr_to_sig[\"sex-y\"] - autosomals_genome_sig - specific_xchr_sig\n            self.logger.debug(\"\\t-Derived Y chromosome-specific signature size: %d hashes.\", len(ychr_specific_kmers))\n\n            # Intersect Y chromosome-specific k-mers with the sample signature\n            ychr_in_sample = self.sample_sig &amp; ychr_specific_kmers\n            self.logger.debug(\"\\t-Intersected sample signature with Y chromosome-specific k-mers = %d hashes.\", len(ychr_in_sample))\n            if len(ychr_in_sample) == 0:\n                self.logger.warning(\"No Y chromosome-specific k-mers found in the sample signature.\")\n\n            # Derive autosomal-specific k-mers by excluding X and Y chromosome k-mers from the reference signature\n            autosomals_specific_kmers = self.reference_sig - specific_chr_to_sig[\"sex-x\"] - specific_chr_to_sig['sex-y']\n\n            # Calculate Y-Coverage metric\n            if len(ychr_specific_kmers) == 0 or len(autosomals_specific_kmers) == 0:\n                self.logger.warning(\"Insufficient k-mers for Y-Coverage calculation. Setting Y-Coverage to zero.\")\n                ycoverage = 0.0\n            else:\n                ycoverage = (len(ychr_in_sample) / len(ychr_specific_kmers)) / \\\n                        (len(sample_autosomal_sig) / len(autosomals_specific_kmers))\n\n            self.logger.debug(\"Calculated Y-Coverage: %.4f\", ycoverage)\n            self.sex_stats.update({\"Y-Coverage\": ycoverage})\n\n        return self.sex_stats\n\n\n\n    def nonref_consume_from_vars(self, *, vars: Dict[str, SnipeSig], vars_order: List[str], **kwargs) -&gt; Dict[str, float]:\n        r\"\"\"\n        Consume and analyze non-reference k-mers from provided variable signatures.\n\n        This method processes non-reference k-mers in the sample signature by intersecting them with a set of\n        variable-specific `SnipeSig` instances. It calculates coverage and total abundance metrics for each\n        variable in a specified order, ensuring that each non-reference k-mer is accounted for without overlap\n        between variables. The method updates internal statistics that reflect the distribution of non-reference\n        k-mers across the provided variables.\n\n        **Process Overview**:\n\n        1. **Validation**:\n        - Verifies that all variable names specified in `vars_order` are present in the `vars` dictionary.\n        - Raises a `ValueError` if any variable in `vars_order` is missing from `vars`.\n\n        2. **Non-Reference K-mer Extraction**:\n        - Computes the set of non-reference non-singleton k-mers by subtracting the reference signature from the sample signature.\n        - If no non-reference k-mers are found, the method logs a warning and returns an empty dictionary.\n\n        3. **Variable-wise Consumption**:\n        - Iterates over each variable name in `vars_order`.\n        - For each variable:\n            - Intersects the remaining non-reference k-mers with the variable-specific signature.\n            - Calculates the total abundance and coverage index for the intersected k-mers.\n            - Updates the `vars_nonref_stats` dictionary with the computed metrics.\n            - Removes the consumed k-mers from the remaining non-reference set to prevent overlap.\n\n        4. **Final State Logging**:\n        - Logs the final size and total abundance of the remaining non-reference k-mers after consumption.\n\n        **Parameters**:\n\n            - `vars` (`Dict[str, SnipeSig]`):  \n            A dictionary mapping variable names to their corresponding `SnipeSig` instances. Each `SnipeSig` \n            represents a set of k-mers associated with a specific non-reference category or variable.\n\n            - `vars_order` (`List[str]`):  \n            A list specifying the order in which variables should be processed. The order determines the priority \n            of consumption, ensuring that earlier variables in the list have their k-mers accounted for before \n            later ones.\n\n            - `**kwargs`:  \n            Additional keyword arguments. Reserved for future extensions and should not be used in the current context.\n\n        **Returns**:\n\n            - `Dict[str, float]`:  \n            A dictionary containing statistics for each variable name in `vars_order`, \n                - `\"non-genomic total k-mer abundance\"` (`float`):  \n                    The sum of abundances of non-reference k-mers associated with the variable.\n                - `\"non-genomic coverage index\"` (`float`):  \n                    The ratio of unique non-reference k-mers associated with the variable to the total number \n                    of non-reference k-mers in the sample before consumption.\n\n            Example Output:\n            ```python\n            {\n                \"variable_A non-genomic total k-mer abundance\": 1500.0,\n                \"variable_A non-genomic coverage index\": 0.20\n                \"variable_B non-genomic total k-mer abundance\": 3500.0,\n                \"variable_B non-genomic coverage index\": 0.70\n                \"non-var non-genomic total k-mer abundance\": 0.10,\n                \"non-var non-genomic coverage index\": 218\n            }\n            ```\n\n        **Raises**:\n\n            - `ValueError`:  \n            - If any variable specified in `vars_order` is not present in the `vars` dictionary.\n            - This ensures that all variables intended for consumption are available for processing.\n\n        **Usage Example**:\n\n        ```python\n        # Assume `variables_signatures` is a dictionary of variable-specific SnipeSig instances\n        variables_signatures = {\n            \"GTDB\": sig_GTDB,\n            \"VIRALDB\": sig_VIRALDB,\n            \"contaminant_X\": sig_contaminant_x\n        }\n\n        # Define the order in which variables should be processed\n        processing_order = [\"GTDB\", \"VIRALDB\", \"contaminant_X\"]\n\n        # Consume non-reference k-mers and retrieve statistics\n        nonref_stats = qc.nonref_consume_from_vars(vars=variables_signatures, vars_order=processing_order)\n\n        print(nonref_stats)\n        # Output Example:\n        # {\n        #     \"GTDB non-genomic total k-mer abundance\": 1500.0,\n        #     \"GTDB non-genomic coverage index\": 0.2,\n        #     \"VIRALDB non-genomic total k-mer abundance\": 3500.0,\n        #     \"VIRALDB non-genomic coverage index\": 0.70,\n        #     \"contaminant_X non-genomic total k-mer abundance\": 0.0,\n        #     \"contaminant_X non-genomic coverage index\": 0.0,\n        #     \"non-var non-genomic total k-mer abundance\": 100.0,\n        #     \"non-var non-genomic coverage index\": 0.1\n        # }\n        ```\n\n        **Notes**:\n\n            - **Variable Processing Order**:  \n            The `vars_order` list determines the sequence in which variables are processed. This order is crucial\n            when there is potential overlap in k-mers between variables, as earlier variables in the list have \n            higher priority in consuming shared k-mers.\n\n            - **Non-Reference K-mers Definition**:  \n            Non-reference k-mers are defined as those present in the sample signature but absent in the reference \n            signature. This method focuses on characterizing these unique k-mers relative to provided variables.\n        \"\"\"\n\n        # check the all vars in vars_order are in vars\n        if not all([var in vars for var in vars_order]):\n            # report dict keys, and the vars order\n            self.logger.debug(\"Provided vars_order: %s, and vars keys: %s\", vars_order, list(vars.keys()))\n            self.logger.error(\"All variables in vars_order must be present in vars.\")\n            raise ValueError(\"All variables in vars_order must be present in vars.\")\n\n        self.logger.debug(\"Consuming non-reference k-mers from provided variables.\")\n        self.logger.debug(\"\\t-Current size of the sample signature: %d hashes.\", len(self.sample_sig))\n\n        sample_nonref = self.sample_sig - self.reference_sig\n\n        sample_nonref.trim_singletons()\n\n        sample_nonref_unique_hashes = len(sample_nonref)\n\n        self.logger.debug(\"\\t-Size of non-reference k-mers in the sample signature: %d hashes.\", len(sample_nonref))\n        if len(sample_nonref) == 0:\n            self.logger.warning(\"No non-reference k-mers found in the sample signature.\")\n            return {}\n\n        # intersect and report coverage and depth, then subtract from sample_nonref so sum will be 100%\n        for var_name in vars_order:\n            sample_nonref_var: SnipeSig = sample_nonref &amp; vars[var_name]\n            sample_nonref_var_total_abundance = sample_nonref_var.total_abundance\n            sample_nonref_var_unique_hashes = len(sample_nonref_var)\n            sample_nonref_var_coverage_index = sample_nonref_var_unique_hashes / sample_nonref_unique_hashes\n            self.vars_nonref_stats.update({\n                f\"{var_name} non-genomic total k-mer abundance\": sample_nonref_var_total_abundance,\n                f\"{var_name} non-genomic coverage index\": sample_nonref_var_coverage_index\n            })\n\n            self.logger.debug(\"\\t-Consuming non-reference k-mers from variable '%s'.\", var_name)\n            sample_nonref -= sample_nonref_var\n            self.logger.debug(\"\\t-Size of remaining non-reference k-mers in the sample signature: %d hashes.\", len(sample_nonref))\n\n        self.vars_nonref_stats[\"non-var non-genomic total k-mer abundance\"] = sample_nonref.total_abundance\n        self.vars_nonref_stats[\"non-var non-genomic coverage index\"] = len(sample_nonref) / sample_nonref_unique_hashes if sample_nonref_unique_hashes &gt; 0 else 0.0\n\n        self.logger.debug(\n            \"After consuming all vars from the non reference k-mers, the size of the sample signature is: %d hashes, \"\n            \"with total abundance of %s.\", \n            len(sample_nonref), sample_nonref.total_abundance\n        )\n\n        return self.vars_nonref_stats\n\n    def load_genome_sig_to_dict(self, *, zip_file_path: str, **kwargs) -&gt; Dict[str, 'SnipeSig']:\n        \"\"\"\n        Load a genome signature into a dictionary of SnipeSig instances.\n\n        Parameters:\n            zip_file_path (str): Path to the zip file containing the genome signatures.\n            **kwargs: Additional keyword arguments to pass to the SnipeSig constructor.\n\n        Returns:\n            Dict[str, SnipeSig]: A dictionary mapping genome names to SnipeSig instances.\n        \"\"\"\n\n        genome_chr_name_to_sig = {}\n\n        sourmash_sigs: List[sourmash.signature.SourmashSignature] = sourmash.load_file_as_signatures(zip_file_path)\n        sex_count = 0\n        autosome_count = 0\n        genome_count = 0\n        for sig in sourmash_sigs:\n            name = sig.name\n            if name.endswith(\"-snipegenome\"):\n                self.logger.debug(f\"Loading genome signature: {name}\")\n                restored_name = name.replace(\"-snipegenome\", \"\")\n                genome_chr_name_to_sig[restored_name] = SnipeSig(sourmash_sig=sig, sig_type=SigType.GENOME)\n                genome_count += 1\n            elif \"sex\" in name:\n                sex_count += 1\n                genome_chr_name_to_sig[name.replace('sex-','')] = SnipeSig(sourmash_sig=sig, sig_type=SigType.GENOME)\n            elif \"autosome\" in name:\n                autosome_count += 1\n                genome_chr_name_to_sig[name.replace('autosome-','')] = SnipeSig(sourmash_sig=sig, sig_type=SigType.GENOME)\n            else:\n                logging.warning(f\"Unknown genome signature name: {name}, are you sure you generated this with `snipe sketch --ref`?\")\n\n        self.logger.debug(\"Loaded %d genome signatures and %d sex chrs and %d autosome chrs\", genome_count, sex_count, autosome_count)\n\n        if genome_count != 1:\n            logging.error(f\"Expected 1 genome signature, found {genome_count}\")\n\n\n        return genome_chr_name_to_sig\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.calculate_chromosome_metrics","title":"<code>calculate_chromosome_metrics(chr_to_sig)</code>","text":"<p>Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.</p> <p>This method computes the CV to assess the variability of mean abundances among autosomal chromosomes, excluding any sex chromosomes.</p> <p>Mathematical Explanation:</p> <p>The Coefficient of Variation (CV) is defined as:</p> \\[ \\text{CV} = \\frac{\\sigma}{\\mu} \\] <p>Where: - \\( \\sigma \\) is the standard deviation of the mean abundances across autosomal chromosomes. - \\( \\mu \\) is the mean of the mean abundances across autosomal chromosomes.</p> <p>Parameters:</p> <ul> <li><code>chr_to_sig</code> (<code>Dict[str, SnipeSig]</code>):   A dictionary mapping chromosome names (e.g., <code>'autosomal-1'</code>, <code>'autosomal-2'</code>, <code>'sex-x'</code>, <code>'sex-y'</code>) to their corresponding   <code>SnipeSig</code> instances. Each <code>SnipeSig</code> should represent the k-mer signature of a specific chromosome.</li> </ul> <p>Returns:</p> <ul> <li><code>Dict[str, Any]</code>:   A dictionary containing the computed metrics:<ul> <li><code>\"Autosomal_CV\"</code> (<code>float</code>):     The coefficient of variation of mean abundances across autosomal chromosomes.</li> </ul> </li> </ul> <p>Raises:</p> <ul> <li><code>ValueError</code>:   If <code>chr_to_sig</code> is empty or if there is an inconsistency in the signatures' parameters.</li> </ul> <p>Usage Example:</p> <pre><code># Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances\nchr_signatures = {\n    \"1\": sig_chr1,\n    \"2\": sig_chr2,\n    \"X\": sig_chrX,\n    \"Y\": sig_chrY\n}\n\n# Calculate chromosome metrics\nmetrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)\n\nprint(metrics)\n# Output:\n# {'Autosomal_CV': 0.15}\n</code></pre> <p>Notes:</p> <ul> <li> <p>Exclusion of Sex Chromosomes:   Chromosomes with names containing the substring <code>\"sex\"</code> (e.g., <code>'sex-y'</code>, <code>'sex-x'</code>) are excluded from the CV calculation to focus solely on autosomal chromosomes.</p> </li> <li> <p>Mean Abundance Calculation:   The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.</p> </li> </ul> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def calculate_chromosome_metrics(self, chr_to_sig: Dict[str, SnipeSig]) -&gt; Dict[str, Any]:\n    r\"\"\"\n    Calculate the coefficient of variation (CV) of mean abundances across autosomal chromosomes.\n\n    This method computes the CV to assess the variability of mean abundances among autosomal chromosomes,\n    excluding any sex chromosomes.\n\n    **Mathematical Explanation**:\n\n    The Coefficient of Variation (CV) is defined as:\n\n    $$\n    \\text{CV} = \\frac{\\sigma}{\\mu}\n    $$\n\n    Where:\n    - \\( \\sigma \\) is the standard deviation of the mean abundances across autosomal chromosomes.\n    - \\( \\mu \\) is the mean of the mean abundances across autosomal chromosomes.\n\n    **Parameters**:\n\n    - `chr_to_sig` (`Dict[str, SnipeSig]`):  \n      A dictionary mapping chromosome names (e.g., `'autosomal-1'`, `'autosomal-2'`, `'sex-x'`, `'sex-y'`) to their corresponding\n      `SnipeSig` instances. Each `SnipeSig` should represent the k-mer signature of a specific chromosome.\n\n    **Returns**:\n\n    - `Dict[str, Any]`:  \n      A dictionary containing the computed metrics:\n          - `\"Autosomal_CV\"` (`float`):  \n            The coefficient of variation of mean abundances across autosomal chromosomes.\n\n    **Raises**:\n\n    - `ValueError`:  \n      If `chr_to_sig` is empty or if there is an inconsistency in the signatures' parameters.\n\n    **Usage Example**:\n\n    ```python\n    # Assume `chr_signatures` is a dictionary of chromosome-specific SnipeSig instances\n    chr_signatures = {\n        \"1\": sig_chr1,\n        \"2\": sig_chr2,\n        \"X\": sig_chrX,\n        \"Y\": sig_chrY\n    }\n\n    # Calculate chromosome metrics\n    metrics = qc.calculate_chromosome_metrics(chr_to_sig=chr_signatures)\n\n    print(metrics)\n    # Output:\n    # {'Autosomal_CV': 0.15}\n    ```\n\n    **Notes**:\n\n    - **Exclusion of Sex Chromosomes**:  \n      Chromosomes with names containing the substring `\"sex\"` (e.g., `'sex-y'`, `'sex-x'`) are excluded from the CV calculation to focus solely on autosomal chromosomes.\n\n    - **Mean Abundance Calculation**:  \n      The mean abundance for each chromosome is calculated by intersecting the sample signature with the chromosome-specific signature and averaging the abundances of the shared k-mers.\n    \"\"\"\n\n    # Implementation of the method\n    # let's make sure all chromosome sigs are unique\n    self.logger.debug(\"Computing specific chromosome hashes for %s.\", ','.join(chr_to_sig.keys()))\n    self.logger.debug(f\"\\t-All hashes for chromosomes before getting unique sigs {len(SnipeSig.sum_signatures(list(chr_to_sig.values())))}\")\n    specific_chr_to_sig = SnipeSig.get_unique_signatures(chr_to_sig)\n    self.logger.debug(f\"\\t-All hashes for chromosomes after getting unique sigs {len(SnipeSig.sum_signatures(list(specific_chr_to_sig.values())))}\")\n\n    # calculate mean abundance for each chromosome and loaded sample sig\n    chr_to_mean_abundance = {}\n    self.logger.debug(\"Calculating mean abundance for each chromosome.\")\n    for chr_name, chr_sig in specific_chr_to_sig.items():\n        self.logger.debug(\"Intersecting %s (%d) with %s (%d)\", self.sample_sig.name, len(self.sample_sig), chr_name, len(chr_sig))\n        chr_sample_sig = self.sample_sig &amp; chr_sig\n        chr_stats = chr_sample_sig.get_sample_stats\n        chr_to_mean_abundance[chr_name] = chr_stats[\"mean_abundance\"]\n        self.logger.debug(\"\\t-Mean abundance for %s: %f\", chr_name, chr_stats[\"mean_abundance\"])\n\n    self.chrs_stats.update(chr_to_mean_abundance)\n\n    # chr_to_mean_abundance but without any chr with partial name sex\n    autosomal_chr_to_mean_abundance = {}\n    for chr_name, mean_abundance in chr_to_mean_abundance.items():\n        if \"sex\" in chr_name.lower():\n            continue\n        autosomal_chr_to_mean_abundance[chr_name] = mean_abundance\n\n\n    # calculate the CV for the whole sample\n    if autosomal_chr_to_mean_abundance:\n        mean_abundances = np.array(list(autosomal_chr_to_mean_abundance.values()), dtype=float)\n        cv = np.std(mean_abundances) / np.mean(mean_abundances) if np.mean(mean_abundances) != 0 else 0.0\n        self.chrs_stats.update({\"Autosomal_CV\": cv})\n        self.logger.debug(\"Calculated Autosomal CV: %f\", cv)\n    else:\n        self.logger.warning(\"No autosomal chromosomes were processed. 'Autosomal_CV' set to None.\")\n        self.chrs_stats.update({\"Autosomal_CV\": None})\n\n    # optional return, not required\n    return self.chrs_stats\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.calculate_coverage_vs_depth","title":"<code>calculate_coverage_vs_depth(n=30)</code>","text":"<p>Calculate cumulative coverage index vs cumulative sequencing depth.</p> <p>This method simulates incremental sequencing by splitting the sample signature into <code>n</code> parts and calculating the cumulative coverage index at each step. It helps in understanding how coverage improves with increased sequencing depth.</p> <p>Mathematical Explanation:</p> <p>For each cumulative part \\( i \\) (where \\( 1 \\leq i \\leq n \\)):</p> <ul> <li> <p>Cumulative Sequencing Depth (\\( D_i \\)):   $$   D_i = \\sum_{j=1}^{i} a_j   $$   Where \\( a_j \\) is the total abundance of the \\( j^{th} \\) part.</p> </li> <li> <p>Cumulative Coverage Index (\\( C_i \\)):   $$   C_i = \\frac{\\text{Number of genomic unique k-mers in first } i \\text{ parts}}{\\left| \\text{Reference genome k-mer set} \\right|}   $$</p> </li> </ul> <p>Parameters:</p> <ul> <li><code>n</code> (<code>int</code>): Number of parts to split the signature into.</li> </ul> <p>Returns:</p> <ul> <li><code>List[Dict[str, Any]]</code>:   List of dictionaries containing:<ul> <li><code>\"cumulative_parts\"</code> (<code>int</code>): Number of parts included.</li> <li><code>\"cumulative_total_abundance\"</code> (<code>int</code>): Total sequencing depth up to this part.</li> <li><code>\"cumulative_coverage_index\"</code> (<code>float</code>): Coverage index up to this part.</li> </ul> </li> </ul> <p>Usage Example:</p> <pre><code>coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)\nfor data in coverage_depth_data:\n    print(data)\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def calculate_coverage_vs_depth(self, n: int = 30) -&gt; List[Dict[str, Any]]:\n    r\"\"\"\n    Calculate cumulative coverage index vs cumulative sequencing depth.\n\n    This method simulates incremental sequencing by splitting the sample signature into `n` parts and\n    calculating the cumulative coverage index at each step. It helps in understanding how coverage\n    improves with increased sequencing depth.\n\n    **Mathematical Explanation**:\n\n    For each cumulative part \\( i \\) (where \\( 1 \\leq i \\leq n \\)):\n\n    - **Cumulative Sequencing Depth** (\\( D_i \\)):\n      $$\n      D_i = \\sum_{j=1}^{i} a_j\n      $$\n      Where \\( a_j \\) is the total abundance of the \\( j^{th} \\) part.\n\n    - **Cumulative Coverage Index** (\\( C_i \\)):\n      $$\n      C_i = \\frac{\\text{Number of genomic unique k-mers in first } i \\text{ parts}}{\\left| \\text{Reference genome k-mer set} \\right|}\n      $$\n\n    **Parameters**:\n\n    - `n` (`int`): Number of parts to split the signature into.\n\n    **Returns**:\n\n    - `List[Dict[str, Any]]`:  \n      List of dictionaries containing:\n        - `\"cumulative_parts\"` (`int`): Number of parts included.\n        - `\"cumulative_total_abundance\"` (`int`): Total sequencing depth up to this part.\n        - `\"cumulative_coverage_index\"` (`float`): Coverage index up to this part.\n\n    **Usage Example**:\n\n    ```python\n    coverage_depth_data = qc.calculate_coverage_vs_depth(n=10)\n    for data in coverage_depth_data:\n        print(data)\n    ```\n    \"\"\"\n    self.logger.debug(\"Calculating coverage vs depth with %d parts.\", n)\n    # Determine the ROI reference signature\n    if isinstance(self.amplicon_sig, SnipeSig):\n        roi_reference_sig = self.amplicon_sig\n        self.logger.debug(\"Using amplicon signature as ROI reference.\")\n    else:\n        roi_reference_sig = self.reference_sig\n        self.logger.debug(\"Using reference genome signature as ROI reference.\")\n\n    # Split the sample signature into n random parts (cached if available)\n    split_sigs = self.split_sig_randomly(n)\n\n    coverage_depth_data = []\n\n    if not split_sigs:\n        self.logger.error(\"No split signatures available. Cannot calculate coverage vs depth.\")\n        return coverage_depth_data\n\n    cumulative_snipe_sig = split_sigs[0].copy()\n    cumulative_total_abundance = cumulative_snipe_sig.total_abundance\n\n    # Force conversion to GENOME\n    roi_reference_sig.sigtype = SigType.GENOME\n\n    # Compute initial coverage index\n    cumulative_qc = ReferenceQC(\n        sample_sig=cumulative_snipe_sig,\n        reference_sig=roi_reference_sig,\n        enable_logging=self.enable_logging\n    )\n    cumulative_stats = cumulative_qc.get_aggregated_stats()\n    cumulative_coverage_index = cumulative_stats.get(\"Genome coverage index\", 0.0)\n\n    coverage_depth_data.append({\n        \"cumulative_parts\": 1,\n        \"cumulative_total_abundance\": cumulative_total_abundance,\n        \"cumulative_coverage_index\": cumulative_coverage_index,\n    })\n\n    self.logger.debug(\"Added initial coverage depth data for part 1.\")\n\n    # Iterate over the rest of the parts\n    for i in range(1, n):\n        current_part = split_sigs[i]\n\n        # Add current part to cumulative signature\n        cumulative_snipe_sig += current_part\n        cumulative_total_abundance += current_part.total_abundance\n\n        # Compute new coverage index\n        cumulative_qc = ReferenceQC(\n            sample_sig=cumulative_snipe_sig,\n            reference_sig=roi_reference_sig,\n            enable_logging=self.enable_logging\n        )\n        cumulative_stats = cumulative_qc.get_aggregated_stats()\n        cumulative_coverage_index = cumulative_stats.get(\"Genome coverage index\", 0.0)\n\n        coverage_depth_data.append({\n            \"cumulative_parts\": i + 1,\n            \"cumulative_total_abundance\": cumulative_total_abundance,\n            \"cumulative_coverage_index\": cumulative_coverage_index,\n        })\n\n        self.logger.debug(\"Added coverage depth data for part %d.\", i + 1)\n\n    self.logger.debug(\"Coverage vs depth calculation completed.\")\n    return coverage_depth_data\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.calculate_sex_chrs_metrics","title":"<code>calculate_sex_chrs_metrics(genome_and_chr_to_sig)</code>","text":"<p>Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.</p> <p>This method processes a collection of genome and chromosome-specific <code>SnipeSig</code> instances to compute metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome. The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to accurately assess sex chromosome metrics.</p> <p>Mathematical Explanation:</p> <ul> <li>X-Ploidy Score:</li> </ul> <p>The X-Ploidy score is calculated using the formula:</p> <p>$$   \\text{X-Ploidy} = \\left(\\frac{\\mu_X}{\\mu_{\\text{autosomal}}}\\right) \\times \\left(\\frac{N_{\\text{autosomal}}}{N_X}\\right)   $$</p> <p>Where:   - \\( \\mu_X \\) is the mean abundance of X chromosome-specific k-mers in the sample.   - \\( \\mu_{\\text{autosomal}} \\) is the mean abundance of autosomal k-mers in the sample.   - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.   - \\( N_X \\) is the number of X chromosome-specific k-mers in the reference genome.</p> <ul> <li>Y-Coverage:</li> </ul> <p>The Y-Coverage is calculated using the formula:</p> <p>$$   \\text{Y-Coverage} = \\frac{\\left(\\frac{N_Y<sup>{\\text{sample}}}{N_Y}\\right)}{\\left(\\frac{N_{\\text{autosomal}}</sup>   $$}}}{N_{\\text{autosomal}}}\\right)</p> <p>Where:   - \\( N_Y^{\\text{sample}} \\) is the number of Y chromosome-specific k-mers in the sample.   - \\( N_Y \\) is the number of Y chromosome-specific k-mers in the reference genome.   - \\( N_{\\text{autosomal}}^{\\text{sample}} \\) is the number of autosomal k-mers in the sample.   - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.</p> <p>Parameters:</p> <pre><code>- `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  \n  A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include\n  the autosomal genome signature (with a name ending in `'-snipegenome'`) and chromosome-specific\n  signatures (e.g., `'sex-x'`, `'sex-y'`, `'autosome-1'`, `'autosome-2'`, etc.).\n</code></pre> <p>Returns:</p> <pre><code>- `Dict[str, Any]`:  \n  A dictionary containing the calculated sex-related metrics:\n      - `\"X-Ploidy score\"` (`float`):  \n        The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance\n        to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.\n      - `\"Y-Coverage\"` (`float`, optional):  \n        The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.\n        This key is present only if a Y chromosome signature is provided.\n</code></pre> <p>Raises:</p> <pre><code>- `ValueError`:  \n  - If the `'sex-x'` chromosome signature is not found in `genome_and_chr_to_sig`.\n  - If the autosomal genome signature is not found or improperly labeled.\n</code></pre> <p>Usage Example:</p> <pre><code># Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances\ngenome_and_chr_signatures = {\n    \"autosomal-snipegenome\": sig_autosomal_genome,\n    \"1\": sig_chr1,\n    \"2\": sig_chr2,\n    \"sex-x\": sig_sex_x,\n    \"sex-y\": sig_sex_y\n}\n\n# Calculate sex chromosome metrics\nmetrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)\n\nprint(metrics)\n# Output Example:\n# {\n#     \"X-Ploidy score\": 2.6667,\n#     \"Y-Coverage\": 0.0\n# }\n</code></pre> <p>Notes:</p> <pre><code>- **Signature Naming Convention**:  \n  The autosomal genome signature must have a name ending with `'-snipegenome'`. Chromosome-specific\n  signatures should be named accordingly (e.g., `'sex-x'`, `'sex-y'`, `'autosomal-1'`, `'autosomal-2'`, etc.).\n\n- **Exclusion of Sex Chromosomes from Autosomal Genome**:  \n  The Y chromosome signature (`'sex-y'`) is subtracted from the autosomal genome signature to ensure\n  that Y chromosome k-mers are not counted towards autosomal metrics.\n\n- **Robustness**:  \n  The method includes comprehensive logging for debugging purposes, tracking each major step and\n  any exclusions made during processing.\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def calculate_sex_chrs_metrics(self, genome_and_chr_to_sig: Dict[str, SnipeSig]) -&gt; Dict[str, Any]:\n    r\"\"\"\n    Calculate sex chromosome-related metrics based on genome and chromosome-specific signatures.\n\n    This method processes a collection of genome and chromosome-specific `SnipeSig` instances to compute\n    metrics such as the X-Ploidy score and Y-Coverage. It ensures that each chromosome signature contains\n    only unique hashes that do not overlap with hashes from other chromosomes or the autosomal genome.\n    The method excludes sex chromosomes (e.g., Y chromosome) from the autosomal genome signature to\n    accurately assess sex chromosome metrics.\n\n    **Mathematical Explanation**:\n\n    - **X-Ploidy Score**:\n\n      The X-Ploidy score is calculated using the formula:\n\n      $$\n      \\text{X-Ploidy} = \\left(\\frac{\\mu_X}{\\mu_{\\text{autosomal}}}\\right) \\times \\left(\\frac{N_{\\text{autosomal}}}{N_X}\\right)\n      $$\n\n      Where:\n      - \\( \\mu_X \\) is the mean abundance of X chromosome-specific k-mers in the sample.\n      - \\( \\mu_{\\text{autosomal}} \\) is the mean abundance of autosomal k-mers in the sample.\n      - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.\n      - \\( N_X \\) is the number of X chromosome-specific k-mers in the reference genome.\n\n    - **Y-Coverage**:\n\n      The Y-Coverage is calculated using the formula:\n\n      $$\n      \\text{Y-Coverage} = \\frac{\\left(\\frac{N_Y^{\\text{sample}}}{N_Y}\\right)}{\\left(\\frac{N_{\\text{autosomal}}^{\\text{sample}}}{N_{\\text{autosomal}}}\\right)}\n      $$\n\n      Where:\n      - \\( N_Y^{\\text{sample}} \\) is the number of Y chromosome-specific k-mers in the sample.\n      - \\( N_Y \\) is the number of Y chromosome-specific k-mers in the reference genome.\n      - \\( N_{\\text{autosomal}}^{\\text{sample}} \\) is the number of autosomal k-mers in the sample.\n      - \\( N_{\\text{autosomal}} \\) is the number of autosomal k-mers in the reference genome.\n\n    **Parameters**:\n\n        - `genome_and_chr_to_sig` (`Dict[str, SnipeSig]`):  \n          A dictionary mapping signature names to their corresponding `SnipeSig` instances. This should include\n          the autosomal genome signature (with a name ending in `'-snipegenome'`) and chromosome-specific\n          signatures (e.g., `'sex-x'`, `'sex-y'`, `'autosome-1'`, `'autosome-2'`, etc.).\n\n    **Returns**:\n\n        - `Dict[str, Any]`:  \n          A dictionary containing the calculated sex-related metrics:\n              - `\"X-Ploidy score\"` (`float`):  \n                The ploidy score of the X chromosome, reflecting the ratio of X chromosome k-mer abundance\n                to autosomal k-mer abundance, adjusted by genome and X chromosome sizes.\n              - `\"Y-Coverage\"` (`float`, optional):  \n                The coverage of Y chromosome-specific k-mers in the sample relative to autosomal coverage.\n                This key is present only if a Y chromosome signature is provided.\n\n    **Raises**:\n\n        - `ValueError`:  \n          - If the `'sex-x'` chromosome signature is not found in `genome_and_chr_to_sig`.\n          - If the autosomal genome signature is not found or improperly labeled.\n\n    **Usage Example**:\n\n    ```python\n    # Assume `genome_and_chr_signatures` is a dictionary of genome and chromosome-specific SnipeSig instances\n    genome_and_chr_signatures = {\n        \"autosomal-snipegenome\": sig_autosomal_genome,\n        \"1\": sig_chr1,\n        \"2\": sig_chr2,\n        \"sex-x\": sig_sex_x,\n        \"sex-y\": sig_sex_y\n    }\n\n    # Calculate sex chromosome metrics\n    metrics = qc.calculate_sex_chrs_metrics(genome_and_chr_to_sig=genome_and_chr_signatures)\n\n    print(metrics)\n    # Output Example:\n    # {\n    #     \"X-Ploidy score\": 2.6667,\n    #     \"Y-Coverage\": 0.0\n    # }\n    ```\n\n    **Notes**:\n\n        - **Signature Naming Convention**:  \n          The autosomal genome signature must have a name ending with `'-snipegenome'`. Chromosome-specific\n          signatures should be named accordingly (e.g., `'sex-x'`, `'sex-y'`, `'autosomal-1'`, `'autosomal-2'`, etc.).\n\n        - **Exclusion of Sex Chromosomes from Autosomal Genome**:  \n          The Y chromosome signature (`'sex-y'`) is subtracted from the autosomal genome signature to ensure\n          that Y chromosome k-mers are not counted towards autosomal metrics.\n\n        - **Robustness**:  \n          The method includes comprehensive logging for debugging purposes, tracking each major step and\n          any exclusions made during processing.\n    \"\"\"\n\n    # Ensure that the chromosome X signature exists\n    if 'sex-x' not in genome_and_chr_to_sig:\n        self.logger.warning(\"Chromosome X ('sex-x') not found in the provided signatures. X-Ploidy score will be set to zero.\")\n        # set sex-x to an empty signature\n        genome_and_chr_to_sig['sex-x'] = SnipeSig.create_from_hashes_abundances(\n            hashes=np.array([], dtype=np.uint64),\n            abundances=np.array([], dtype=np.uint32),\n            ksize=genome_and_chr_to_sig[list(genome_and_chr_to_sig.keys())[0]].ksize,\n            scale=genome_and_chr_to_sig[list(genome_and_chr_to_sig.keys())[0]].scale,\n        )\n\n    # Separate the autosomal genome signature from chromosome-specific signatures\n    chr_to_sig: Dict[str, SnipeSig] = {}\n    autosomals_genome_sig: Optional[SnipeSig] = None\n    self.logger.debug(\"Separating autosomal genome signature from chromosome-specific signatures.\")\n\n    for name, sig in genome_and_chr_to_sig.items():\n        if name.endswith('-snipegenome'):\n            self.logger.debug(\"\\t- Identified autosomal genome signature: '%s'.\", name)\n            autosomals_genome_sig = sig\n        else:\n            chr_to_sig[name] = sig\n\n    if autosomals_genome_sig is None:\n        self.logger.error(\"Autosomal genome signature (ending with '-snipegenome') not found.\")\n        raise ValueError(\"Autosomal genome signature (ending with '-snipegenome') not found.\")\n\n    # Ensure all chromosome signatures have unique hashes\n    specific_chr_to_sig = SnipeSig.get_unique_signatures(chr_to_sig)\n\n    # Exclude Y chromosome from the autosomal genome signature if present\n    if 'sex-y' in chr_to_sig:\n        self.logger.debug(\"Y chromosome ('sex-y') detected. Removing its hashes from the autosomal genome signature.\")\n        self.logger.debug(\"\\t- Original autosomal genome size: %d hashes.\", len(autosomals_genome_sig))\n        autosomals_genome_sig = autosomals_genome_sig - chr_to_sig['sex-y']\n        self.logger.debug(\"\\t- Updated autosomal genome size after removing Y chromosome: %d hashes.\", len(autosomals_genome_sig))\n\n    # Remove X chromosome hashes from the autosomal genome signature\n    self.logger.debug(\"Removing X chromosome ('sex-x') hashes from the autosomal genome signature.\")\n    autosomals_genome_sig = autosomals_genome_sig - chr_to_sig['sex-x']\n    self.logger.debug(\"\\t- Updated autosomal genome size after removing X chromosome: %d hashes.\", len(autosomals_genome_sig))\n\n    # Derive the X chromosome-specific signature by subtracting autosomal genome hashes\n    specific_xchr_sig = specific_chr_to_sig[\"sex-x\"] - autosomals_genome_sig\n    self.logger.debug(\"\\t-Derived X chromosome-specific signature size: %d hashes.\", len(specific_xchr_sig))\n\n    # Intersect the sample signature with chromosome-specific signatures\n    sample_specific_xchr_sig = self.sample_sig &amp; specific_xchr_sig\n    if len(sample_specific_xchr_sig) == 0:\n        self.logger.warning(\"No X chromosome-specific k-mers found in the sample signature.\")\n    self.logger.debug(\"\\t-Intersected sample signature with X chromosome-specific k-mers = %d hashes.\", len(sample_specific_xchr_sig))\n    sample_autosomal_sig = self.sample_sig &amp; autosomals_genome_sig\n    self.logger.debug(\"\\t-Intersected sample signature with autosomal genome k-mers = %d hashes.\", len(sample_autosomal_sig))\n\n    # Retrieve mean abundances\n    xchr_mean_abundance = sample_specific_xchr_sig.get_sample_stats.get(\"mean_abundance\", 0.0)\n    autosomal_mean_abundance = sample_autosomal_sig.get_sample_stats.get(\"mean_abundance\", 0.0)\n\n    # Calculate X-Ploidy score\n    if autosomal_mean_abundance == 0:\n        self.logger.warning(\"Autosomal mean abundance is zero. Setting X-Ploidy score to zero to avoid division by zero.\")\n        xploidy_score = 0.0\n    else:\n        xploidy_score = (xchr_mean_abundance / autosomal_mean_abundance) * \\\n                        (len(autosomals_genome_sig) / len(specific_xchr_sig) if len(specific_xchr_sig) &gt; 0 else 0.0)\n\n    self.logger.debug(\"Calculated X-Ploidy score: %.4f\", xploidy_score)\n    self.sex_stats.update({\"X-Ploidy score\": xploidy_score})\n\n    # Calculate Y-Coverage if Y chromosome is present\n    if 'sex-y' in specific_chr_to_sig:\n        self.logger.debug(\"Calculating Y-Coverage based on Y chromosome-specific k-mers.\")\n\n        # Derive Y chromosome-specific k-mers by excluding autosomal and X chromosome k-mers\n        ychr_specific_kmers = chr_to_sig[\"sex-y\"] - autosomals_genome_sig - specific_xchr_sig\n        self.logger.debug(\"\\t-Derived Y chromosome-specific signature size: %d hashes.\", len(ychr_specific_kmers))\n\n        # Intersect Y chromosome-specific k-mers with the sample signature\n        ychr_in_sample = self.sample_sig &amp; ychr_specific_kmers\n        self.logger.debug(\"\\t-Intersected sample signature with Y chromosome-specific k-mers = %d hashes.\", len(ychr_in_sample))\n        if len(ychr_in_sample) == 0:\n            self.logger.warning(\"No Y chromosome-specific k-mers found in the sample signature.\")\n\n        # Derive autosomal-specific k-mers by excluding X and Y chromosome k-mers from the reference signature\n        autosomals_specific_kmers = self.reference_sig - specific_chr_to_sig[\"sex-x\"] - specific_chr_to_sig['sex-y']\n\n        # Calculate Y-Coverage metric\n        if len(ychr_specific_kmers) == 0 or len(autosomals_specific_kmers) == 0:\n            self.logger.warning(\"Insufficient k-mers for Y-Coverage calculation. Setting Y-Coverage to zero.\")\n            ycoverage = 0.0\n        else:\n            ycoverage = (len(ychr_in_sample) / len(ychr_specific_kmers)) / \\\n                    (len(sample_autosomal_sig) / len(autosomals_specific_kmers))\n\n        self.logger.debug(\"Calculated Y-Coverage: %.4f\", ycoverage)\n        self.sex_stats.update({\"Y-Coverage\": ycoverage})\n\n    return self.sex_stats\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.distribute_kmers_random","title":"<code>distribute_kmers_random(original_dict, n)</code>  <code>staticmethod</code>","text":"<p>Distribute the k-mers randomly into <code>n</code> parts based on their abundances.</p> <p>This helper method performs the actual distribution of k-mers using a multinomial distribution.</p> <p>Mathematical Explanation:</p> <p>Given a k-mer with hash \\( h \\) and abundance \\( a_h \\), the distribution of its abundance across \\( n \\) parts is modeled as:</p> \\[ a_{h,1}, a_{h,2}, \\dots, a_{h,n} \\sim \\text{Multinomial}(a_h, p_1, p_2, \\dots, p_n) \\] <p>Where \\( p_i = \\frac{1}{n} \\) for all \\( i \\).</p> <p>Parameters:</p> <ul> <li><code>original_dict</code> (<code>Dict[int, int]</code>):   Dictionary mapping k-mer hashes to their abundances.</li> <li><code>n</code> (<code>int</code>): Number of parts to split into.</li> </ul> <p>Returns:</p> <ul> <li><code>List[Dict[int, int]]</code>:   List of dictionaries, each mapping k-mer hashes to their abundances in that part.</li> </ul> <p>Usage Example:</p> <pre><code>distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>@staticmethod\ndef distribute_kmers_random(original_dict: Dict[int, int], n: int) -&gt; List[Dict[int, int]]:\n    r\"\"\"\n    Distribute the k-mers randomly into `n` parts based on their abundances.\n\n    This helper method performs the actual distribution of k-mers using a multinomial distribution.\n\n    **Mathematical Explanation**:\n\n    Given a k-mer with hash \\( h \\) and abundance \\( a_h \\), the distribution of its abundance across \\( n \\)\n    parts is modeled as:\n\n    $$\n    a_{h,1}, a_{h,2}, \\dots, a_{h,n} \\sim \\text{Multinomial}(a_h, p_1, p_2, \\dots, p_n)\n    $$\n\n    Where \\( p_i = \\frac{1}{n} \\) for all \\( i \\).\n\n    **Parameters**:\n\n    - `original_dict` (`Dict[int, int]`):  \n      Dictionary mapping k-mer hashes to their abundances.\n    - `n` (`int`): Number of parts to split into.\n\n    **Returns**:\n\n    - `List[Dict[int, int]]`:  \n      List of dictionaries, each mapping k-mer hashes to their abundances in that part.\n\n    **Usage Example**:\n\n    ```python\n    distributed = ReferenceQC.distribute_kmers_random(hash_to_abund, n=3)\n    ```\n    \"\"\"\n    # Initialize the resulting dictionaries\n    distributed_dicts = [{} for _ in range(n)]\n\n    # For each k-mer and its abundance\n    for kmer_hash, abundance in original_dict.items():\n        if abundance == 0:\n            continue  # Skip zero abundances\n        # Generate multinomial split of abundance\n        counts = np.random.multinomial(abundance, [1.0 / n] * n)\n        # Update each dictionary\n        for i in range(n):\n            if counts[i] &gt; 0:\n                distributed_dicts[i][kmer_hash] = counts[i]\n\n    return distributed_dicts\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.get_aggregated_stats","title":"<code>get_aggregated_stats(include_advanced=False)</code>","text":"<p>Retrieve aggregated statistics from the quality control analysis.</p> <p>Parameters</p> <ul> <li><code>include_advanced (bool)</code>:   If set to <code>True</code>, includes advanced metrics in the aggregated statistics.</li> </ul> <p>Returns</p> <ul> <li><code>Dict[str, Any]</code>:   A dictionary containing the aggregated statistics, which may include:</li> <li>Sample statistics</li> <li>Genome statistics</li> <li>Amplicon statistics (if provided)</li> <li>Predicted assay type</li> <li>Advanced statistics (if <code>include_advanced</code> is <code>True</code>)</li> </ul> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def get_aggregated_stats(self, include_advanced: bool = False) -&gt; Dict[str, Any]:\n    r\"\"\"\n    Retrieve aggregated statistics from the quality control analysis.\n\n    **Parameters**\n\n    - `include_advanced (bool)`:  \n      If set to `True`, includes advanced metrics in the aggregated statistics.\n\n    **Returns**\n\n    - `Dict[str, Any]`:  \n      A dictionary containing the aggregated statistics, which may include:\n      - Sample statistics\n      - Genome statistics\n      - Amplicon statistics (if provided)\n      - Predicted assay type\n      - Advanced statistics (if `include_advanced` is `True`)\n    \"\"\"\n    aggregated_stats: Dict[str, Any] = {}\n    # Include sample_stats\n    aggregated_stats.update(self.sample_stats)\n    # Include genome_stats\n    aggregated_stats.update(self.genome_stats)\n    # Include amplicon_stats if available\n    if self.amplicon_sig is not None:\n        self.logger.debug(\"While aggregating stats; amplicon signature provided.\")\n        aggregated_stats.update(self.amplicon_stats)\n        aggregated_stats[\"Predicted Assay Type\"] = self.predicted_assay_type\n\n    if self.chrs_stats:\n        aggregated_stats.update(self.chrs_stats)\n\n    if self.sex_stats:\n        aggregated_stats.update(self.sex_stats)\n\n    if self.vars_nonref_stats:\n        aggregated_stats.update(self.vars_nonref_stats)\n\n    # Include advanced_stats if requested\n    if include_advanced:\n        self._calculate_advanced_stats()\n        aggregated_stats.update(self.advanced_stats)\n\n    if self.predicted_error_contamination_index:\n        aggregated_stats.update(self.predicted_error_contamination_index)\n\n    return aggregated_stats\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.load_genome_sig_to_dict","title":"<code>load_genome_sig_to_dict(*, zip_file_path, **kwargs)</code>","text":"<p>Load a genome signature into a dictionary of SnipeSig instances.</p> <p>Parameters:</p> Name Type Description Default <code>zip_file_path</code> <code>str</code> <p>Path to the zip file containing the genome signatures.</p> required <code>**kwargs</code> <p>Additional keyword arguments to pass to the SnipeSig constructor.</p> <code>{}</code> <p>Returns:</p> Type Description <code>Dict[str, SnipeSig]</code> <p>Dict[str, SnipeSig]: A dictionary mapping genome names to SnipeSig instances.</p> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def load_genome_sig_to_dict(self, *, zip_file_path: str, **kwargs) -&gt; Dict[str, 'SnipeSig']:\n    \"\"\"\n    Load a genome signature into a dictionary of SnipeSig instances.\n\n    Parameters:\n        zip_file_path (str): Path to the zip file containing the genome signatures.\n        **kwargs: Additional keyword arguments to pass to the SnipeSig constructor.\n\n    Returns:\n        Dict[str, SnipeSig]: A dictionary mapping genome names to SnipeSig instances.\n    \"\"\"\n\n    genome_chr_name_to_sig = {}\n\n    sourmash_sigs: List[sourmash.signature.SourmashSignature] = sourmash.load_file_as_signatures(zip_file_path)\n    sex_count = 0\n    autosome_count = 0\n    genome_count = 0\n    for sig in sourmash_sigs:\n        name = sig.name\n        if name.endswith(\"-snipegenome\"):\n            self.logger.debug(f\"Loading genome signature: {name}\")\n            restored_name = name.replace(\"-snipegenome\", \"\")\n            genome_chr_name_to_sig[restored_name] = SnipeSig(sourmash_sig=sig, sig_type=SigType.GENOME)\n            genome_count += 1\n        elif \"sex\" in name:\n            sex_count += 1\n            genome_chr_name_to_sig[name.replace('sex-','')] = SnipeSig(sourmash_sig=sig, sig_type=SigType.GENOME)\n        elif \"autosome\" in name:\n            autosome_count += 1\n            genome_chr_name_to_sig[name.replace('autosome-','')] = SnipeSig(sourmash_sig=sig, sig_type=SigType.GENOME)\n        else:\n            logging.warning(f\"Unknown genome signature name: {name}, are you sure you generated this with `snipe sketch --ref`?\")\n\n    self.logger.debug(\"Loaded %d genome signatures and %d sex chrs and %d autosome chrs\", genome_count, sex_count, autosome_count)\n\n    if genome_count != 1:\n        logging.error(f\"Expected 1 genome signature, found {genome_count}\")\n\n\n    return genome_chr_name_to_sig\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.nonref_consume_from_vars","title":"<code>nonref_consume_from_vars(*, vars, vars_order, **kwargs)</code>","text":"<p>Consume and analyze non-reference k-mers from provided variable signatures.</p> <p>This method processes non-reference k-mers in the sample signature by intersecting them with a set of variable-specific <code>SnipeSig</code> instances. It calculates coverage and total abundance metrics for each variable in a specified order, ensuring that each non-reference k-mer is accounted for without overlap between variables. The method updates internal statistics that reflect the distribution of non-reference k-mers across the provided variables.</p> <p>Process Overview:</p> <ol> <li>Validation:</li> <li>Verifies that all variable names specified in <code>vars_order</code> are present in the <code>vars</code> dictionary.</li> <li> <p>Raises a <code>ValueError</code> if any variable in <code>vars_order</code> is missing from <code>vars</code>.</p> </li> <li> <p>Non-Reference K-mer Extraction:</p> </li> <li>Computes the set of non-reference non-singleton k-mers by subtracting the reference signature from the sample signature.</li> <li> <p>If no non-reference k-mers are found, the method logs a warning and returns an empty dictionary.</p> </li> <li> <p>Variable-wise Consumption:</p> </li> <li>Iterates over each variable name in <code>vars_order</code>.</li> <li> <p>For each variable:</p> <ul> <li>Intersects the remaining non-reference k-mers with the variable-specific signature.</li> <li>Calculates the total abundance and coverage index for the intersected k-mers.</li> <li>Updates the <code>vars_nonref_stats</code> dictionary with the computed metrics.</li> <li>Removes the consumed k-mers from the remaining non-reference set to prevent overlap.</li> </ul> </li> <li> <p>Final State Logging:</p> </li> <li>Logs the final size and total abundance of the remaining non-reference k-mers after consumption.</li> </ol> <p>Parameters:</p> <pre><code>- `vars` (`Dict[str, SnipeSig]`):  \nA dictionary mapping variable names to their corresponding `SnipeSig` instances. Each `SnipeSig` \nrepresents a set of k-mers associated with a specific non-reference category or variable.\n\n- `vars_order` (`List[str]`):  \nA list specifying the order in which variables should be processed. The order determines the priority \nof consumption, ensuring that earlier variables in the list have their k-mers accounted for before \nlater ones.\n\n- `**kwargs`:  \nAdditional keyword arguments. Reserved for future extensions and should not be used in the current context.\n</code></pre> <p>Returns:</p> <pre><code>- `Dict[str, float]`:  \nA dictionary containing statistics for each variable name in `vars_order`, \n    - `\"non-genomic total k-mer abundance\"` (`float`):  \n        The sum of abundances of non-reference k-mers associated with the variable.\n    - `\"non-genomic coverage index\"` (`float`):  \n        The ratio of unique non-reference k-mers associated with the variable to the total number \n        of non-reference k-mers in the sample before consumption.\n\nExample Output:\n```python\n{\n    \"variable_A non-genomic total k-mer abundance\": 1500.0,\n    \"variable_A non-genomic coverage index\": 0.20\n    \"variable_B non-genomic total k-mer abundance\": 3500.0,\n    \"variable_B non-genomic coverage index\": 0.70\n    \"non-var non-genomic total k-mer abundance\": 0.10,\n    \"non-var non-genomic coverage index\": 218\n}\n```\n</code></pre> <p>Raises:</p> <pre><code>- `ValueError`:  \n- If any variable specified in `vars_order` is not present in the `vars` dictionary.\n- This ensures that all variables intended for consumption are available for processing.\n</code></pre> <p>Usage Example:</p> <pre><code># Assume `variables_signatures` is a dictionary of variable-specific SnipeSig instances\nvariables_signatures = {\n    \"GTDB\": sig_GTDB,\n    \"VIRALDB\": sig_VIRALDB,\n    \"contaminant_X\": sig_contaminant_x\n}\n\n# Define the order in which variables should be processed\nprocessing_order = [\"GTDB\", \"VIRALDB\", \"contaminant_X\"]\n\n# Consume non-reference k-mers and retrieve statistics\nnonref_stats = qc.nonref_consume_from_vars(vars=variables_signatures, vars_order=processing_order)\n\nprint(nonref_stats)\n# Output Example:\n# {\n#     \"GTDB non-genomic total k-mer abundance\": 1500.0,\n#     \"GTDB non-genomic coverage index\": 0.2,\n#     \"VIRALDB non-genomic total k-mer abundance\": 3500.0,\n#     \"VIRALDB non-genomic coverage index\": 0.70,\n#     \"contaminant_X non-genomic total k-mer abundance\": 0.0,\n#     \"contaminant_X non-genomic coverage index\": 0.0,\n#     \"non-var non-genomic total k-mer abundance\": 100.0,\n#     \"non-var non-genomic coverage index\": 0.1\n# }\n</code></pre> <p>Notes:</p> <pre><code>- **Variable Processing Order**:  \nThe `vars_order` list determines the sequence in which variables are processed. This order is crucial\nwhen there is potential overlap in k-mers between variables, as earlier variables in the list have \nhigher priority in consuming shared k-mers.\n\n- **Non-Reference K-mers Definition**:  \nNon-reference k-mers are defined as those present in the sample signature but absent in the reference \nsignature. This method focuses on characterizing these unique k-mers relative to provided variables.\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def nonref_consume_from_vars(self, *, vars: Dict[str, SnipeSig], vars_order: List[str], **kwargs) -&gt; Dict[str, float]:\n    r\"\"\"\n    Consume and analyze non-reference k-mers from provided variable signatures.\n\n    This method processes non-reference k-mers in the sample signature by intersecting them with a set of\n    variable-specific `SnipeSig` instances. It calculates coverage and total abundance metrics for each\n    variable in a specified order, ensuring that each non-reference k-mer is accounted for without overlap\n    between variables. The method updates internal statistics that reflect the distribution of non-reference\n    k-mers across the provided variables.\n\n    **Process Overview**:\n\n    1. **Validation**:\n    - Verifies that all variable names specified in `vars_order` are present in the `vars` dictionary.\n    - Raises a `ValueError` if any variable in `vars_order` is missing from `vars`.\n\n    2. **Non-Reference K-mer Extraction**:\n    - Computes the set of non-reference non-singleton k-mers by subtracting the reference signature from the sample signature.\n    - If no non-reference k-mers are found, the method logs a warning and returns an empty dictionary.\n\n    3. **Variable-wise Consumption**:\n    - Iterates over each variable name in `vars_order`.\n    - For each variable:\n        - Intersects the remaining non-reference k-mers with the variable-specific signature.\n        - Calculates the total abundance and coverage index for the intersected k-mers.\n        - Updates the `vars_nonref_stats` dictionary with the computed metrics.\n        - Removes the consumed k-mers from the remaining non-reference set to prevent overlap.\n\n    4. **Final State Logging**:\n    - Logs the final size and total abundance of the remaining non-reference k-mers after consumption.\n\n    **Parameters**:\n\n        - `vars` (`Dict[str, SnipeSig]`):  \n        A dictionary mapping variable names to their corresponding `SnipeSig` instances. Each `SnipeSig` \n        represents a set of k-mers associated with a specific non-reference category or variable.\n\n        - `vars_order` (`List[str]`):  \n        A list specifying the order in which variables should be processed. The order determines the priority \n        of consumption, ensuring that earlier variables in the list have their k-mers accounted for before \n        later ones.\n\n        - `**kwargs`:  \n        Additional keyword arguments. Reserved for future extensions and should not be used in the current context.\n\n    **Returns**:\n\n        - `Dict[str, float]`:  \n        A dictionary containing statistics for each variable name in `vars_order`, \n            - `\"non-genomic total k-mer abundance\"` (`float`):  \n                The sum of abundances of non-reference k-mers associated with the variable.\n            - `\"non-genomic coverage index\"` (`float`):  \n                The ratio of unique non-reference k-mers associated with the variable to the total number \n                of non-reference k-mers in the sample before consumption.\n\n        Example Output:\n        ```python\n        {\n            \"variable_A non-genomic total k-mer abundance\": 1500.0,\n            \"variable_A non-genomic coverage index\": 0.20\n            \"variable_B non-genomic total k-mer abundance\": 3500.0,\n            \"variable_B non-genomic coverage index\": 0.70\n            \"non-var non-genomic total k-mer abundance\": 0.10,\n            \"non-var non-genomic coverage index\": 218\n        }\n        ```\n\n    **Raises**:\n\n        - `ValueError`:  \n        - If any variable specified in `vars_order` is not present in the `vars` dictionary.\n        - This ensures that all variables intended for consumption are available for processing.\n\n    **Usage Example**:\n\n    ```python\n    # Assume `variables_signatures` is a dictionary of variable-specific SnipeSig instances\n    variables_signatures = {\n        \"GTDB\": sig_GTDB,\n        \"VIRALDB\": sig_VIRALDB,\n        \"contaminant_X\": sig_contaminant_x\n    }\n\n    # Define the order in which variables should be processed\n    processing_order = [\"GTDB\", \"VIRALDB\", \"contaminant_X\"]\n\n    # Consume non-reference k-mers and retrieve statistics\n    nonref_stats = qc.nonref_consume_from_vars(vars=variables_signatures, vars_order=processing_order)\n\n    print(nonref_stats)\n    # Output Example:\n    # {\n    #     \"GTDB non-genomic total k-mer abundance\": 1500.0,\n    #     \"GTDB non-genomic coverage index\": 0.2,\n    #     \"VIRALDB non-genomic total k-mer abundance\": 3500.0,\n    #     \"VIRALDB non-genomic coverage index\": 0.70,\n    #     \"contaminant_X non-genomic total k-mer abundance\": 0.0,\n    #     \"contaminant_X non-genomic coverage index\": 0.0,\n    #     \"non-var non-genomic total k-mer abundance\": 100.0,\n    #     \"non-var non-genomic coverage index\": 0.1\n    # }\n    ```\n\n    **Notes**:\n\n        - **Variable Processing Order**:  \n        The `vars_order` list determines the sequence in which variables are processed. This order is crucial\n        when there is potential overlap in k-mers between variables, as earlier variables in the list have \n        higher priority in consuming shared k-mers.\n\n        - **Non-Reference K-mers Definition**:  \n        Non-reference k-mers are defined as those present in the sample signature but absent in the reference \n        signature. This method focuses on characterizing these unique k-mers relative to provided variables.\n    \"\"\"\n\n    # check the all vars in vars_order are in vars\n    if not all([var in vars for var in vars_order]):\n        # report dict keys, and the vars order\n        self.logger.debug(\"Provided vars_order: %s, and vars keys: %s\", vars_order, list(vars.keys()))\n        self.logger.error(\"All variables in vars_order must be present in vars.\")\n        raise ValueError(\"All variables in vars_order must be present in vars.\")\n\n    self.logger.debug(\"Consuming non-reference k-mers from provided variables.\")\n    self.logger.debug(\"\\t-Current size of the sample signature: %d hashes.\", len(self.sample_sig))\n\n    sample_nonref = self.sample_sig - self.reference_sig\n\n    sample_nonref.trim_singletons()\n\n    sample_nonref_unique_hashes = len(sample_nonref)\n\n    self.logger.debug(\"\\t-Size of non-reference k-mers in the sample signature: %d hashes.\", len(sample_nonref))\n    if len(sample_nonref) == 0:\n        self.logger.warning(\"No non-reference k-mers found in the sample signature.\")\n        return {}\n\n    # intersect and report coverage and depth, then subtract from sample_nonref so sum will be 100%\n    for var_name in vars_order:\n        sample_nonref_var: SnipeSig = sample_nonref &amp; vars[var_name]\n        sample_nonref_var_total_abundance = sample_nonref_var.total_abundance\n        sample_nonref_var_unique_hashes = len(sample_nonref_var)\n        sample_nonref_var_coverage_index = sample_nonref_var_unique_hashes / sample_nonref_unique_hashes\n        self.vars_nonref_stats.update({\n            f\"{var_name} non-genomic total k-mer abundance\": sample_nonref_var_total_abundance,\n            f\"{var_name} non-genomic coverage index\": sample_nonref_var_coverage_index\n        })\n\n        self.logger.debug(\"\\t-Consuming non-reference k-mers from variable '%s'.\", var_name)\n        sample_nonref -= sample_nonref_var\n        self.logger.debug(\"\\t-Size of remaining non-reference k-mers in the sample signature: %d hashes.\", len(sample_nonref))\n\n    self.vars_nonref_stats[\"non-var non-genomic total k-mer abundance\"] = sample_nonref.total_abundance\n    self.vars_nonref_stats[\"non-var non-genomic coverage index\"] = len(sample_nonref) / sample_nonref_unique_hashes if sample_nonref_unique_hashes &gt; 0 else 0.0\n\n    self.logger.debug(\n        \"After consuming all vars from the non reference k-mers, the size of the sample signature is: %d hashes, \"\n        \"with total abundance of %s.\", \n        len(sample_nonref), sample_nonref.total_abundance\n    )\n\n    return self.vars_nonref_stats\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.predict_coverage","title":"<code>predict_coverage(extra_fold, n=30)</code>","text":"<p>Predict the coverage index if additional sequencing is performed.</p> <p>This method estimates the potential increase in the genome coverage index when the sequencing depth is increased by a specified fold (extra sequencing). It does so by:</p> <ol> <li>Cumulative Coverage Calculation:</li> <li>Splitting the sample signature into <code>n</code> random parts to simulate incremental sequencing data.</li> <li> <p>Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.</p> </li> <li> <p>Saturation Curve Fitting:</p> </li> <li>Modeling the relationship between cumulative coverage and cumulative sequencing depth using     a hyperbolic saturation function.</li> <li> <p>The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.</p> </li> <li> <p>Coverage Prediction:</p> </li> <li>Using the fitted model to predict the coverage index at an increased sequencing depth (current depth     multiplied by <code>1 + extra_fold</code>).</li> </ol> <p>Mathematical Explanation:</p> <ul> <li>Saturation Model: The coverage index \\( C \\) as a function of sequencing depth \\( D \\) is modeled using the function:</li> </ul> \\[ C(D) = \\frac{a \\cdot D}{b + D} \\] <p>Where: - \\( a \\) and \\( b \\) are parameters estimated from the data. - \\( D \\) is the cumulative sequencing depth (total abundance). - \\( C(D) \\) is the cumulative coverage index at depth \\( D \\).</p> <ul> <li> <p>Parameter Estimation: The parameters \\( a \\) and \\( b \\) are determined by fitting the model to the observed cumulative coverage and depth data using non-linear least squares optimization.</p> </li> <li> <p>Coverage Prediction: The predicted coverage index \\( C_{\\text{pred}} \\) at an increased sequencing depth \\( D_{\\text{pred}} \\) is calculated as:</p> </li> </ul> \\[ D_{\\text{pred}} = D_{\\text{current}} \\times (1 + \\text{extra\\_fold}) \\] \\[ C_{\\text{pred}} = \\frac{a \\cdot D_{\\text{pred}}}{b + D_{\\text{pred}}} \\] <p>Parameters:</p> <ul> <li> <p><code>extra_fold</code> (float):   The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling   the current sequencing depth.</p> </li> <li> <p><code>n</code> (int, optional):   The number of parts to split the sample signature into for modeling the saturation curve.   Default is 30.</p> </li> </ul> <p>Returns:     - <code>float</code>:       The predicted genome coverage index at the increased sequencing depth.</p> <p>Raises:     - <code>RuntimeError</code>:       If the saturation model fails to converge during curve fitting.</p> <p>Usage Example:</p> <pre><code># Create a ReferenceQC instance with sample and reference signatures\nqc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)\n\n# Predict coverage index after increasing sequencing depth by 50%\npredicted_coverage = qc.predict_coverage(extra_fold=0.5)\n\nprint(f\"Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}\")\n</code></pre> <p>Implementation Details:</p> <ul> <li> <p>Splitting the Sample Signature:</p> <ul> <li>The sample signature is split into <code>n</code> random parts using a multinomial distribution based on k-mer abundances.</li> <li>Each part represents an incremental addition of sequencing data.</li> </ul> </li> <li> <p>Cumulative Calculations:</p> <ul> <li>At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.</li> </ul> </li> <li> <p>Curve Fitting:</p> <ul> <li>The <code>scipy.optimize.curve_fit</code> function is used to fit the saturation model to the cumulative data.</li> <li>Initial parameter guesses are based on the observed data to aid convergence.</li> </ul> </li> </ul> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def predict_coverage(self, extra_fold: float, n: int = 30) -&gt; float:\n    r\"\"\"\n    Predict the coverage index if additional sequencing is performed.\n\n    This method estimates the potential increase in the genome coverage index when the sequencing depth\n    is increased by a specified fold (extra sequencing). It does so by:\n\n    1. **Cumulative Coverage Calculation**:\n    - Splitting the sample signature into `n` random parts to simulate incremental sequencing data.\n    - Calculating the cumulative coverage index and cumulative sequencing depth at each incremental step.\n\n    2. **Saturation Curve Fitting**:\n    - Modeling the relationship between cumulative coverage and cumulative sequencing depth using\n        a hyperbolic saturation function.\n    - The saturation model reflects how coverage approaches a maximum limit as sequencing depth increases.\n\n    3. **Coverage Prediction**:\n    - Using the fitted model to predict the coverage index at an increased sequencing depth (current depth\n        multiplied by `1 + extra_fold`).\n\n    **Mathematical Explanation**:\n\n    - **Saturation Model**:\n    The coverage index \\( C \\) as a function of sequencing depth \\( D \\) is modeled using the function:\n\n    $$\n    C(D) = \\frac{a \\cdot D}{b + D}\n    $$\n\n    Where:\n    - \\( a \\) and \\( b \\) are parameters estimated from the data.\n    - \\( D \\) is the cumulative sequencing depth (total abundance).\n    - \\( C(D) \\) is the cumulative coverage index at depth \\( D \\).\n\n    - **Parameter Estimation**:\n    The parameters \\( a \\) and \\( b \\) are determined by fitting the model to the observed cumulative\n    coverage and depth data using non-linear least squares optimization.\n\n    - **Coverage Prediction**:\n    The predicted coverage index \\( C_{\\text{pred}} \\) at an increased sequencing depth \\( D_{\\text{pred}} \\)\n    is calculated as:\n\n    $$\n    D_{\\text{pred}} = D_{\\text{current}} \\times (1 + \\text{extra\\_fold})\n    $$\n\n    $$\n    C_{\\text{pred}} = \\frac{a \\cdot D_{\\text{pred}}}{b + D_{\\text{pred}}}\n    $$\n\n    **Parameters**:\n\n    - `extra_fold` (*float*):  \n      The fold increase in sequencing depth to simulate. For example, extra_fold = 1.0 represents doubling\n      the current sequencing depth.\n\n    - `n` (*int, optional*):  \n      The number of parts to split the sample signature into for modeling the saturation curve.\n      Default is 30.\n\n    **Returns**:\n        - `float`:  \n          The predicted genome coverage index at the increased sequencing depth.\n\n    **Raises**:\n        - `RuntimeError`:  \n          If the saturation model fails to converge during curve fitting.\n\n    **Usage Example**:\n\n    ```python\n    # Create a ReferenceQC instance with sample and reference signatures\n    qc = ReferenceQC(sample_sig=sample_sig, reference_sig=reference_sig)\n\n    # Predict coverage index after increasing sequencing depth by 50%\n    predicted_coverage = qc.predict_coverage(extra_fold=0.5)\n\n    print(f\"Predicted coverage index at 1.5x sequencing depth: {predicted_coverage:.4f}\")\n    ```\n\n    **Implementation Details**:\n\n    - **Splitting the Sample Signature**:\n        - The sample signature is split into `n` random parts using a multinomial distribution based on k-mer abundances.\n        - Each part represents an incremental addition of sequencing data.\n\n    - **Cumulative Calculations**:\n        - At each incremental step, the cumulative signature is updated, and the cumulative coverage index and sequencing depth are calculated.\n\n    - **Curve Fitting**:\n        - The `scipy.optimize.curve_fit` function is used to fit the saturation model to the cumulative data.\n        - Initial parameter guesses are based on the observed data to aid convergence.\n    \"\"\"\n    if extra_fold &lt; 1:\n        raise ValueError(\"extra_fold must be &gt;= 1.0.\")\n\n    if n &lt; 1 or not isinstance(n, int):\n        raise ValueError(\"n must be a positive integer.\")\n\n    self.logger.debug(\"Predicting coverage with extra fold: %f\", extra_fold)\n    coverage_depth_data = self.calculate_coverage_vs_depth(n=n)\n\n    # Extract cumulative total abundance and coverage index\n    x_data = np.array([d[\"cumulative_total_abundance\"] for d in coverage_depth_data])\n    y_data = np.array([d[\"cumulative_coverage_index\"] for d in coverage_depth_data])\n\n    # Saturation model function\n    def saturation_model(x, a, b):\n        return a * x / (b + x)\n\n    # Initial parameter guesses\n    initial_guess = [y_data[-1], x_data[int(len(x_data) / 2)]]\n\n    # Fit the model to the data\n    try:\n        with warnings.catch_warnings():\n            warnings.simplefilter(\"error\", OptimizeWarning)\n            params, covariance = curve_fit(\n                saturation_model,\n                x_data,\n                y_data,\n                p0=initial_guess,\n                bounds=(0, np.inf),\n                maxfev=10000\n            )\n    except (RuntimeError, OptimizeWarning) as exc:\n        self.logger.error(\"Curve fitting failed.\")\n        raise RuntimeError(\"Saturation model fitting failed. Cannot predict coverage.\") from exc\n\n    # Check if covariance contains inf or nan\n    if np.isinf(covariance).any() or np.isnan(covariance).any():\n        self.logger.error(\"Covariance of parameters could not be estimated.\")\n        raise RuntimeError(\"Saturation model fitting failed. Cannot predict coverage.\")\n\n    a, b = params\n\n    # Predict coverage at increased sequencing depth\n    total_abundance = x_data[-1]\n    predicted_total_abundance = total_abundance * (1 + extra_fold)\n    predicted_coverage = saturation_model(predicted_total_abundance, a, b)\n\n    # Ensure the predicted coverage does not exceed maximum possible coverage\n    max_coverage = 1.0  # Coverage index cannot exceed 1\n    predicted_coverage = min(predicted_coverage, max_coverage)\n\n    self.logger.debug(\"Predicted coverage at %.2f-fold increase: %f\", extra_fold, predicted_coverage)\n    return predicted_coverage\n</code></pre>"},{"location":"ReferenceQC/#snipe.api.reference_QC.ReferenceQC.split_sig_randomly","title":"<code>split_sig_randomly(n)</code>","text":"<p>Split the sample signature into <code>n</code> random parts based on abundances.</p> <p>This method distributes the k-mers of the sample signature into <code>n</code> parts using a multinomial distribution based on their abundances. Each k-mer's abundance is split across the <code>n</code> parts proportionally.</p> <p>Mathematical Explanation:</p> <p>For each k-mer with hash \\( h \\) and abundance \\( a_h \\), its abundance is distributed into \\( n \\) parts according to a multinomial distribution. Specifically, the abundance in each part \\( i \\) is given by:</p> \\[ a_{h,i} \\sim \\text{Multinomial}(a_h, \\frac{1}{n}, \\frac{1}{n}, \\dots, \\frac{1}{n}) \\] <p>Where: - \\( a_{h,i} \\) is the abundance of k-mer \\( h \\) in part \\( i \\). - Each \\( a_{h,i} \\) is a non-negative integer such that \\( \\sum_{i=1}^{n} a_{h,i} = a_h \\).</p> <p>Parameters:</p> <ul> <li><code>n</code> (<code>int</code>): Number of parts to split into.</li> </ul> <p>Returns:</p> <ul> <li><code>List[SnipeSig]</code>:   List of <code>SnipeSig</code> instances representing the split parts.</li> </ul> <p>Usage Example:</p> <pre><code>split_sigs = qc.split_sig_randomly(n=3)\nfor idx, sig in enumerate(split_sigs, 1):\n    print(f\"Signature part {idx}: {sig}\")\n</code></pre> Source code in <code>src/snipe/api/reference_QC.py</code> <pre><code>def split_sig_randomly(self, n: int) -&gt; List[SnipeSig]:\n    r\"\"\"\n    Split the sample signature into `n` random parts based on abundances.\n\n    This method distributes the k-mers of the sample signature into `n` parts using a multinomial distribution\n    based on their abundances. Each k-mer's abundance is split across the `n` parts proportionally.\n\n    **Mathematical Explanation**:\n\n    For each k-mer with hash \\( h \\) and abundance \\( a_h \\), its abundance is distributed into \\( n \\) parts\n    according to a multinomial distribution. Specifically, the abundance in each part \\( i \\) is given by:\n\n    $$\n    a_{h,i} \\sim \\text{Multinomial}(a_h, \\frac{1}{n}, \\frac{1}{n}, \\dots, \\frac{1}{n})\n    $$\n\n    Where:\n    - \\( a_{h,i} \\) is the abundance of k-mer \\( h \\) in part \\( i \\).\n    - Each \\( a_{h,i} \\) is a non-negative integer such that \\( \\sum_{i=1}^{n} a_{h,i} = a_h \\).\n\n    **Parameters**:\n\n    - `n` (`int`): Number of parts to split into.\n\n    **Returns**:\n\n    - `List[SnipeSig]`:  \n      List of `SnipeSig` instances representing the split parts.\n\n    **Usage Example**:\n\n    ```python\n    split_sigs = qc.split_sig_randomly(n=3)\n    for idx, sig in enumerate(split_sigs, 1):\n        print(f\"Signature part {idx}: {sig}\")\n    ```\n    \"\"\"\n    self.logger.debug(\"Attempting to split sample signature into %d random parts.\", n)\n\n    # Check if the split for this n is already cached\n    if n in self._split_cache:\n        self.logger.debug(\"Using cached split signatures for n=%d.\", n)\n        # Return deep copies to prevent external modifications\n        return [sig.copy() for sig in self._split_cache[n]]\n\n    self.logger.debug(\"No cached splits found for n=%d. Proceeding to split.\", n)\n    # Get k-mers and abundances\n    hash_to_abund = dict(zip(self.sample_sig.hashes, self.sample_sig.abundances))\n    random_split_sigs = self.distribute_kmers_random(hash_to_abund, n)\n    split_sigs = [\n        SnipeSig.create_from_hashes_abundances(\n            hashes=np.array(list(kmer_dict.keys()), dtype=np.uint64),\n            abundances=np.array(list(kmer_dict.values()), dtype=np.uint32),\n            ksize=self.sample_sig.ksize,\n            scale=self.sample_sig.scale,\n            name=f\"{self.sample_sig.name}_part_{i+1}\",\n            filename=self.sample_sig.filename,\n            enable_logging=self.enable_logging\n        )\n        for i, kmer_dict in enumerate(random_split_sigs)\n    ]\n\n    # Cache the split signatures\n    self._split_cache[n] = split_sigs\n    self.logger.debug(\"Cached split signatures for n=%d.\", n)\n\n    return split_sigs\n</code></pre>"},{"location":"Sketch/","title":"Python API Documentation","text":""},{"location":"Sketch/#snipe.api.sketch.SnipeSketch","title":"<code>SnipeSketch</code>","text":"<p>SnipeSketch is responsible for creating FracMinHash sketches from genomic data. It supports parallel processing, progress monitoring, and different sketching modes including sample, genome, and amplicon sketching.</p> Source code in <code>src/snipe/api/sketch.py</code> <pre><code>class SnipeSketch:\n    \"\"\"\n    SnipeSketch is responsible for creating FracMinHash sketches from genomic data.\n    It supports parallel processing, progress monitoring, and different sketching modes\n    including sample, genome, and amplicon sketching.\n    \"\"\"\n\n    def __init__(self, enable_logging: bool) -&gt; None:\n        \"\"\"\n        Initialize the SnipeSketch instance.\n\n        Args:\n            enable_logging (bool): Flag to enable or disable logging.\n        \"\"\"\n        self.logger = logging.getLogger(self.__class__.__name__)\n        self._configure_logging(enable_logging)\n\n    def _configure_logging(self, enable_logging: bool) -&gt; None:\n        \"\"\"\n        Configure the logging for the class.\n\n        Args:\n            enable_logging (bool): Flag to enable or disable logging.\n        \"\"\"\n        if enable_logging:\n            self.logger.setLevel(logging.DEBUG)\n            if not self.logger.hasHandlers():\n                handler = logging.StreamHandler()\n                handler.setLevel(logging.DEBUG)\n                formatter = logging.Formatter(\n                    \"%(asctime)s - %(name)s - %(levelname)s - %(message)s\"\n                )\n                handler.setFormatter(formatter)\n                self.logger.addHandler(handler)\n            self.logger.debug(\"Logging is enabled for SnipeSketch.\")\n        else:\n            self.logger.setLevel(logging.CRITICAL)\n\n    # *******************************\n    # *        Sketching            *\n    # *******************************\n\n    def process_sequences(\n        self,\n        fasta_file: str,\n        thread_id: int,\n        total_threads: int,\n        progress_queue: multiprocessing.Queue,\n        batch_size: int = 100_000,\n        ksize: int = 51,\n        scaled: int = 10_000,\n    ) -&gt; sourmash.MinHash:\n        \"\"\"\n        Process a subset of sequences to create a FracMinHash sketch.\n\n        Each process creates its own MinHash instance and processes sequences\n        assigned based on the thread ID. Progress is reported via a shared queue.\n\n        Args:\n            fasta_file (str): Path to the FASTA file.\n            thread_id (int): Identifier for the current thread.\n            total_threads (int): Total number of threads.\n            progress_queue (multiprocessing.Queue): Queue for reporting progress.\n            batch_size (int, optional): Number of sequences per progress update. Defaults to 100_000.\n            ksize (int, optional): K-mer size. Defaults to 51.\n            scaled (int, optional): Scaling factor for MinHash. Defaults to 10_000.\n\n        Returns:\n            sourmash.MinHash: The resulting FracMinHash sketch.\n        \"\"\"\n        self._register_signal_handler()\n        try:\n            fa_reader = SequenceReader(fasta_file)\n            mh = sourmash.MinHash(\n                n=0, ksize=ksize, scaled=scaled, track_abundance=True\n            )\n            local_count = 0\n\n            for idx, (_, seq) in enumerate(fa_reader):\n                if idx % total_threads == thread_id:\n                    mh.add_sequence(seq, force=True)\n                    local_count += 1\n\n                    if local_count &gt;= batch_size:\n                        progress_queue.put(batch_size)\n                        local_count = 0\n\n            if local_count &gt; 0:\n                progress_queue.put(local_count)\n\n            self.logger.debug(\n                \"Thread %d processed %d hashes.\", thread_id, len(mh)\n            )\n            return mh\n\n        except KeyboardInterrupt:\n            self.logger.warning(\"KeyboardInterrupt detected in process_sequences.\")\n            sys.exit(0)\n        except Exception as e:\n            self.logger.error(\"Error in process_sequences: %s\", e)\n            raise\n\n    def _register_signal_handler(self) -&gt; None:\n        \"\"\"\n        Register the signal handler for graceful shutdown.\n        \"\"\"\n        signal.signal(signal.SIGINT, self._worker_signal_handler)\n\n    def progress_monitor(\n        self,\n        progress_queue: multiprocessing.Queue,\n        progress_interval: int,\n        total_threads: int,\n        stop_event: threading.Event,\n    ) -&gt; None:\n        \"\"\"\n        Monitor and display the progress of sequence processing.\n\n        Args:\n            progress_queue (multiprocessing.Queue): Queue for receiving progress updates.\n            progress_interval (int): Interval for progress updates.\n            total_threads (int): Number of processing threads.\n            stop_event (threading.Event): Event to signal the monitor to stop.\n        \"\"\"\n        total = 0\n        next_update = progress_interval\n        try:\n            while not stop_event.is_set() or not progress_queue.empty():\n                try:\n                    count = progress_queue.get(timeout=0.5)\n                    total += count\n                    if total &gt;= next_update:\n                        print(f\"\\rProcessed {next_update:,} sequences.\", end=\"\", flush=True)\n                        next_update += progress_interval\n                except queue.Empty:\n                    continue\n        except Exception as e:\n            self.logger.error(\"Error in progress_monitor: %s\", e)\n        finally:\n            print(f\"\\rProcessed {total:,} sequences in total.\")\n\n    def _worker_signal_handler(self, signum: int, frame: Any) -&gt; None:\n        \"\"\"\n        Handle signals in worker processes to exit gracefully.\n\n        Args:\n            signum (int): Signal number.\n            frame (Any): Current stack frame.\n        \"\"\"\n        self.logger.info(\"Received signal %d. Exiting worker.\", signum)\n        sys.exit(0)\n\n    def _sketch_sample(\n        self,\n        sample_name: str,\n        fasta_file: str,\n        num_processes: int = 4,\n        progress_interval: int = 1_000_000,\n        batch_size: int = 100_000,\n        k_size: int = 51,\n        scale: int = 10_000,\n        **kwargs: Any,\n    ) -&gt; sourmash.SourmashSignature:\n        \"\"\"\n        Create a FracMinHash sketch for a sample using parallel processing.\n\n        Args:\n            sample_name (str): Name of the sample.\n            fasta_file (str): Path to the FASTA file.\n            num_processes (int, optional): Number of parallel processes. Defaults to 4.\n            progress_interval (int, optional): Interval for progress updates. Defaults to 1_000_000.\n            batch_size (int, optional): Number of sequences per progress update. Defaults to 100_000.\n            k_size (int, optional): K-mer size. Defaults to 51.\n            scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.\n            **kwargs (Any): Additional keyword arguments.\n\n        Returns:\n            sourmash.SourmashSignature: The resulting Sourmash signature.\n        \"\"\"\n        self.logger.info(\"Starting sketching with %d processes...\", num_processes)\n\n        manager = multiprocessing.Manager()\n        progress_queue = manager.Queue()\n        stop_event = threading.Event()\n\n        monitor_thread = threading.Thread(\n            target=self.progress_monitor,\n            args=(progress_queue, progress_interval, num_processes, stop_event),\n            daemon=True,\n        )\n        monitor_thread.start()\n\n        pool = Pool(nodes=num_processes)\n        results: List[Any] = []\n\n        try:\n            for thread_id in range(num_processes):\n                result = pool.apipe(\n                    self.process_sequences,\n                    fasta_file,\n                    thread_id,\n                    num_processes,\n                    progress_queue,\n                    batch_size,\n                    k_size,\n                    scale,\n                )\n                results.append(result)\n\n            pool.close()\n            pool.join()\n\n        except KeyboardInterrupt:\n            self.logger.warning(\"Interrupt received. Terminating processes...\")\n            pool.terminate()\n            pool.join()\n            stop_event.set()\n            monitor_thread.join()\n            sys.exit(1)\n\n        except Exception as e:\n            self.logger.error(\"Error during sketching: %s\", e)\n            pool.terminate()\n            pool.join()\n            stop_event.set()\n            monitor_thread.join()\n            raise\n\n        finally:\n            stop_event.set()\n            monitor_thread.join()\n\n        minhashes = []\n        for idx, result in enumerate(results):\n            try:\n                mh = result.get()\n                if mh:\n                    minhashes.append(mh)\n                    self.logger.debug(\"MinHash from thread %d collected.\", idx)\n            except Exception as e:\n                self.logger.error(\"Error retrieving MinHash from thread %d: %s\", idx, e)\n\n        if not minhashes:\n            raise ValueError(\"No MinHashes were generated.\")\n\n        # Merge all MinHashes into one\n        mh_full = minhashes[0]\n        for mh in minhashes[1:]:\n            mh_full.merge(mh)\n\n        signature = sourmash.SourmashSignature(mh_full, name=sample_name)\n        self.logger.info(\"Sketching completed for sample: %s\", sample_name)\n\n        return signature\n\n    def sample_sketch(\n        self,\n        sample_name: str,\n        filename: str,\n        num_processes: int,\n        batch_size: int,\n        ksize: int,\n        scale: int,\n        **kwargs: Any,\n    ) -&gt; sourmash.SourmashSignature:\n        \"\"\"\n        Generate a sketch for a sample and return its signature.\n\n        Args:\n            sample_name (str): Name of the sample.\n            filename (str): Path to the input FASTA file.\n            num_processes (int): Number of processes to use.\n            batch_size (int): Batch size for processing.\n            ksize (int): K-mer size.\n            scale (int): Scaling factor.\n            **kwargs (Any): Additional keyword arguments.\n\n        Returns:\n            sourmash.SourmashSignature: The generated signature.\n\n        Raises:\n            RuntimeError: If an error occurs during sketching.\n        \"\"\"\n        self.logger.info(\"Starting sample sketch for: %s\", sample_name)\n        try:\n            signature = self._sketch_sample(\n                sample_name=sample_name,\n                fasta_file=filename,\n                num_processes=num_processes,\n                batch_size=batch_size,\n                k_size=ksize,\n                scale=scale,\n                **kwargs,\n            )\n            self.logger.info(\"Sample sketch completed for: %s\", sample_name)\n            return signature\n        except Exception as e:\n            self.logger.error(\n                \"Error occurred during sample sketching: %s\", str(e)\n            )\n            raise RuntimeError(\"Error occurred during sample sketching.\") from e\n\n    # *******************************\n    # *      Genome Sketching       *\n    # *******************************\n\n    def parse_fasta_header(self, header: str) -&gt; Tuple[str, str]:\n        \"\"\"\n        Parse a FASTA header and categorize the sequence type.\n\n        Args:\n            header (str): The FASTA header string.\n\n        Returns:\n            Tuple[str, str]: A tuple containing the sequence type and name.\n        \"\"\"\n        full_header = header.strip()\n        header_lower = full_header.lower()\n\n        if header_lower.startswith(\"&gt;\"):\n            header_lower = header_lower[1:]\n            full_header = full_header[1:]\n\n        seq_type = \"unknown\"\n        name = \"unknown\"\n\n        patterns = {\n            \"scaffold\": re.compile(r\"\\b(scaffold|unplaced|unlocalized)\\b\"),\n            \"contig\": re.compile(r\"\\bcontig\\b\"),\n            \"mitochondrial DNA\": re.compile(r\"\\b(mt|mitochondrion|mitochondrial|mitochondria|mito|mtdna)\\b\"),\n            \"chloroplast DNA\": re.compile(r\"\\b(chloroplast|cpdna|plastid)\\b\"),\n            \"plasmid\": re.compile(r\"\\bplasmid\\b\"),\n            \"chromosome\": re.compile(r\"\\bchromosome\\b|\\bchr\\b\"),\n            \"reference chromosome\": re.compile(r\"NC_\\d{6}\\.\\d+\"),\n        }\n\n        for stype, pattern in patterns.items():\n            if pattern.search(header_lower):\n                if stype in {\"scaffold\", \"contig\", \"plasmid\"}:\n                    match = re.match(r\"(\\S+)\", full_header)\n                    name = match.group(1) if match else \"unknown\"\n                elif stype in {\"mitochondrial DNA\", \"chloroplast DNA\"}:\n                    name = stype.split()[0]\n                elif stype == \"chromosome\":\n                    match = re.search(r\"(?:chromosome|chr)[_\\s]*([^\\s,]+)\", header_lower)\n                    if match:\n                        name = match.group(1).rstrip(\".,\")\n                        if name.upper() in {\"X\", \"Y\", \"W\", \"Z\"}:\n                            stype = \"sex\"\n                        else:\n                            stype = \"autosome\"\n                elif stype == \"reference chromosome\":\n                    match = pattern.search(full_header)\n                    if match and not (patterns[\"scaffold\"].search(header_lower) or patterns[\"contig\"].search(header_lower)):\n                        name = match.group()\n                return stype, name\n\n        return seq_type, name\n\n    def parallel_genome_sketching(\n        self,\n        fasta_file: str,\n        cores: int = 1,\n        ksize: int = 51,\n        scale: int = 10_000,\n        assigned_genome_name: str = \"full_genome\",\n        **kwargs: Any,\n    ) -&gt; Tuple[sourmash.SourmashSignature, Dict[str, sourmash.SourmashSignature]]:\n        \"\"\"\n        Perform parallel genome sketching from a FASTA file.\n\n        Args:\n            fasta_file (str): Path to the FASTA file.\n            cores (int, optional): Number of parallel cores. Defaults to 1.\n            ksize (int, optional): K-mer size. Defaults to 51.\n            scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.\n            assigned_genome_name (str, optional): Name for the genome signature. Defaults to \"full_genome\".\n            **kwargs (Any): Additional keyword arguments.\n\n        Returns:\n            Tuple[sourmash.SourmashSignature, Dict[str, sourmash.SourmashSignature]]:\n                The full genome signature and a dictionary of chromosome signatures.\n        \"\"\"\n        self.logger.info(\"Starting parallel genome sketching with %d cores.\", cores)\n        fa_reader = SequenceReader(fasta_file, comment=True)\n        mh_full = sourmash.MinHash(n=0, ksize=ksize, scaled=scale)\n        chr_to_mh: Dict[str, sourmash.MinHash] = {}\n\n        mh_lock = threading.Lock()\n        chr_lock = threading.Lock()\n\n        def process_sequence(\n            name: str, seq: str, comment: Optional[str]\n        ) -&gt; None:\n            header = f\"{name} {comment}\" if comment else name\n            seq_type, seq_name = self.parse_fasta_header(header)\n            current_mh = sourmash.MinHash(n=0, ksize=ksize, scaled=scale, track_abundance=True)\n            current_mh.add_sequence(seq, force=True)\n\n            with mh_lock:\n                mh_full.merge(current_mh)\n\n            if seq_type in {\"sex\", \"autosome\"}:\n                with chr_lock:\n                    key = f\"{seq_type}-{seq_name}\"\n                    if key not in chr_to_mh:\n                        chr_to_mh[key] = current_mh\n                    else:\n                        chr_to_mh[key].merge(current_mh)\n\n        try:\n            with concurrent.futures.ThreadPoolExecutor(max_workers=cores) as executor:\n                futures = [\n                    executor.submit(\n                        process_sequence,\n                        name,\n                        seq,\n                        comment\n                    )\n                    for name, seq, comment in fa_reader\n                ]\n\n                for future in concurrent.futures.as_completed(futures):\n                    try:\n                        future.result()\n                    except Exception as e:\n                        self.logger.error(\"Error processing sequence: %s\", e)\n\n        except Exception as e:\n            self.logger.error(\"Error during parallel genome sketching: %s\", e)\n            raise\n\n        mh_full_signature = sourmash.SourmashSignature(mh_full, name=assigned_genome_name)\n        chr_signatures = {\n            name: sourmash.SourmashSignature(mh, name=name)\n            for name, mh in chr_to_mh.items()\n        }\n\n        self.logger.info(\"Parallel genome sketching completed.\")\n        return mh_full_signature, chr_signatures\n\n    def amplicon_sketching(\n        self,\n        fasta_file: str,\n        ksize: int = 51,\n        scale: int = 10_000,\n        amplicon_name: str = \"amplicon\",\n    ) -&gt; sourmash.SourmashSignature:\n        \"\"\"\n        Create a FracMinHash sketch for an amplicon.\n\n        Args:\n            fasta_file (str): Path to the FASTA file.\n            ksize (int, optional): K-mer size. Defaults to 51.\n            scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.\n            amplicon_name (str, optional): Name of the amplicon. Defaults to \"amplicon\".\n\n        Returns:\n            sourmash.SourmashSignature: The resulting amplicon signature.\n        \"\"\"\n        self.logger.info(\"Starting amplicon sketching for: %s\", amplicon_name)\n        try:\n            fa_reader = SequenceReader(fasta_file)\n            mh_full = sourmash.MinHash(n=0, ksize=ksize, scaled=scale)\n            for _, seq in fa_reader:\n                mh_full.add_sequence(seq, force=True)\n\n            amplicon_sig = sourmash.SourmashSignature(mh_full, name=amplicon_name)\n            self.logger.info(\"Amplicon sketching completed for: %s\", amplicon_name)\n            return amplicon_sig\n\n        except Exception as e:\n            self.logger.error(\"Error during amplicon sketching: %s\", e)\n            raise\n\n    # *******************************\n    # *        Exporting            *\n    # *******************************\n\n    @staticmethod\n    def export_sigs_to_zip(\n        sigs: List[sourmash.SourmashSignature], output_file: str\n    ) -&gt; None:\n        \"\"\"\n        Export a list of signatures to a ZIP file.\n\n        Args:\n            sigs (List[sourmash.SourmashSignature]): List of Sourmash signatures.\n            output_file (str): Path to the output ZIP file.\n\n        Raises:\n            ValueError: If the output file does not have a .zip extension.\n            FileExistsError: If the output file already exists.\n        \"\"\"\n        if not output_file.lower().endswith(\".zip\"):\n            raise ValueError(\"Output file must have a .zip extension.\")\n\n        if os.path.exists(output_file): \n            raise FileExistsError(\"Output file already exists.\")\n\n        try:\n            with sourmash.save_load.SaveSignatures_ZipFile(output_file) as save_sigs:\n                for signature in sigs:\n                    save_sigs.add(signature)\n        except Exception as e:\n            logging.error(\"Failed to export signatures to zip: %s\", e)\n            raise\n</code></pre>"},{"location":"Sketch/#snipe.api.sketch.SnipeSketch.__init__","title":"<code>__init__(enable_logging)</code>","text":"<p>Initialize the SnipeSketch instance.</p> <p>Parameters:</p> Name Type Description Default <code>enable_logging</code> <code>bool</code> <p>Flag to enable or disable logging.</p> required Source code in <code>src/snipe/api/sketch.py</code> <pre><code>def __init__(self, enable_logging: bool) -&gt; None:\n    \"\"\"\n    Initialize the SnipeSketch instance.\n\n    Args:\n        enable_logging (bool): Flag to enable or disable logging.\n    \"\"\"\n    self.logger = logging.getLogger(self.__class__.__name__)\n    self._configure_logging(enable_logging)\n</code></pre>"},{"location":"Sketch/#snipe.api.sketch.SnipeSketch.amplicon_sketching","title":"<code>amplicon_sketching(fasta_file, ksize=51, scale=10000, amplicon_name='amplicon')</code>","text":"<p>Create a FracMinHash sketch for an amplicon.</p> <p>Parameters:</p> Name Type Description Default <code>fasta_file</code> <code>str</code> <p>Path to the FASTA file.</p> required <code>ksize</code> <code>int</code> <p>K-mer size. Defaults to 51.</p> <code>51</code> <code>scale</code> <code>int</code> <p>Scaling factor for MinHash. Defaults to 10_000.</p> <code>10000</code> <code>amplicon_name</code> <code>str</code> <p>Name of the amplicon. Defaults to \"amplicon\".</p> <code>'amplicon'</code> <p>Returns:</p> Type Description <code>SourmashSignature</code> <p>sourmash.SourmashSignature: The resulting amplicon signature.</p> Source code in <code>src/snipe/api/sketch.py</code> <pre><code>def amplicon_sketching(\n    self,\n    fasta_file: str,\n    ksize: int = 51,\n    scale: int = 10_000,\n    amplicon_name: str = \"amplicon\",\n) -&gt; sourmash.SourmashSignature:\n    \"\"\"\n    Create a FracMinHash sketch for an amplicon.\n\n    Args:\n        fasta_file (str): Path to the FASTA file.\n        ksize (int, optional): K-mer size. Defaults to 51.\n        scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.\n        amplicon_name (str, optional): Name of the amplicon. Defaults to \"amplicon\".\n\n    Returns:\n        sourmash.SourmashSignature: The resulting amplicon signature.\n    \"\"\"\n    self.logger.info(\"Starting amplicon sketching for: %s\", amplicon_name)\n    try:\n        fa_reader = SequenceReader(fasta_file)\n        mh_full = sourmash.MinHash(n=0, ksize=ksize, scaled=scale)\n        for _, seq in fa_reader:\n            mh_full.add_sequence(seq, force=True)\n\n        amplicon_sig = sourmash.SourmashSignature(mh_full, name=amplicon_name)\n        self.logger.info(\"Amplicon sketching completed for: %s\", amplicon_name)\n        return amplicon_sig\n\n    except Exception as e:\n        self.logger.error(\"Error during amplicon sketching: %s\", e)\n        raise\n</code></pre>"},{"location":"Sketch/#snipe.api.sketch.SnipeSketch.export_sigs_to_zip","title":"<code>export_sigs_to_zip(sigs, output_file)</code>  <code>staticmethod</code>","text":"<p>Export a list of signatures to a ZIP file.</p> <p>Parameters:</p> Name Type Description Default <code>sigs</code> <code>List[SourmashSignature]</code> <p>List of Sourmash signatures.</p> required <code>output_file</code> <code>str</code> <p>Path to the output ZIP file.</p> required <p>Raises:</p> Type Description <code>ValueError</code> <p>If the output file does not have a .zip extension.</p> <code>FileExistsError</code> <p>If the output file already exists.</p> Source code in <code>src/snipe/api/sketch.py</code> <pre><code>@staticmethod\ndef export_sigs_to_zip(\n    sigs: List[sourmash.SourmashSignature], output_file: str\n) -&gt; None:\n    \"\"\"\n    Export a list of signatures to a ZIP file.\n\n    Args:\n        sigs (List[sourmash.SourmashSignature]): List of Sourmash signatures.\n        output_file (str): Path to the output ZIP file.\n\n    Raises:\n        ValueError: If the output file does not have a .zip extension.\n        FileExistsError: If the output file already exists.\n    \"\"\"\n    if not output_file.lower().endswith(\".zip\"):\n        raise ValueError(\"Output file must have a .zip extension.\")\n\n    if os.path.exists(output_file): \n        raise FileExistsError(\"Output file already exists.\")\n\n    try:\n        with sourmash.save_load.SaveSignatures_ZipFile(output_file) as save_sigs:\n            for signature in sigs:\n                save_sigs.add(signature)\n    except Exception as e:\n        logging.error(\"Failed to export signatures to zip: %s\", e)\n        raise\n</code></pre>"},{"location":"Sketch/#snipe.api.sketch.SnipeSketch.parallel_genome_sketching","title":"<code>parallel_genome_sketching(fasta_file, cores=1, ksize=51, scale=10000, assigned_genome_name='full_genome', **kwargs)</code>","text":"<p>Perform parallel genome sketching from a FASTA file.</p> <p>Parameters:</p> Name Type Description Default <code>fasta_file</code> <code>str</code> <p>Path to the FASTA file.</p> required <code>cores</code> <code>int</code> <p>Number of parallel cores. Defaults to 1.</p> <code>1</code> <code>ksize</code> <code>int</code> <p>K-mer size. Defaults to 51.</p> <code>51</code> <code>scale</code> <code>int</code> <p>Scaling factor for MinHash. Defaults to 10_000.</p> <code>10000</code> <code>assigned_genome_name</code> <code>str</code> <p>Name for the genome signature. Defaults to \"full_genome\".</p> <code>'full_genome'</code> <code>**kwargs</code> <code>Any</code> <p>Additional keyword arguments.</p> <code>{}</code> <p>Returns:</p> Type Description <code>Tuple[SourmashSignature, Dict[str, SourmashSignature]]</code> <p>Tuple[sourmash.SourmashSignature, Dict[str, sourmash.SourmashSignature]]: The full genome signature and a dictionary of chromosome signatures.</p> Source code in <code>src/snipe/api/sketch.py</code> <pre><code>def parallel_genome_sketching(\n    self,\n    fasta_file: str,\n    cores: int = 1,\n    ksize: int = 51,\n    scale: int = 10_000,\n    assigned_genome_name: str = \"full_genome\",\n    **kwargs: Any,\n) -&gt; Tuple[sourmash.SourmashSignature, Dict[str, sourmash.SourmashSignature]]:\n    \"\"\"\n    Perform parallel genome sketching from a FASTA file.\n\n    Args:\n        fasta_file (str): Path to the FASTA file.\n        cores (int, optional): Number of parallel cores. Defaults to 1.\n        ksize (int, optional): K-mer size. Defaults to 51.\n        scale (int, optional): Scaling factor for MinHash. Defaults to 10_000.\n        assigned_genome_name (str, optional): Name for the genome signature. Defaults to \"full_genome\".\n        **kwargs (Any): Additional keyword arguments.\n\n    Returns:\n        Tuple[sourmash.SourmashSignature, Dict[str, sourmash.SourmashSignature]]:\n            The full genome signature and a dictionary of chromosome signatures.\n    \"\"\"\n    self.logger.info(\"Starting parallel genome sketching with %d cores.\", cores)\n    fa_reader = SequenceReader(fasta_file, comment=True)\n    mh_full = sourmash.MinHash(n=0, ksize=ksize, scaled=scale)\n    chr_to_mh: Dict[str, sourmash.MinHash] = {}\n\n    mh_lock = threading.Lock()\n    chr_lock = threading.Lock()\n\n    def process_sequence(\n        name: str, seq: str, comment: Optional[str]\n    ) -&gt; None:\n        header = f\"{name} {comment}\" if comment else name\n        seq_type, seq_name = self.parse_fasta_header(header)\n        current_mh = sourmash.MinHash(n=0, ksize=ksize, scaled=scale, track_abundance=True)\n        current_mh.add_sequence(seq, force=True)\n\n        with mh_lock:\n            mh_full.merge(current_mh)\n\n        if seq_type in {\"sex\", \"autosome\"}:\n            with chr_lock:\n                key = f\"{seq_type}-{seq_name}\"\n                if key not in chr_to_mh:\n                    chr_to_mh[key] = current_mh\n                else:\n                    chr_to_mh[key].merge(current_mh)\n\n    try:\n        with concurrent.futures.ThreadPoolExecutor(max_workers=cores) as executor:\n            futures = [\n                executor.submit(\n                    process_sequence,\n                    name,\n                    seq,\n                    comment\n                )\n                for name, seq, comment in fa_reader\n            ]\n\n            for future in concurrent.futures.as_completed(futures):\n                try:\n                    future.result()\n                except Exception as e:\n                    self.logger.error(\"Error processing sequence: %s\", e)\n\n    except Exception as e:\n        self.logger.error(\"Error during parallel genome sketching: %s\", e)\n        raise\n\n    mh_full_signature = sourmash.SourmashSignature(mh_full, name=assigned_genome_name)\n    chr_signatures = {\n        name: sourmash.SourmashSignature(mh, name=name)\n        for name, mh in chr_to_mh.items()\n    }\n\n    self.logger.info(\"Parallel genome sketching completed.\")\n    return mh_full_signature, chr_signatures\n</code></pre>"},{"location":"Sketch/#snipe.api.sketch.SnipeSketch.parse_fasta_header","title":"<code>parse_fasta_header(header)</code>","text":"<p>Parse a FASTA header and categorize the sequence type.</p> <p>Parameters:</p> Name Type Description Default <code>header</code> <code>str</code> <p>The FASTA header string.</p> required <p>Returns:</p> Type Description <code>Tuple[str, str]</code> <p>Tuple[str, str]: A tuple containing the sequence type and name.</p> Source code in <code>src/snipe/api/sketch.py</code> <pre><code>def parse_fasta_header(self, header: str) -&gt; Tuple[str, str]:\n    \"\"\"\n    Parse a FASTA header and categorize the sequence type.\n\n    Args:\n        header (str): The FASTA header string.\n\n    Returns:\n        Tuple[str, str]: A tuple containing the sequence type and name.\n    \"\"\"\n    full_header = header.strip()\n    header_lower = full_header.lower()\n\n    if header_lower.startswith(\"&gt;\"):\n        header_lower = header_lower[1:]\n        full_header = full_header[1:]\n\n    seq_type = \"unknown\"\n    name = \"unknown\"\n\n    patterns = {\n        \"scaffold\": re.compile(r\"\\b(scaffold|unplaced|unlocalized)\\b\"),\n        \"contig\": re.compile(r\"\\bcontig\\b\"),\n        \"mitochondrial DNA\": re.compile(r\"\\b(mt|mitochondrion|mitochondrial|mitochondria|mito|mtdna)\\b\"),\n        \"chloroplast DNA\": re.compile(r\"\\b(chloroplast|cpdna|plastid)\\b\"),\n        \"plasmid\": re.compile(r\"\\bplasmid\\b\"),\n        \"chromosome\": re.compile(r\"\\bchromosome\\b|\\bchr\\b\"),\n        \"reference chromosome\": re.compile(r\"NC_\\d{6}\\.\\d+\"),\n    }\n\n    for stype, pattern in patterns.items():\n        if pattern.search(header_lower):\n            if stype in {\"scaffold\", \"contig\", \"plasmid\"}:\n                match = re.match(r\"(\\S+)\", full_header)\n                name = match.group(1) if match else \"unknown\"\n            elif stype in {\"mitochondrial DNA\", \"chloroplast DNA\"}:\n                name = stype.split()[0]\n            elif stype == \"chromosome\":\n                match = re.search(r\"(?:chromosome|chr)[_\\s]*([^\\s,]+)\", header_lower)\n                if match:\n                    name = match.group(1).rstrip(\".,\")\n                    if name.upper() in {\"X\", \"Y\", \"W\", \"Z\"}:\n                        stype = \"sex\"\n                    else:\n                        stype = \"autosome\"\n            elif stype == \"reference chromosome\":\n                match = pattern.search(full_header)\n                if match and not (patterns[\"scaffold\"].search(header_lower) or patterns[\"contig\"].search(header_lower)):\n                    name = match.group()\n            return stype, name\n\n    return seq_type, name\n</code></pre>"},{"location":"Sketch/#snipe.api.sketch.SnipeSketch.process_sequences","title":"<code>process_sequences(fasta_file, thread_id, total_threads, progress_queue, batch_size=100000, ksize=51, scaled=10000)</code>","text":"<p>Process a subset of sequences to create a FracMinHash sketch.</p> <p>Each process creates its own MinHash instance and processes sequences assigned based on the thread ID. Progress is reported via a shared queue.</p> <p>Parameters:</p> Name Type Description Default <code>fasta_file</code> <code>str</code> <p>Path to the FASTA file.</p> required <code>thread_id</code> <code>int</code> <p>Identifier for the current thread.</p> required <code>total_threads</code> <code>int</code> <p>Total number of threads.</p> required <code>progress_queue</code> <code>Queue</code> <p>Queue for reporting progress.</p> required <code>batch_size</code> <code>int</code> <p>Number of sequences per progress update. Defaults to 100_000.</p> <code>100000</code> <code>ksize</code> <code>int</code> <p>K-mer size. Defaults to 51.</p> <code>51</code> <code>scaled</code> <code>int</code> <p>Scaling factor for MinHash. Defaults to 10_000.</p> <code>10000</code> <p>Returns:</p> Type Description <code>MinHash</code> <p>sourmash.MinHash: The resulting FracMinHash sketch.</p> Source code in <code>src/snipe/api/sketch.py</code> <pre><code>def process_sequences(\n    self,\n    fasta_file: str,\n    thread_id: int,\n    total_threads: int,\n    progress_queue: multiprocessing.Queue,\n    batch_size: int = 100_000,\n    ksize: int = 51,\n    scaled: int = 10_000,\n) -&gt; sourmash.MinHash:\n    \"\"\"\n    Process a subset of sequences to create a FracMinHash sketch.\n\n    Each process creates its own MinHash instance and processes sequences\n    assigned based on the thread ID. Progress is reported via a shared queue.\n\n    Args:\n        fasta_file (str): Path to the FASTA file.\n        thread_id (int): Identifier for the current thread.\n        total_threads (int): Total number of threads.\n        progress_queue (multiprocessing.Queue): Queue for reporting progress.\n        batch_size (int, optional): Number of sequences per progress update. Defaults to 100_000.\n        ksize (int, optional): K-mer size. Defaults to 51.\n        scaled (int, optional): Scaling factor for MinHash. Defaults to 10_000.\n\n    Returns:\n        sourmash.MinHash: The resulting FracMinHash sketch.\n    \"\"\"\n    self._register_signal_handler()\n    try:\n        fa_reader = SequenceReader(fasta_file)\n        mh = sourmash.MinHash(\n            n=0, ksize=ksize, scaled=scaled, track_abundance=True\n        )\n        local_count = 0\n\n        for idx, (_, seq) in enumerate(fa_reader):\n            if idx % total_threads == thread_id:\n                mh.add_sequence(seq, force=True)\n                local_count += 1\n\n                if local_count &gt;= batch_size:\n                    progress_queue.put(batch_size)\n                    local_count = 0\n\n        if local_count &gt; 0:\n            progress_queue.put(local_count)\n\n        self.logger.debug(\n            \"Thread %d processed %d hashes.\", thread_id, len(mh)\n        )\n        return mh\n\n    except KeyboardInterrupt:\n        self.logger.warning(\"KeyboardInterrupt detected in process_sequences.\")\n        sys.exit(0)\n    except Exception as e:\n        self.logger.error(\"Error in process_sequences: %s\", e)\n        raise\n</code></pre>"},{"location":"Sketch/#snipe.api.sketch.SnipeSketch.progress_monitor","title":"<code>progress_monitor(progress_queue, progress_interval, total_threads, stop_event)</code>","text":"<p>Monitor and display the progress of sequence processing.</p> <p>Parameters:</p> Name Type Description Default <code>progress_queue</code> <code>Queue</code> <p>Queue for receiving progress updates.</p> required <code>progress_interval</code> <code>int</code> <p>Interval for progress updates.</p> required <code>total_threads</code> <code>int</code> <p>Number of processing threads.</p> required <code>stop_event</code> <code>Event</code> <p>Event to signal the monitor to stop.</p> required Source code in <code>src/snipe/api/sketch.py</code> <pre><code>def progress_monitor(\n    self,\n    progress_queue: multiprocessing.Queue,\n    progress_interval: int,\n    total_threads: int,\n    stop_event: threading.Event,\n) -&gt; None:\n    \"\"\"\n    Monitor and display the progress of sequence processing.\n\n    Args:\n        progress_queue (multiprocessing.Queue): Queue for receiving progress updates.\n        progress_interval (int): Interval for progress updates.\n        total_threads (int): Number of processing threads.\n        stop_event (threading.Event): Event to signal the monitor to stop.\n    \"\"\"\n    total = 0\n    next_update = progress_interval\n    try:\n        while not stop_event.is_set() or not progress_queue.empty():\n            try:\n                count = progress_queue.get(timeout=0.5)\n                total += count\n                if total &gt;= next_update:\n                    print(f\"\\rProcessed {next_update:,} sequences.\", end=\"\", flush=True)\n                    next_update += progress_interval\n            except queue.Empty:\n                continue\n    except Exception as e:\n        self.logger.error(\"Error in progress_monitor: %s\", e)\n    finally:\n        print(f\"\\rProcessed {total:,} sequences in total.\")\n</code></pre>"},{"location":"Sketch/#snipe.api.sketch.SnipeSketch.sample_sketch","title":"<code>sample_sketch(sample_name, filename, num_processes, batch_size, ksize, scale, **kwargs)</code>","text":"<p>Generate a sketch for a sample and return its signature.</p> <p>Parameters:</p> Name Type Description Default <code>sample_name</code> <code>str</code> <p>Name of the sample.</p> required <code>filename</code> <code>str</code> <p>Path to the input FASTA file.</p> required <code>num_processes</code> <code>int</code> <p>Number of processes to use.</p> required <code>batch_size</code> <code>int</code> <p>Batch size for processing.</p> required <code>ksize</code> <code>int</code> <p>K-mer size.</p> required <code>scale</code> <code>int</code> <p>Scaling factor.</p> required <code>**kwargs</code> <code>Any</code> <p>Additional keyword arguments.</p> <code>{}</code> <p>Returns:</p> Type Description <code>SourmashSignature</code> <p>sourmash.SourmashSignature: The generated signature.</p> <p>Raises:</p> Type Description <code>RuntimeError</code> <p>If an error occurs during sketching.</p> Source code in <code>src/snipe/api/sketch.py</code> <pre><code>def sample_sketch(\n    self,\n    sample_name: str,\n    filename: str,\n    num_processes: int,\n    batch_size: int,\n    ksize: int,\n    scale: int,\n    **kwargs: Any,\n) -&gt; sourmash.SourmashSignature:\n    \"\"\"\n    Generate a sketch for a sample and return its signature.\n\n    Args:\n        sample_name (str): Name of the sample.\n        filename (str): Path to the input FASTA file.\n        num_processes (int): Number of processes to use.\n        batch_size (int): Batch size for processing.\n        ksize (int): K-mer size.\n        scale (int): Scaling factor.\n        **kwargs (Any): Additional keyword arguments.\n\n    Returns:\n        sourmash.SourmashSignature: The generated signature.\n\n    Raises:\n        RuntimeError: If an error occurs during sketching.\n    \"\"\"\n    self.logger.info(\"Starting sample sketch for: %s\", sample_name)\n    try:\n        signature = self._sketch_sample(\n            sample_name=sample_name,\n            fasta_file=filename,\n            num_processes=num_processes,\n            batch_size=batch_size,\n            k_size=ksize,\n            scale=scale,\n            **kwargs,\n        )\n        self.logger.info(\"Sample sketch completed for: %s\", sample_name)\n        return signature\n    except Exception as e:\n        self.logger.error(\n            \"Error occurred during sample sketching: %s\", str(e)\n        )\n        raise RuntimeError(\"Error occurred during sample sketching.\") from e\n</code></pre>"},{"location":"SnipeSig/","title":"Python API Documentation","text":""},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig","title":"<code>SnipeSig</code>","text":"<p>A class to handle Sourmash signatures with additional functionalities such as customized set operations and abundance management.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>class SnipeSig:\n    \"\"\"\n    A class to handle Sourmash signatures with additional functionalities\n    such as customized set operations and abundance management.\n    \"\"\"\n\n    def __init__(self, *, sourmash_sig: Union[str, sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature],\n                 ksize: int = 51, scale: int = 10000, sig_type=SigType.SAMPLE, enable_logging: bool = False, **kwargs):\n        r\"\"\"\n        Initialize the SnipeSig with a sourmash signature object or a path to a signature.\n\n        Parameters:\n            sourmash_sig (str or sourmash.signature.SourmashSignature): A path to a signature file or a signature object.\n            ksize (int): K-mer size.\n            scale (int): Scale value.\n            sig_type (SigType): Type of the signature.\n            enable_logging (bool): Flag to enable detailed logging.\n            **kwargs: Additional keyword arguments.\n        \"\"\"\n        # Initialize logging based on the flag\n        self.logger = logging.getLogger(self.__class__.__name__)\n\n        # Configure the logger\n        if enable_logging:\n            self.logger.setLevel(logging.DEBUG)\n            if not self.logger.hasHandlers():\n                # Create console handler\n                ch = logging.StreamHandler()\n                ch.setLevel(logging.DEBUG)\n                # Create formatter\n                formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')\n                # Add formatter to handler\n                ch.setFormatter(formatter)\n                # Add handler to logger\n                self.logger.addHandler(ch)\n            self.logger.debug(\"Logging is enabled for SnipeSig.\")\n        else:\n            self.logger.setLevel(logging.CRITICAL)\n\n        # Initialize internal variables\n        self.logger.debug(\"Initializing SnipeSig with sourmash_sig: %s\", sourmash_sig)\n\n        self._scale = scale\n        self._ksize = ksize\n        self._md5sum = None\n        self._hashes = np.array([], dtype=np.uint64)\n        self._abundances = np.array([], dtype=np.uint32)\n        self._type = sig_type\n        self._name = None\n        self._filename = None\n        self._track_abundance = False\n\n        sourmash_sigs: Dict[str, sourmash.signature.SourmashSignature] = {}\n        _sourmash_sig: Union[sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature] = None\n\n        self.chr_to_sig: Dict[str, SnipeSig] = {}\n\n\n        self.logger.debug(\"Proceeding with a sigtype of %s\", sig_type)\n\n        if not isinstance(sourmash_sig, (str, sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature)):\n            # if the str is not a file path\n            self.logger.error(\"Invalid type for sourmash_sig: %s\", type(sourmash_sig).__name__)\n            raise TypeError(f\"sourmash_sig must be a file path, sourmash.signature.SourmashSignature, or Frozensourmash_signature, got {type(sourmash_sig).__name__}\")\n\n        # Case 1: If sourmash_sig is already a valid sourmash signature object\n        if isinstance(sourmash_sig, (sourmash.signature.FrozenSourmashSignature, sourmash.signature.SourmashSignature)):\n            self.logger.debug(\"Loaded sourmash signature directly from object.\")\n            sourmash_sigs = {sourmash_sig.name: sourmash_sig}\n\n        # Case 2: If sourmash_sig is a string, try to load as JSON or a file\n        elif isinstance(sourmash_sig, str):\n            self.logger.debug(\"Attempting to load sourmash signature from string input.\")\n\n            # First, try loading from JSON\n            sourmash_sigs = self._try_load_from_json(sourmash_sig)\n            self.logger.debug(\"Loaded sourmash signature from JSON: %s\", sourmash_sigs)\n\n            # If JSON loading fails, try loading from file\n            if not sourmash_sigs:\n                sourmash_sigs = self._try_load_from_file(sourmash_sig)\n\n            # If both attempts fail, raise an error\n            if not sourmash_sigs:\n                self.logger.error(\"Failed to load sourmash signature from the provided string.\")\n                raise ValueError(\"An unexpected error occurred while loading the sourmash signature.\")\n\n        if sig_type == SigType.SAMPLE or sig_type == SigType.AMPLICON:\n            if len(sourmash_sigs) &gt; 1:\n                self.logger.debug(\"Multiple signatures found in the input. Expected a single sample signature.\")\n                # not supported at this time\n                raise ValueError(\"Loading multiple sample signatures is not supported at this time.\")\n            elif len(sourmash_sigs) == 1:\n                self.logger.debug(\"Found a single signature in the sample sig input; Will use this signature.\")\n                _sourmash_sig = list(sourmash_sigs.values())[0]\n            else:\n                self.logger.debug(\"No signature found in the input. Expected a single sample signature.\")\n                raise ValueError(\"No signature found in the input. Expected a single sample signature.\")\n\n        elif sig_type == SigType.GENOME:\n            if len(sourmash_sigs) &gt; 1:\n                for signame, sig in sourmash_sigs.items():\n                    self.logger.debug(f\"Iterating over signature: {signame}\")\n                    if signame.endswith(\"-snipegenome\"):\n                        sig = sig.to_mutable()\n                        sig.name = sig.name.replace(\"-snipegenome\", \"\")\n                        self.logger.debug(\"Found a genome signature with the snipe suffix `-snipegenome`. Restoring original name `%s`.\", sig.name)\n                        _sourmash_sig = sig\n                    elif signame.startswith(\"sex-\"):\n                        self.logger.debug(\"Found a sex chr signature %s\", signame)\n                        sig = sig.to_mutable()\n                        sig.name = signame.replace(\"sex-\",\"\")\n                        self.chr_to_sig[sig.name] = SnipeSig(sourmash_sig=sig, sig_type=SigType.AMPLICON, enable_logging=enable_logging)\n                    elif signame.startswith(\"autosome-\"):\n                        self.logger.debug(\"Found an autosome signature %s\", signame)\n                        sig = sig.to_mutable()\n                        sig.name = signame.replace(\"autosome-\",\"\")\n                        self.chr_to_sig[sig.name] = SnipeSig(sourmash_sig=sig, sig_type=SigType.AMPLICON, enable_logging=enable_logging)\n                    else:\n                        continue\n                else:\n                    if not _sourmash_sig:\n                        self.logger.debug(\"Found multiple signature per the genome file, but none with the snipe suffix `-snipegenome`.\")\n                        raise ValueError(\"Found multiple signature per the genome file, but none with the snipe suffix `-snipegenome`.\")\n            elif len(sourmash_sigs) == 1:\n                self.logger.debug(\"Found a single signature in the genome sig input; Will use this signature.\")\n                _sourmash_sig = list(sourmash_sigs.values())[0]\n        else:\n            self.logger.debug(\"Unknown sigtype: %s\", sig_type)\n            raise ValueError(f\"Unknown sigtype: {sig_type}\")\n\n        self.logger.debug(\"Length of currently loaded signature: %d, with name: %s\", len(_sourmash_sig), _sourmash_sig.name)\n\n        # Extract properties from the loaded signature\n        self._ksize = _sourmash_sig.minhash.ksize\n        self._scale = _sourmash_sig.minhash.scaled\n        self._md5sum = _sourmash_sig.md5sum()\n        self._name = _sourmash_sig.name\n        self._filename = _sourmash_sig.filename\n        self._track_abundance = _sourmash_sig.minhash.track_abundance\n\n        # If the signature does not track abundance, assume abundance of 1 for all hashes\n        if not self._track_abundance:\n            self.logger.debug(\"Signature does not track abundance. Setting all abundances to 1.\")\n            self._abundances = np.ones(len(_sourmash_sig.minhash.hashes), dtype=np.uint32)\n            # self._track_abundance = True\n        else:\n            self._abundances = np.array(list(_sourmash_sig.minhash.hashes.values()), dtype=np.uint32)\n\n        self._hashes = np.array(list(_sourmash_sig.minhash.hashes.keys()), dtype=np.uint64)\n\n        # Sort the hashes and rearrange abundances accordingly\n        sorted_indices = np.argsort(self._hashes)\n        self._hashes = self._hashes[sorted_indices]\n        self._abundances = self._abundances[sorted_indices]\n\n        self.logger.debug(\n            \"Loaded sourmash signature from file: %s, name: %s, md5sum: %s, ksize: %d, scale: %d, \"\n            \"track_abundance: %s, type: %s, length: %d\",\n            self._filename, self._name, self._md5sum, self._ksize, self._scale,\n            self._track_abundance, self._type, len(self._hashes)\n        )\n        self.logger.debug(\"Hashes sorted during initialization.\")\n        self.logger.debug(\"Sourmash signature loading completed successfully.\")\n\n    def _try_load_from_json(self, sourmash_sig: str) -&gt; Union[List[sourmash.signature.SourmashSignature], None]:\n        r\"\"\"\n        Attempt to load sourmash signature from JSON string.\n\n        Parameters:\n            sourmash_sig (str): JSON string representing a sourmash signature.\n\n        Returns:\n            sourmash.signature.SourmashSignature or None if loading fails.\n        \"\"\"\n        try:\n            self.logger.debug(\"Trying to load sourmash signature from JSON.\")\n            list_of_sigs = list(sourmash.load_signatures_from_json(sourmash_sig))\n            return {sig.name: sig for sig in list_of_sigs}\n        except Exception as e:\n            self.logger.debug(\"Loading from JSON failed. Proceeding to file loading.\", exc_info=e)\n            return None  # Return None to indicate failure\n\n    def _try_load_from_file(self, sourmash_sig_path: str) -&gt; Union[List[sourmash.signature.SourmashSignature], None]:\n        r\"\"\"\n        Attempt to load sourmash signature(s) from a file.\n\n        Parameters:\n            sourmash_sig_path (str): File path to a sourmash signature.\n\n        Returns:\n            sourmash.signature.Sourmash\u00dfSignature, list of sourmash.signature.SourmashSignature, or None if loading fails.\n        \"\"\"\n        self.logger.debug(\"Trying to load sourmash signature from file.\")\n        try:\n            signatures = list(sourmash.load_file_as_signatures(sourmash_sig_path))\n            self.logger.debug(\"Loaded %d sourmash signature(s) from file.\", len(signatures))\n            sigs_dict = {_sig.name: _sig for _sig in signatures}\n            self.logger.debug(\"Loaded sourmash signatures into sigs_dict: %s\", sigs_dict)\n            return sigs_dict\n        except Exception as e:\n            self.logger.exception(\"Failed to load the sourmash signature from the file.\", exc_info=e)\n            raise ValueError(\"An unexpected error occurred while loading the sourmash signature.\") from e\n\n    # Setters and getters\n    @property\n    def hashes(self) -&gt; np.ndarray:\n        r\"\"\"Return a copy of the hashes array.\"\"\"\n        return self._hashes.view()\n\n    @property\n    def abundances(self) -&gt; np.ndarray:\n        r\"\"\"Return a copy of the abundances array.\"\"\"\n        return self._abundances.view()\n\n    @property\n    def md5sum(self) -&gt; str:\n        r\"\"\"Return the MD5 checksum of the signature.\"\"\"\n        return self._md5sum\n\n    @property\n    def ksize(self) -&gt; int:\n        r\"\"\"Return the k-mer size.\"\"\"\n        return self._ksize\n\n    @property\n    def scale(self) -&gt; int:\n        r\"\"\"Return the scale value.\"\"\"\n        return self._scale\n\n    @property\n    def name(self) -&gt; str:\n        r\"\"\"Return the name of the signature.\"\"\"\n        return self._name\n\n    @property\n    def filename(self) -&gt; str:\n        r\"\"\"Return the filename of the signature.\"\"\"\n        return self._filename\n\n    @property\n    def sigtype(self) -&gt; SigType:\n        r\"\"\"Return the type of the signature.\"\"\"\n        return self._type\n\n    @property\n    def track_abundance(self) -&gt; bool:\n        r\"\"\"Return whether the signature tracks abundance.\"\"\"\n        return self._track_abundance\n\n    # Basic class methods\n    def get_name(self) -&gt; str:\n        r\"\"\"Get the name of the signature.\"\"\"\n        return self._name\n\n    # setter sigtype\n    @sigtype.setter\n    def sigtype(self, sigtype: SigType):\n        r\"\"\"\n        Set the type of the signature.\n        \"\"\"\n        self._type = sigtype\n\n    def get_info(self) -&gt; dict:\n        r\"\"\"\n        Get information about the signature.\n\n        Returns:\n            dict: A dictionary containing signature information.\n        \"\"\"\n        info = {\n            \"name\": self._name,\n            \"filename\": self._filename,\n            \"md5sum\": self._md5sum,\n            \"ksize\": self._ksize,\n            \"scale\": self._scale,\n            \"track_abundance\": self._track_abundance,\n            \"sigtype\": self._type,\n            \"num_hashes\": len(self._hashes)\n        }\n        return info\n\n    def __len__(self) -&gt; int:\n        r\"\"\"Return the number of hashes in the signature.\"\"\"\n        return len(self._hashes)\n\n    def __iter__(self) -&gt; Iterator[tuple]:\n        r\"\"\"\n        Iterate over the hashes and their abundances.\n\n        Yields:\n            tuple: A tuple containing (hash, abundance).\n        \"\"\"\n        for h, a in zip(self._hashes, self._abundances):\n            yield (h, a)\n\n    def __contains__(self, hash_value: int) -&gt; bool:\n        r\"\"\"\n        Check if a hash is present in the signature.\n\n        Parameters:\n            hash_value (int): The hash value to check.\n\n        Returns:\n            bool: True if the hash is present, False otherwise.\n        \"\"\"\n        # Utilize binary search since hashes are sorted\n        index = np.searchsorted(self._hashes, hash_value)\n        if index &lt; len(self._hashes) and self._hashes[index] == hash_value:\n            return True\n        return False\n\n    def __repr__(self) -&gt; str:\n        return (f\"SnipeSig(name={self._name}, ksize={self._ksize}, scale={self._scale}, \"\n                f\"type={self._type}, num_hashes={len(self._hashes)})\")\n\n    def __str__(self) -&gt; str:\n        return self.__repr__()\n\n    def __verify_snipe_signature(self, other: 'SnipeSig'):\n        r\"\"\"\n        Verify that the other object is a SnipeSig instance.\n\n        Parameters:\n            other (SnipeSig): The other signature to verify.\n\n        Raises:\n            ValueError: If the other object is not a SnipeSig instance.\n        \"\"\"\n        if not isinstance(other, SnipeSig):\n            msg = f\"Provided sig ({type(other).__name__}) is not a SnipeSig instance.\"\n            self.logger.error(msg)\n            raise ValueError(msg)\n\n    def __verify_matching_ksize_scale(self, other: 'SnipeSig'):\n        r\"\"\"\n        Verify that the ksize and scale match between two signatures.\n\n        Parameters:\n            other (SnipeSig): The other signature to compare.\n\n        Raises:\n            ValueError: If ksize or scale do not match.\n        \"\"\"\n        if self._ksize != other.ksize:\n            _e_msg = f\"K-mer size does not match between the two signatures: {self._ksize} vs {other.ksize}.\"\n            self.logger.error(_e_msg)\n            raise ValueError(_e_msg)\n        if self._scale != other.scale:\n            _e_msg = f\"Scale value does not match between the two signatures: {self._scale} vs {other.scale}.\"\n            self.logger.error(_e_msg)\n            raise ValueError(_e_msg)\n\n    def _validate_abundance_operation(self, value: Union[int, None], operation: str):\n        r\"\"\"\n        Validate that the signature tracks abundance and that the provided value is a non-negative integer.\n\n        Parameters:\n            value (int or None): The abundance value to validate. Can be None for operations that don't require a value.\n            operation (str): Description of the operation for logging purposes.\n\n        Raises:\n            ValueError: If the signature does not track abundance or if the value is invalid.\n        \"\"\"\n        if not self._track_abundance and self.sigtype == SigType.SAMPLE:\n            self.logger.error(\"Cannot %s: signature does not track abundance.\", operation)\n            raise ValueError(\"Signature does not track abundance.\")\n\n        if value is not None:\n            if not isinstance(value, int) or value &lt; 0:\n                self.logger.error(\"%s requires a non-negative integer value.\", operation.capitalize())\n                raise ValueError(f\"{operation.capitalize()} requires a non-negative integer value.\")\n\n    # Mask application method\n    def _apply_mask(self, mask: np.ndarray):\n        r\"\"\"\n        Apply a boolean mask to the hashes and abundances arrays.\n        Ensures that the sorted order is preserved.\n\n        Parameters:\n            mask (np.ndarray): Boolean array indicating which elements to keep.\n        \"\"\"\n        self._hashes = self._hashes[mask]\n        self._abundances = self._abundances[mask]\n\n        # Verify that the hashes remain sorted\n        if self._hashes.size &gt; 1:\n            if not np.all(self._hashes[:-1] &lt;= self._hashes[1:]):\n                self.logger.error(\"Hashes are not sorted after applying mask.\")\n                raise RuntimeError(\"Hashes are not sorted after applying mask.\")\n        self.logger.debug(\"Applied mask. Hashes remain sorted.\")\n\n    # Set operation methods\n    def union_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Combine this signature with another by summing abundances where hashes overlap.\n\n        Given two signatures \\( A \\) and \\( B \\) with hash sets \\( H_A \\) and \\( H_B \\),\n        and their corresponding abundance functions \\( a_A \\) and \\( a_B \\), the union\n        signature \\( C \\) is defined as follows:\n\n        - **Hash Set**: \n\n        $$\n        H_C = H_A \\cup H_B\n        $$\n\n        - **Abundance Function**:\n\n        $$\n        a_C(h) =\n        \\begin{cases} \n            a_A(h) + a_B(h), &amp; \\text{if } h \\in H_A \\cap H_B \\\\\n            a_A(h), &amp; \\text{if } h \\in H_A \\setminus H_B \\\\\n            a_B(h), &amp; \\text{if } h \\in H_B \\setminus H_A\n        \\end{cases}\n        $$\n        \"\"\"\n        self.__verify_snipe_signature(other)\n        self.__verify_matching_ksize_scale(other)\n\n        self.logger.debug(\"Unioning signatures (including all unique hashes).\")\n\n        # Access internal arrays directly\n        self_hashes = self._hashes\n        self_abundances = self._abundances\n        other_hashes = other._hashes\n        other_abundances = other._abundances\n\n        # Handle the case where 'other' does not track abundance\n        if not other.track_abundance:\n            self.logger.debug(\"Other signature does not track abundance. Setting abundances to 1.\")\n            other_abundances = np.ones_like(other_abundances, dtype=np.uint32)\n\n        # Combine hashes and abundances\n        combined_hashes = np.concatenate((self_hashes, other_hashes))\n        combined_abundances = np.concatenate((self_abundances, other_abundances))\n\n        # Use numpy's unique function with return_inverse to sum abundances efficiently\n        unique_hashes, inverse_indices = np.unique(combined_hashes, return_inverse=True)\n        summed_abundances = np.zeros_like(unique_hashes, dtype=np.uint32)\n\n        # Sum abundances for duplicate hashes\n        np.add.at(summed_abundances, inverse_indices, combined_abundances)\n\n        # Handle potential overflow\n        summed_abundances = np.minimum(summed_abundances, np.iinfo(np.uint32).max)\n\n        self.logger.debug(\"Union operation completed. Total hashes: %d\", len(unique_hashes))\n\n        # Create a new SnipeSig instance\n        return self.create_from_hashes_abundances(\n            hashes=unique_hashes,\n            abundances=summed_abundances,\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_union_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    def _convert_to_sourmash_signature(self):\n        r\"\"\"\n        Convert the SnipeSig instance to a sourmash.signature.SourmashSignature object.\n\n        Returns:\n            sourmash.signature.SourmashSignature: A new sourmash.signature.SourmashSignature instance.\n        \"\"\"\n        self.logger.debug(\"Converting SnipeSig to sourmash.signature.SourmashSignature.\")\n\n        mh = sourmash.minhash.MinHash(n=0, ksize=self._ksize, scaled=self._scale, track_abundance=self._track_abundance)\n        mh.set_abundances(dict(zip(self._hashes, self._abundances)))\n        self.sourmash_sig = sourmash.signature.SourmashSignature(mh, name=self._name, filename=self._filename)\n        self.logger.debug(\"Conversion to sourmash.signature.SourmashSignature completed.\")\n\n    def export(self, path) -&gt; None:\n        r\"\"\"\n        Export the signature to a file.\n\n        Parameters:\n            path (str): The path to save the signature to.\n        \"\"\"\n        self._convert_to_sourmash_signature()\n        with open(str(path), \"wb\") as fp:\n            sourmash.signature.save_signatures_to_json([self.sourmash_sig], fp)\n\n    def export_to_string(self):\n        r\"\"\"\n        Export the signature to a JSON string.\n\n        Returns:\n            str: JSON string representation of the signature.\n        \"\"\"\n        self._convert_to_sourmash_signature()\n        return sourmash.signature.save_signatures_to_json([self.sourmash_sig]).decode('utf-8')\n\n    def intersection_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Compute the intersection of the current signature with another signature.\n\n        This method keeps only the hashes that are common to both signatures, and retains the abundances from self.\n\n        **Mathematical Explanation**:\n\n        Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n        and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the intersection signature \\( C \\) has:\n\n        - Hash set:\n        $$\n        H_C = H_A \\cap H_B\n        $$\n\n        - Abundance function:\n        $$\n        a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C\n        $$\n\n        **Parameters**:\n            - `other (SnipeSig)`: Another `SnipeSig` instance to intersect with.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the two signatures.\n\n        **Raises**:\n            - `ValueError`: If `ksize` or `scale` do not match between signatures.\n        \"\"\"\n        self.__verify_snipe_signature(other)\n        self.__verify_matching_ksize_scale(other)\n\n        self.logger.debug(\"Intersecting signatures.\")\n\n        # Use numpy's intersect1d function\n        common_hashes, self_indices, _ = np.intersect1d(\n            self._hashes, other._hashes, assume_unique=True, return_indices=True\n        )\n\n        if common_hashes.size == 0:\n            self.logger.debug(\"No common hashes found. Returning an empty signature.\")\n            return self.create_from_hashes_abundances(\n                hashes=np.array([], dtype=np.uint64),\n                abundances=np.array([], dtype=np.uint32),\n                ksize=self._ksize,\n                scale=self._scale,\n                name=f\"{self._name}_intersection_{other._name}\",\n                filename=None,\n                enable_logging=self.logger.level &lt;= logging.DEBUG\n            )\n\n        # Get the abundances from self\n        common_abundances = self._abundances[self_indices]\n\n        self.logger.debug(\"Intersection operation completed. Total common hashes: %d\", len(common_hashes))\n\n        # Create a new SnipeSig instance\n        return self.create_from_hashes_abundances(\n            hashes=common_hashes,\n            abundances=common_abundances,\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_intersection_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    def difference_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Compute the difference of the current signature with another signature.\n\n        This method removes hashes that are present in the other signature from self,\n        keeping the abundances from self.\n\n        **Mathematical Explanation**:\n\n        Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n        and abundance function \\( a_A(h) \\), the difference signature \\( C \\) has:\n\n        - Hash set:\n        $$\n        H_C = H_A \\setminus H_B\n        $$\n\n        - Abundance function:\n        $$\n        a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C\n        $$\n\n        **Parameters**:\n            - `other (SnipeSig)`: Another `SnipeSig` instance to subtract from the current signature.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the difference of the two signatures.\n\n        **Raises**:\n            - `ValueError`: If `ksize` or `scale` do not match between signatures.\n            - `RuntimeError`: If zero hashes remain after difference.\n        \"\"\"\n        self.__verify_snipe_signature(other)\n        self.__verify_matching_ksize_scale(other)\n\n        self.logger.debug(\"Differencing signatures.\")\n\n        # Use numpy's setdiff1d function\n        diff_hashes = np.setdiff1d(self._hashes, other._hashes, assume_unique=True)\n\n        if diff_hashes.size == 0:\n            _e_msg = f\"Difference operation resulted in zero hashes, which is not allowed for {self._name} and {other._name}.\"\n            self.logger.warning(_e_msg)\n\n        # Get the indices of the hashes in self\n        mask = np.isin(self._hashes, diff_hashes, assume_unique=True)\n        diff_abundances = self._abundances[mask]\n\n        self.logger.debug(\"Difference operation completed. Remaining hashes: %d\", len(diff_hashes))\n\n        # Create a new SnipeSig instance\n        return self.create_from_hashes_abundances(\n            hashes=diff_hashes,\n            abundances=diff_abundances,\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_difference_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    def symmetric_difference_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Compute the symmetric difference of the current signature with another signature.\n\n        This method retains hashes that are unique to each signature, with their respective abundances.\n\n        **Mathematical Explanation**:\n\n        Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n        and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the symmetric difference signature \\( C \\) has:\n\n        - Hash set:\n        $$\n        H_C = (H_A \\setminus H_B) \\cup (H_B \\setminus H_A)\n        $$\n\n        - Abundance function:\n        $$\n        a_C(h) =\n        \\begin{cases}\n        a_A(h), &amp; \\text{for } h \\in H_A \\setminus H_B \\\\\n        a_B(h), &amp; \\text{for } h \\in H_B \\setminus H_A \\\\\n        \\end{cases}\n        $$\n\n        **Parameters**:\n            - `other (SnipeSig)`: Another `SnipeSig` instance to compute the symmetric difference with.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the symmetric difference of the two signatures.\n\n        **Raises**:\n            - `ValueError`: If `ksize` or `scale` do not match between signatures.\n            - `RuntimeError`: If zero hashes remain after symmetric difference.\n        \"\"\"\n        self.__verify_snipe_signature(other)\n        self.__verify_matching_ksize_scale(other)\n\n        self.logger.debug(\"Computing symmetric difference of signatures.\")\n\n        # Hashes unique to self and other\n        unique_self_hashes = np.setdiff1d(self._hashes, other._hashes, assume_unique=True)\n        unique_other_hashes = np.setdiff1d(other._hashes, self._hashes, assume_unique=True)\n\n        # Abundances for unique hashes\n        mask_self = np.isin(self._hashes, unique_self_hashes, assume_unique=True)\n        unique_self_abundances = self._abundances[mask_self]\n\n        mask_other = np.isin(other._hashes, unique_other_hashes, assume_unique=True)\n        unique_other_abundances = other._abundances[mask_other]\n\n        # Handle the case where 'other' does not track abundance\n        if not other.track_abundance:\n            self.logger.debug(\"Other signature does not track abundance. Setting abundances to 1.\")\n            unique_other_abundances = np.ones_like(unique_other_abundances, dtype=np.uint32)\n\n        # Combine hashes and abundances\n        combined_hashes = np.concatenate((unique_self_hashes, unique_other_hashes))\n        combined_abundances = np.concatenate((unique_self_abundances, unique_other_abundances))\n\n        if combined_hashes.size == 0:\n            _e_msg = \"Symmetric difference operation resulted in zero hashes, which is not allowed.\"\n            self.logger.error(_e_msg)\n            raise RuntimeError(_e_msg)\n\n        # Sort combined hashes and abundances\n        sorted_indices = np.argsort(combined_hashes)\n        combined_hashes = combined_hashes[sorted_indices]\n        combined_abundances = combined_abundances[sorted_indices]\n\n        self.logger.debug(\"Symmetric difference operation completed. Total unique hashes: %d\", len(combined_hashes))\n\n        # Create a new SnipeSig instance\n        return self.create_from_hashes_abundances(\n            hashes=combined_hashes,\n            abundances=combined_abundances,\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_symmetric_difference_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    # Magic methods for union operations\n    def __add__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the + operator.\n        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n        returning a new signature.\n\n        Returns:\n            SnipeSig: Union of self and other.\n        \"\"\"\n        return self.union_sigs(other)\n\n    def __iadd__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the += operator.\n        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n        modifying self in-place.\n\n        Returns:\n            SnipeSig: Updated self after addition.\n        \"\"\"\n        union_sig = self.union_sigs(other)\n        self._update_from_union(union_sig)\n        return self\n\n    def __or__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the | operator.\n        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n        returning a new signature.\n\n        Returns:\n            SnipeSig: Union of self and other.\n        \"\"\"\n        return self.union_sigs(other)\n\n    def __ior__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the |= operator.\n        Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n        modifying self in-place.\n\n        Returns:\n            SnipeSig: Updated self after union.\n        \"\"\"\n        union_sig = self.union_sigs(other)\n        self._update_from_union(union_sig)\n        return self\n\n    def __sub__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the - operator.\n        Removes hashes present in other from self, keeping abundances from self,\n        returning a new signature.\n\n        Returns:\n            SnipeSig: Difference of self and other.\n        \"\"\"\n        return self.difference_sigs(other)\n\n    def __isub__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the -= operator.\n        Removes hashes present in other from self, keeping abundances from self,\n        modifying self in-place.\n\n        Returns:\n            SnipeSig: Updated self after difference.\n\n        Raises:\n            RuntimeError: If zero hashes remain after difference.\n        \"\"\"\n        difference_sig = self.difference_sigs(other)\n        self._update_from_union(difference_sig)\n        return self\n\n    def __xor__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the ^ operator.\n        Keeps unique hashes from each signature with their respective abundances, returning a new signature.\n\n        Returns:\n            SnipeSig: Symmetric difference of self and other.\n        \"\"\"\n        return self.symmetric_difference_sigs(other)\n\n    def __ixor__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the ^= operator.\n        Keeps unique hashes from each signature with their respective abundances, modifying self in-place.\n\n        Returns:\n            SnipeSig: Updated self after symmetric difference.\n\n        Raises:\n            RuntimeError: If zero hashes remain after symmetric difference.\n        \"\"\"\n        symmetric_diff_sig = self.symmetric_difference_sigs(other)\n        self._update_from_union(symmetric_diff_sig)\n        return self\n\n    def __and__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the &amp; operator.\n        Keeps common hashes and retains abundances from self only, returning a new signature.\n\n        Returns:\n            SnipeSig: Intersection of self and other.\n        \"\"\"\n        return self.intersection_sigs(other)\n\n    def _update_from_union(self, other: 'SnipeSig'):\n        r\"\"\"\n        Update self's hashes and abundances from another SnipeSig instance.\n\n        Parameters:\n            other (SnipeSig): The other SnipeSig instance to update from.\n        \"\"\"\n        self._hashes = other.hashes\n        self._abundances = other.abundances\n        self._name = other.name\n        self._filename = other.filename\n        self._md5sum = other.md5sum\n        self._track_abundance = other.track_abundance\n        # No need to update ksize and scale since they are verified to match\n\n    @classmethod\n    def create_from_hashes_abundances(cls, hashes: np.ndarray, abundances: np.ndarray,\n                                      ksize: int, scale: int, name: str = None,\n                                      filename: str = None, enable_logging: bool = False, sig_type: SigType = SigType.SAMPLE) -&gt; 'SnipeSig':\n        \"\"\"\n        Internal method to create a SnipeSig instance from hashes and abundances.\n\n        Parameters:\n            hashes (np.ndarray): Array of hash values.\n            abundances (np.ndarray): Array of abundance values corresponding to the hashes.\n            ksize (int): K-mer size.\n            scale (int): Scale value.\n            name (str): Optional name for the signature.\n            filename (str): Optional filename for the signature.\n            sig_type (SigType): Type of the signature.\n            enable_logging (bool): Flag to enable logging.\n\n        Returns:\n            SnipeSig: A new SnipeSig instance.\n        \"\"\"\n        # Create a mock sourmash signature object\n        mh = sourmash.minhash.MinHash(n=0, ksize=ksize, scaled=scale, track_abundance=True)\n        mh.set_abundances(dict(zip(hashes, abundances)))\n        sig = sourmash.signature.SourmashSignature(mh, name=name or \"\", filename=filename or \"\")\n        return cls(sourmash_sig=sig, sig_type=sig_type, enable_logging=enable_logging)\n\n    # Aggregation Operations\n    @classmethod\n    def sum_signatures(cls, signatures: List['SnipeSig'], name: str = \"summed_signature\",\n                       filename: str = None, enable_logging: bool = False) -&gt; 'SnipeSig':\n\n        r\"\"\"\n        Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap.\n        This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.\n\n        $$\n        \\text{Sum}(A_1, A_2, \\dots, A_n) = \\bigcup_{i=1}^{n} A_i\n        $$\n\n        For each hash \\( h \\), its total abundance is:\n        $$\n        \\text{abundance}(h) = \\sum_{i=1}^{n} \\text{abundance}_i(h)\n        $$\n\n        **Mathematical Explanation**:\n\n        - **Union of Signatures**:\n            The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.\n\n        - **Total Abundance Calculation**:\n            For each unique hash \\( h \\), the total abundance is the sum of its abundances across all signatures where it appears.\n\n        - **Algorithm Efficiency**:\n            By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.\n\n        **Parameters**:\n            - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to sum.\n            - `name (str)`: Optional name for the resulting signature.\n            - `filename (str)`: Optional filename for the resulting signature.\n            - `enable_logging (bool)`: Flag to enable detailed logging.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the sum of the signatures.\n\n        **Raises**:\n            - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.\n            - `RuntimeError`: If an error occurs during the summation process.\n        \"\"\"\n        if not signatures:\n            raise ValueError(\"No signatures provided for summation.\")\n\n        # Verify that all signatures have the same ksize, scale, and track_abundance\n        first_sig = signatures[0]\n        ksize = first_sig.ksize\n        scale = first_sig.scale\n        track_abundance = first_sig.track_abundance\n\n        for sig in signatures[1:]:\n            if sig.ksize != ksize or sig.scale != scale:\n                raise ValueError(\"All signatures must have the same ksize and scale.\")\n            if sig.track_abundance != track_abundance:\n                raise ValueError(\"All signatures must have the same track_abundance setting.\")\n\n        # Initialize iterators for each signature's hashes and abundances\n        iterators = []\n        for sig in signatures:\n            it = iter(zip(sig.hashes, sig.abundances))\n            try:\n                first_hash, first_abundance = next(it)\n                iterators.append((first_hash, first_abundance, it))\n            except StopIteration:\n                continue  # Skip empty signatures\n\n        if not iterators:\n            raise ValueError(\"All provided signatures are empty.\")\n\n        # Initialize the heap with the first element from each iterator\n        heap = []\n        for idx, (hash_val, abundance, it) in enumerate(iterators):\n            heap.append((hash_val, abundance, idx))\n        heapq.heapify(heap)\n\n        # Prepare lists to collect the summed hashes and abundances\n        summed_hashes = []\n        summed_abundances = []\n\n        while heap:\n            current_hash, current_abundance, idx = heapq.heappop(heap)\n            # Initialize total abundance for the current_hash\n            total_abundance = current_abundance\n\n            # Check if the next element in the heap has the same hash\n            while heap and heap[0][0] == current_hash:\n                _, abundance, same_idx = heapq.heappop(heap)\n                total_abundance += abundance\n                # Push the next element from the same iterator\n                try:\n                    next_hash, next_abundance = next(iterators[same_idx][2])\n                    heapq.heappush(heap, (next_hash, next_abundance, same_idx))\n                except StopIteration:\n                    pass  # No more elements in this iterator\n\n            # Append the summed hash and abundance\n            summed_hashes.append(current_hash)\n            summed_abundances.append(total_abundance)\n\n            # Push the next element from the current iterator\n            try:\n                next_hash, next_abundance = next(iterators[idx][2])\n                heapq.heappush(heap, (next_hash, next_abundance, idx))\n            except StopIteration:\n                pass  # No more elements in this iterator\n\n        # Convert the results to NumPy arrays for efficient storage and processing\n        summed_hashes = np.array(summed_hashes, dtype=np.uint64)\n        summed_abundances = np.array(summed_abundances, dtype=np.uint32)\n\n        # Handle potential overflow by capping at the maximum value of uint32\n        summed_abundances = np.minimum(summed_abundances, np.iinfo(np.uint32).max)\n\n        # Create a new SnipeSig instance from the summed hashes and abundances\n        summed_signature = cls.create_from_hashes_abundances(\n            hashes=summed_hashes,\n            abundances=summed_abundances,\n            ksize=ksize,\n            scale=scale,\n            name=name,\n            filename=filename,\n            enable_logging=enable_logging\n        )\n\n        return summed_signature\n\n    @staticmethod\n    def get_unique_signatures(signatures: Dict[str, 'SnipeSig']) -&gt; Dict[str, 'SnipeSig']:\n        \"\"\"\n        Extract unique signatures from a dictionary of SnipeSig instances.\n\n        For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.\n\n        Parameters:\n            signatures (Dict[str, SnipeSig]): A dictionary mapping signature names to SnipeSig instances.\n\n        Returns:\n            Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.\n\n        Raises:\n            ValueError: If the input dictionary is empty or if signatures have mismatched ksize/scale.\n        \"\"\"\n        if not signatures:\n            raise ValueError(\"The input signatures dictionary is empty.\")\n\n        # Extract ksize and scale from the first signature\n        first_name, first_sig = next(iter(signatures.items()))\n        ksize = first_sig.ksize\n        scale = first_sig.scale\n\n        # Verify that all signatures have the same ksize and scale\n        for name, sig in signatures.items():\n            if sig.ksize != ksize or sig.scale != scale:\n                raise ValueError(f\"Signature '{name}' has mismatched ksize or scale.\")\n\n        # Aggregate all hashes from all signatures\n        all_hashes = np.concatenate([sig.hashes for sig in signatures.values()])\n\n        # Count the occurrences of each hash\n        unique_hashes, counts = np.unique(all_hashes, return_counts=True)\n\n        # Identify hashes that are unique across all signatures (count == 1)\n        unique_across_all = unique_hashes[counts == 1]\n\n        # Convert to a set for faster membership testing\n        unique_set = set(unique_across_all)\n\n        unique_signatures = {}\n\n        for name, sig in signatures.items():\n            # Find hashes in the current signature that are unique across all signatures\n            mask_unique = np.isin(sig.hashes, list(unique_set))\n\n            # Extract unique hashes and their abundances\n            unique_hashes_sig = sig.hashes[mask_unique]\n            unique_abundances_sig = sig.abundances[mask_unique]\n\n            # Create a new SnipeSig instance with the unique hashes and abundances\n            unique_sig = SnipeSig.create_from_hashes_abundances(\n                hashes=unique_hashes_sig,\n                abundances=unique_abundances_sig,\n                ksize=ksize,\n                scale=scale,\n                name=f\"{name}_unique\",\n                filename=None,\n                enable_logging=False,  # Set to True if you want logging for the new signatures\n                sig_type=SigType.SAMPLE  # Adjust sig_type as needed\n            )\n\n            unique_signatures[name] = unique_sig\n\n        return unique_signatures\n\n\n    @classmethod\n    def common_hashes(cls, signatures: List['SnipeSig'], name: str = \"common_hashes_signature\",\n                      filename: str = None, enable_logging: bool = False) -&gt; 'SnipeSig':\n        r\"\"\"\n        Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing\n        only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.\n\n        This method uses a heap-based multi-way merge algorithm for efficient computation,\n        especially when handling a large number of signatures with sorted hashes.\n\n        **Mathematical Explanation**:\n\n        Given signatures \\( A_1, A_2, \\dots, A_n \\) with hash sets \\( H_1, H_2, \\dots, H_n \\),\n        the intersection signature \\( C \\) has:\n\n        - Hash set:\n        $$\n        H_C = \\bigcap_{i=1}^{n} H_i\n        $$\n\n        - Abundance function:\n        $$\n        a_C(h) = \\min_{i=1}^{n} a_i(h), \\quad \\text{for } h \\in H_C\n        $$\n\n        **Parameters**:\n            - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to compute the intersection.\n            - `name (str)`: Optional name for the resulting signature.\n            - `filename (str)`: Optional filename for the resulting signature.\n            - `enable_logging (bool)`: Flag to enable detailed logging.\n\n        **Returns**:\n            - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the signatures.\n\n        **Raises**:\n            - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.\n        \"\"\"\n        if not signatures:\n            raise ValueError(\"No signatures provided for intersection.\")\n\n        # Verify that all signatures have the same ksize and scale\n        first_sig = signatures[0]\n        ksize = first_sig.ksize\n        scale = first_sig.scale\n        for sig in signatures[1:]:\n            if sig.ksize != ksize or sig.scale != scale:\n                raise ValueError(\"All signatures must have the same ksize and scale.\")\n\n        num_signatures = len(signatures)\n        iterators = []\n        for sig in signatures:\n            it = iter(zip(sig.hashes, sig.abundances))\n            try:\n                first_hash, first_abundance = next(it)\n                iterators.append((first_hash, first_abundance, it))\n            except StopIteration:\n                # One of the signatures is empty; intersection is empty\n                return cls.create_from_hashes_abundances(\n                    hashes=np.array([], dtype=np.uint64),\n                    abundances=np.array([], dtype=np.uint32),\n                    ksize=ksize,\n                    scale=scale,\n                    name=name,\n                    filename=filename,\n                    enable_logging=enable_logging\n                )\n\n        # Initialize the heap with the first element from each iterator\n        heap = []\n        for idx, (hash_val, abundance, it) in enumerate(iterators):\n            heap.append((hash_val, abundance, idx))\n        heapq.heapify(heap)\n\n        common_hashes = []\n        common_abundances = []\n\n        while heap:\n            # Pop all entries with the smallest hash\n            current_hash, current_abundance, idx = heapq.heappop(heap)\n            same_hash_entries = [(current_hash, current_abundance, idx)]\n\n            # Collect all entries in the heap that have the same current_hash\n            while heap and heap[0][0] == current_hash:\n                h, a, i = heapq.heappop(heap)\n                same_hash_entries.append((h, a, i))\n\n            if len(same_hash_entries) == num_signatures:\n                # The current_hash is present in all signatures\n                # Take the minimum abundance across signatures\n                min_abundance = min(entry[1] for entry in same_hash_entries)\n                common_hashes.append(current_hash)\n                common_abundances.append(min_abundance)\n\n            # Push the next element from each iterator that had the current_hash\n            for entry in same_hash_entries:\n                h, a, i = entry\n                try:\n                    next_hash, next_abundance = next(iterators[i][2])\n                    heapq.heappush(heap, (next_hash, next_abundance, i))\n                except StopIteration:\n                    pass  # Iterator exhausted\n\n        # Convert the results to NumPy arrays\n        if not common_hashes:\n            # No common hashes found\n            unique_hashes = np.array([], dtype=np.uint64)\n            unique_abundances = np.array([], dtype=np.uint32)\n        else:\n            unique_hashes = np.array(common_hashes, dtype=np.uint64)\n            unique_abundances = np.array(common_abundances, dtype=np.uint32)\n\n        # Create a new SnipeSig instance from the common hashes and abundances\n        common_signature = cls.create_from_hashes_abundances(\n            hashes=unique_hashes,\n            abundances=unique_abundances,\n            ksize=ksize,\n            scale=scale,\n            name=name,\n            filename=filename,\n            enable_logging=enable_logging\n        )\n\n        return common_signature\n\n    def copy(self) -&gt; 'SnipeSig':\n        r\"\"\"\n        Create a copy of the current SnipeSig instance.\n\n        Returns:\n            SnipeSig: A new instance that is a copy of self.\n        \"\"\"\n        return SnipeSig(sourmash_sig=self.export_to_string(), sig_type=self.sigtype, enable_logging=self.logger.level &lt;= logging.DEBUG)\n\n    # Implement the __radd__ method to support sum()\n    def __radd__(self, other: Union[int, 'SnipeSig']) -&gt; 'SnipeSig':\n        r\"\"\"\n        Implements the right-hand + operator to support sum().\n\n        Returns:\n            SnipeSig: Union of self and other.\n        \"\"\"\n        return self.__radd_sum__(other)\n\n    # Override the __sum__ method\n    def __radd_sum__(self, other: Union[int, 'SnipeSig']) -&gt; 'SnipeSig':\n        r\"\"\"\n        Internal helper method to support the sum() function.\n\n        Parameters:\n            other (int or SnipeSig): The other object to add. If other is 0, return self.\n\n        Returns:\n            SnipeSig: The result of the addition.\n        \"\"\"\n        if other == 0:\n            return self\n        if not isinstance(other, SnipeSig):\n            raise TypeError(f\"Unsupported operand type(s) for +: 'SnipeSig' and '{type(other).__name__}'\")\n        return self.union_sigs(other)\n\n    def reset_abundance(self, new_abundance: int = 1):\n        r\"\"\"\n        Reset all abundances to a specified value.\n\n        This method sets the abundance of every hash in the signature to the specified `new_abundance` value.\n\n        **Mathematical Explanation**:\n\n        For each hash \\( h \\) in the signature, the abundance function is updated to:\n        $$\n        a(h) = \\text{new\\_abundance}\n        $$\n\n        **Parameters**:\n            - `new_abundance (int)`: The new abundance value to set for all hashes. Default is 1.\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance or if `new_abundance` is invalid.\n        \"\"\"\n\n        self._validate_abundance_operation(new_abundance, \"reset abundance\")\n\n        self._abundances[:] = new_abundance\n        self.logger.debug(\"Reset all abundances to %d.\", new_abundance)\n\n    def keep_min_abundance(self, min_abundance: int):\n        r\"\"\"\n        Keep only hashes with abundances greater than or equal to a minimum threshold.\n\n        This method removes hashes whose abundances are less than the specified `min_abundance`.\n\n        **Mathematical Explanation**:\n\n        The updated hash set \\( H' \\) is:\n        $$\n        H' = \\{ h \\in H \\mid a(h) \\geq \\text{min\\_abundance} \\}\n        $$\n\n        **Parameters**:\n            - `min_abundance (int)`: The minimum abundance threshold.\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance or if `min_abundance` is invalid.\n        \"\"\"\n        self._validate_abundance_operation(min_abundance, \"keep minimum abundance\")\n\n        mask = self._abundances &gt;= min_abundance\n        self._apply_mask(mask)\n        self.logger.debug(\"Kept hashes with abundance &gt;= %d.\", min_abundance)\n\n    def keep_max_abundance(self, max_abundance: int):\n        r\"\"\"\n        Keep only hashes with abundances less than or equal to a maximum threshold.\n\n        This method removes hashes whose abundances are greater than the specified `max_abundance`.\n\n        **Mathematical Explanation**:\n\n        The updated hash set \\( H' \\) is:\n        $$\n        H' = \\{ h \\in H \\mid a(h) \\leq \\text{max\\_abundance} \\}\n        $$\n\n        **Parameters**:\n            - `max_abundance (int)`: The maximum abundance threshold.\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance or if `max_abundance` is invalid.\n        \"\"\"\n        self._validate_abundance_operation(max_abundance, \"keep maximum abundance\")\n\n        mask = self._abundances &lt;= max_abundance\n        self._apply_mask(mask)\n        self.logger.debug(\"Kept hashes with abundance &lt;= %d.\", max_abundance)\n\n    def trim_below_median(self):\n        r\"\"\"\n        Trim hashes with abundances below the median abundance.\n\n        This method removes all hashes whose abundances are less than the median abundance of the signature.\n\n        **Mathematical Explanation**:\n\n        Let \\\\( m \\\\) be the median of \\\\( \\\\{ a(h) \\mid h \\in H \\\\} \\\\).\n        The updated hash set \\\\( H' \\\\) is:\n\n        $$\n        H' = \\\\{ h \\in H \\mid a(h) \\geq m \\\\}\n        $$\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance.\n        \"\"\"\n\n        self._validate_abundance_operation(None, \"trim below median\")\n\n        if len(self._abundances) == 0:\n            self.logger.debug(\"No hashes to trim based on median abundance.\")\n            return\n\n        median = np.median(self._abundances)\n        mask = self._abundances &gt;= median\n        self._apply_mask(mask)\n        self.logger.debug(\"Trimmed hashes with abundance below median (%f).\", median)\n\n    def count_singletons(self) -&gt; int:\n        r\"\"\"\n        Return the number of hashes with abundance equal to 1.\n\n        Returns:\n            int: Number of singletons.\n\n        Raises:\n            ValueError: If the signature does not track abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"count singletons\")\n\n        count = np.sum(self._abundances == 1)\n        self.logger.debug(\"Number of singletons (abundance == 1): %d\", count)\n        return int(count)\n\n    def trim_singletons(self):\n        r\"\"\"\n        Remove hashes with abundance equal to 1.\n\n        This method removes all hashes that are singletons (abundance equals 1).\n\n        **Mathematical Explanation**:\n\n        The updated hash set \\( H' \\) is:\n        $$\n        H' = \\{ h \\in H \\mid a(h) \\neq 1 \\}\n        $$\n\n        **Raises**:\n            - `ValueError`: If the signature does not track abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"trim singletons\")\n\n        mask = self._abundances != 1\n        self.logger.debug(\"Trimming %d hashes with abundance equal to 1.\", np.sum(~mask))\n        self._apply_mask(mask)\n        self.logger.debug(\"Size after trimming singletons: %d\", len(self._hashes)) \n\n    # New Properties Implemented as per Request\n\n    @property\n    def total_abundance(self) -&gt; int:\n        r\"\"\"\n        Return the total abundance (sum of all abundances).\n\n        Returns:\n            int: Total abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"calculate total abundance\")\n\n        total = int(np.sum(self._abundances))\n        self.logger.debug(\"Total abundance: %d\", total)\n        return total\n\n    @property\n    def mean_abundance(self) -&gt; float:\n        r\"\"\"\n        Return the mean (average) abundance.\n\n        Returns:\n            float: Mean abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"calculate mean abundance\")\n\n        if len(self._abundances) == 0:\n            self.logger.debug(\"No abundances to calculate mean.\")\n            return 0.0\n\n        mean = float(np.mean(self._abundances))  # Changed to float\n        self.logger.debug(\"Mean abundance: %f\", mean)\n        return mean\n\n    @property\n    def get_sample_stats(self) -&gt; dict:\n        r\"\"\"\n        Retrieve statistical information about the signature.\n\n        This property computes and returns a dictionary containing various statistics of the signature, such as total abundance, mean and median abundances, number of singletons, and total number of hashes.\n\n        **Returns**:\n            - `dict`: A dictionary containing sample statistics:\n                - `total_abundance`: Sum of abundances.\n                - `mean_abundance`: Mean abundance.\n                - `median_abundance`: Median abundance.\n                - `num_singletons`: Number of hashes with abundance equal to 1.\n                - `num_hashes`: Total number of hashes.\n                - `ksize`: K-mer size.\n                - `scale`: Scale value.\n                - `name`: Name of the signature.\n                - `filename`: Filename of the signature.\n        \"\"\"\n\n        # if self.sigtype != SigType.SAMPLE then don't return abundance stats\n\n        stats = {\n            \"num_hashes\": len(self._hashes),\n            \"ksize\": self._ksize,\n            \"scale\": self._scale,\n            \"name\": self._name,\n            \"filename\": self._filename\n        }\n\n        if self.sigtype != SigType.SAMPLE:\n            stats[\"total_abundance\"] = None\n            stats[\"mean_abundance\"] = None\n            stats[\"median_abundance\"] = None\n            stats[\"num_singletons\"] = None\n        else:\n            stats[\"total_abundance\"] = self.total_abundance\n            stats[\"mean_abundance\"] = self.mean_abundance\n            stats[\"median_abundance\"] = self.median_abundance\n            stats[\"num_singletons\"] = self.count_singletons()\n\n        return stats\n\n    @property\n    def median_abundance(self) -&gt; float:\n        r\"\"\"\n        Return the median abundance.\n\n        Returns:\n            float: Median abundance.\n\n        Raises:\n            ValueError: If the signature does not track abundance.\n        \"\"\"\n        self._validate_abundance_operation(None, \"calculate median abundance\")\n\n        if len(self._abundances) == 0:\n            self.logger.debug(\"No abundances to calculate median.\")\n            return 0.0\n\n        median = float(np.median(self._abundances))  # Changed to float\n        self.logger.debug(\"Median abundance: %f\", median)\n        return median\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.abundances","title":"<code>abundances: np.ndarray</code>  <code>property</code>","text":"<p>Return a copy of the abundances array.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.filename","title":"<code>filename: str</code>  <code>property</code>","text":"<p>Return the filename of the signature.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.get_sample_stats","title":"<code>get_sample_stats: dict</code>  <code>property</code>","text":"<p>Retrieve statistical information about the signature.</p> <p>This property computes and returns a dictionary containing various statistics of the signature, such as total abundance, mean and median abundances, number of singletons, and total number of hashes.</p> <p>Returns:     - <code>dict</code>: A dictionary containing sample statistics:         - <code>total_abundance</code>: Sum of abundances.         - <code>mean_abundance</code>: Mean abundance.         - <code>median_abundance</code>: Median abundance.         - <code>num_singletons</code>: Number of hashes with abundance equal to 1.         - <code>num_hashes</code>: Total number of hashes.         - <code>ksize</code>: K-mer size.         - <code>scale</code>: Scale value.         - <code>name</code>: Name of the signature.         - <code>filename</code>: Filename of the signature.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.hashes","title":"<code>hashes: np.ndarray</code>  <code>property</code>","text":"<p>Return a copy of the hashes array.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.ksize","title":"<code>ksize: int</code>  <code>property</code>","text":"<p>Return the k-mer size.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.md5sum","title":"<code>md5sum: str</code>  <code>property</code>","text":"<p>Return the MD5 checksum of the signature.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.mean_abundance","title":"<code>mean_abundance: float</code>  <code>property</code>","text":"<p>Return the mean (average) abundance.</p> <p>Returns:</p> Name Type Description <code>float</code> <code>float</code> <p>Mean abundance.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.median_abundance","title":"<code>median_abundance: float</code>  <code>property</code>","text":"<p>Return the median abundance.</p> <p>Returns:</p> Name Type Description <code>float</code> <code>float</code> <p>Median abundance.</p> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the signature does not track abundance.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.name","title":"<code>name: str</code>  <code>property</code>","text":"<p>Return the name of the signature.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.scale","title":"<code>scale: int</code>  <code>property</code>","text":"<p>Return the scale value.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.sigtype","title":"<code>sigtype: SigType</code>  <code>property</code> <code>writable</code>","text":"<p>Return the type of the signature.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.total_abundance","title":"<code>total_abundance: int</code>  <code>property</code>","text":"<p>Return the total abundance (sum of all abundances).</p> <p>Returns:</p> Name Type Description <code>int</code> <code>int</code> <p>Total abundance.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.track_abundance","title":"<code>track_abundance: bool</code>  <code>property</code>","text":"<p>Return whether the signature tracks abundance.</p>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__add__","title":"<code>__add__(other)</code>","text":"<p>Implements the + operator. Includes all unique hashes from both signatures and sums their abundances where hashes overlap, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Union of self and other.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __add__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the + operator.\n    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n    returning a new signature.\n\n    Returns:\n        SnipeSig: Union of self and other.\n    \"\"\"\n    return self.union_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__and__","title":"<code>__and__(other)</code>","text":"<p>Implements the &amp; operator. Keeps common hashes and retains abundances from self only, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Intersection of self and other.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __and__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the &amp; operator.\n    Keeps common hashes and retains abundances from self only, returning a new signature.\n\n    Returns:\n        SnipeSig: Intersection of self and other.\n    \"\"\"\n    return self.intersection_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__contains__","title":"<code>__contains__(hash_value)</code>","text":"<p>Check if a hash is present in the signature.</p> <p>Parameters:</p> Name Type Description Default <code>hash_value</code> <code>int</code> <p>The hash value to check.</p> required <p>Returns:</p> Name Type Description <code>bool</code> <code>bool</code> <p>True if the hash is present, False otherwise.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __contains__(self, hash_value: int) -&gt; bool:\n    r\"\"\"\n    Check if a hash is present in the signature.\n\n    Parameters:\n        hash_value (int): The hash value to check.\n\n    Returns:\n        bool: True if the hash is present, False otherwise.\n    \"\"\"\n    # Utilize binary search since hashes are sorted\n    index = np.searchsorted(self._hashes, hash_value)\n    if index &lt; len(self._hashes) and self._hashes[index] == hash_value:\n        return True\n    return False\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__iadd__","title":"<code>__iadd__(other)</code>","text":"<p>Implements the += operator. Includes all unique hashes from both signatures and sums their abundances where hashes overlap, modifying self in-place.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Updated self after addition.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __iadd__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the += operator.\n    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n    modifying self in-place.\n\n    Returns:\n        SnipeSig: Updated self after addition.\n    \"\"\"\n    union_sig = self.union_sigs(other)\n    self._update_from_union(union_sig)\n    return self\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__init__","title":"<code>__init__(*, sourmash_sig, ksize=51, scale=10000, sig_type=SigType.SAMPLE, enable_logging=False, **kwargs)</code>","text":"<p>Initialize the SnipeSig with a sourmash signature object or a path to a signature.</p> <p>Parameters:</p> Name Type Description Default <code>sourmash_sig</code> <code>str or SourmashSignature</code> <p>A path to a signature file or a signature object.</p> required <code>ksize</code> <code>int</code> <p>K-mer size.</p> <code>51</code> <code>scale</code> <code>int</code> <p>Scale value.</p> <code>10000</code> <code>sig_type</code> <code>SigType</code> <p>Type of the signature.</p> <code>SAMPLE</code> <code>enable_logging</code> <code>bool</code> <p>Flag to enable detailed logging.</p> <code>False</code> <code>**kwargs</code> <p>Additional keyword arguments.</p> <code>{}</code> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __init__(self, *, sourmash_sig: Union[str, sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature],\n             ksize: int = 51, scale: int = 10000, sig_type=SigType.SAMPLE, enable_logging: bool = False, **kwargs):\n    r\"\"\"\n    Initialize the SnipeSig with a sourmash signature object or a path to a signature.\n\n    Parameters:\n        sourmash_sig (str or sourmash.signature.SourmashSignature): A path to a signature file or a signature object.\n        ksize (int): K-mer size.\n        scale (int): Scale value.\n        sig_type (SigType): Type of the signature.\n        enable_logging (bool): Flag to enable detailed logging.\n        **kwargs: Additional keyword arguments.\n    \"\"\"\n    # Initialize logging based on the flag\n    self.logger = logging.getLogger(self.__class__.__name__)\n\n    # Configure the logger\n    if enable_logging:\n        self.logger.setLevel(logging.DEBUG)\n        if not self.logger.hasHandlers():\n            # Create console handler\n            ch = logging.StreamHandler()\n            ch.setLevel(logging.DEBUG)\n            # Create formatter\n            formatter = logging.Formatter('%(asctime)s - %(name)s - %(levelname)s - %(message)s')\n            # Add formatter to handler\n            ch.setFormatter(formatter)\n            # Add handler to logger\n            self.logger.addHandler(ch)\n        self.logger.debug(\"Logging is enabled for SnipeSig.\")\n    else:\n        self.logger.setLevel(logging.CRITICAL)\n\n    # Initialize internal variables\n    self.logger.debug(\"Initializing SnipeSig with sourmash_sig: %s\", sourmash_sig)\n\n    self._scale = scale\n    self._ksize = ksize\n    self._md5sum = None\n    self._hashes = np.array([], dtype=np.uint64)\n    self._abundances = np.array([], dtype=np.uint32)\n    self._type = sig_type\n    self._name = None\n    self._filename = None\n    self._track_abundance = False\n\n    sourmash_sigs: Dict[str, sourmash.signature.SourmashSignature] = {}\n    _sourmash_sig: Union[sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature] = None\n\n    self.chr_to_sig: Dict[str, SnipeSig] = {}\n\n\n    self.logger.debug(\"Proceeding with a sigtype of %s\", sig_type)\n\n    if not isinstance(sourmash_sig, (str, sourmash.signature.SourmashSignature, sourmash.signature.FrozenSourmashSignature)):\n        # if the str is not a file path\n        self.logger.error(\"Invalid type for sourmash_sig: %s\", type(sourmash_sig).__name__)\n        raise TypeError(f\"sourmash_sig must be a file path, sourmash.signature.SourmashSignature, or Frozensourmash_signature, got {type(sourmash_sig).__name__}\")\n\n    # Case 1: If sourmash_sig is already a valid sourmash signature object\n    if isinstance(sourmash_sig, (sourmash.signature.FrozenSourmashSignature, sourmash.signature.SourmashSignature)):\n        self.logger.debug(\"Loaded sourmash signature directly from object.\")\n        sourmash_sigs = {sourmash_sig.name: sourmash_sig}\n\n    # Case 2: If sourmash_sig is a string, try to load as JSON or a file\n    elif isinstance(sourmash_sig, str):\n        self.logger.debug(\"Attempting to load sourmash signature from string input.\")\n\n        # First, try loading from JSON\n        sourmash_sigs = self._try_load_from_json(sourmash_sig)\n        self.logger.debug(\"Loaded sourmash signature from JSON: %s\", sourmash_sigs)\n\n        # If JSON loading fails, try loading from file\n        if not sourmash_sigs:\n            sourmash_sigs = self._try_load_from_file(sourmash_sig)\n\n        # If both attempts fail, raise an error\n        if not sourmash_sigs:\n            self.logger.error(\"Failed to load sourmash signature from the provided string.\")\n            raise ValueError(\"An unexpected error occurred while loading the sourmash signature.\")\n\n    if sig_type == SigType.SAMPLE or sig_type == SigType.AMPLICON:\n        if len(sourmash_sigs) &gt; 1:\n            self.logger.debug(\"Multiple signatures found in the input. Expected a single sample signature.\")\n            # not supported at this time\n            raise ValueError(\"Loading multiple sample signatures is not supported at this time.\")\n        elif len(sourmash_sigs) == 1:\n            self.logger.debug(\"Found a single signature in the sample sig input; Will use this signature.\")\n            _sourmash_sig = list(sourmash_sigs.values())[0]\n        else:\n            self.logger.debug(\"No signature found in the input. Expected a single sample signature.\")\n            raise ValueError(\"No signature found in the input. Expected a single sample signature.\")\n\n    elif sig_type == SigType.GENOME:\n        if len(sourmash_sigs) &gt; 1:\n            for signame, sig in sourmash_sigs.items():\n                self.logger.debug(f\"Iterating over signature: {signame}\")\n                if signame.endswith(\"-snipegenome\"):\n                    sig = sig.to_mutable()\n                    sig.name = sig.name.replace(\"-snipegenome\", \"\")\n                    self.logger.debug(\"Found a genome signature with the snipe suffix `-snipegenome`. Restoring original name `%s`.\", sig.name)\n                    _sourmash_sig = sig\n                elif signame.startswith(\"sex-\"):\n                    self.logger.debug(\"Found a sex chr signature %s\", signame)\n                    sig = sig.to_mutable()\n                    sig.name = signame.replace(\"sex-\",\"\")\n                    self.chr_to_sig[sig.name] = SnipeSig(sourmash_sig=sig, sig_type=SigType.AMPLICON, enable_logging=enable_logging)\n                elif signame.startswith(\"autosome-\"):\n                    self.logger.debug(\"Found an autosome signature %s\", signame)\n                    sig = sig.to_mutable()\n                    sig.name = signame.replace(\"autosome-\",\"\")\n                    self.chr_to_sig[sig.name] = SnipeSig(sourmash_sig=sig, sig_type=SigType.AMPLICON, enable_logging=enable_logging)\n                else:\n                    continue\n            else:\n                if not _sourmash_sig:\n                    self.logger.debug(\"Found multiple signature per the genome file, but none with the snipe suffix `-snipegenome`.\")\n                    raise ValueError(\"Found multiple signature per the genome file, but none with the snipe suffix `-snipegenome`.\")\n        elif len(sourmash_sigs) == 1:\n            self.logger.debug(\"Found a single signature in the genome sig input; Will use this signature.\")\n            _sourmash_sig = list(sourmash_sigs.values())[0]\n    else:\n        self.logger.debug(\"Unknown sigtype: %s\", sig_type)\n        raise ValueError(f\"Unknown sigtype: {sig_type}\")\n\n    self.logger.debug(\"Length of currently loaded signature: %d, with name: %s\", len(_sourmash_sig), _sourmash_sig.name)\n\n    # Extract properties from the loaded signature\n    self._ksize = _sourmash_sig.minhash.ksize\n    self._scale = _sourmash_sig.minhash.scaled\n    self._md5sum = _sourmash_sig.md5sum()\n    self._name = _sourmash_sig.name\n    self._filename = _sourmash_sig.filename\n    self._track_abundance = _sourmash_sig.minhash.track_abundance\n\n    # If the signature does not track abundance, assume abundance of 1 for all hashes\n    if not self._track_abundance:\n        self.logger.debug(\"Signature does not track abundance. Setting all abundances to 1.\")\n        self._abundances = np.ones(len(_sourmash_sig.minhash.hashes), dtype=np.uint32)\n        # self._track_abundance = True\n    else:\n        self._abundances = np.array(list(_sourmash_sig.minhash.hashes.values()), dtype=np.uint32)\n\n    self._hashes = np.array(list(_sourmash_sig.minhash.hashes.keys()), dtype=np.uint64)\n\n    # Sort the hashes and rearrange abundances accordingly\n    sorted_indices = np.argsort(self._hashes)\n    self._hashes = self._hashes[sorted_indices]\n    self._abundances = self._abundances[sorted_indices]\n\n    self.logger.debug(\n        \"Loaded sourmash signature from file: %s, name: %s, md5sum: %s, ksize: %d, scale: %d, \"\n        \"track_abundance: %s, type: %s, length: %d\",\n        self._filename, self._name, self._md5sum, self._ksize, self._scale,\n        self._track_abundance, self._type, len(self._hashes)\n    )\n    self.logger.debug(\"Hashes sorted during initialization.\")\n    self.logger.debug(\"Sourmash signature loading completed successfully.\")\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__ior__","title":"<code>__ior__(other)</code>","text":"<p>Implements the |= operator. Includes all unique hashes from both signatures and sums their abundances where hashes overlap, modifying self in-place.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Updated self after union.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __ior__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the |= operator.\n    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n    modifying self in-place.\n\n    Returns:\n        SnipeSig: Updated self after union.\n    \"\"\"\n    union_sig = self.union_sigs(other)\n    self._update_from_union(union_sig)\n    return self\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__isub__","title":"<code>__isub__(other)</code>","text":"<p>Implements the -= operator. Removes hashes present in other from self, keeping abundances from self, modifying self in-place.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Updated self after difference.</p> <p>Raises:</p> Type Description <code>RuntimeError</code> <p>If zero hashes remain after difference.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __isub__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the -= operator.\n    Removes hashes present in other from self, keeping abundances from self,\n    modifying self in-place.\n\n    Returns:\n        SnipeSig: Updated self after difference.\n\n    Raises:\n        RuntimeError: If zero hashes remain after difference.\n    \"\"\"\n    difference_sig = self.difference_sigs(other)\n    self._update_from_union(difference_sig)\n    return self\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__iter__","title":"<code>__iter__()</code>","text":"<p>Iterate over the hashes and their abundances.</p> <p>Yields:</p> Name Type Description <code>tuple</code> <code>tuple</code> <p>A tuple containing (hash, abundance).</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __iter__(self) -&gt; Iterator[tuple]:\n    r\"\"\"\n    Iterate over the hashes and their abundances.\n\n    Yields:\n        tuple: A tuple containing (hash, abundance).\n    \"\"\"\n    for h, a in zip(self._hashes, self._abundances):\n        yield (h, a)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__ixor__","title":"<code>__ixor__(other)</code>","text":"<p>Implements the ^= operator. Keeps unique hashes from each signature with their respective abundances, modifying self in-place.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Updated self after symmetric difference.</p> <p>Raises:</p> Type Description <code>RuntimeError</code> <p>If zero hashes remain after symmetric difference.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __ixor__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the ^= operator.\n    Keeps unique hashes from each signature with their respective abundances, modifying self in-place.\n\n    Returns:\n        SnipeSig: Updated self after symmetric difference.\n\n    Raises:\n        RuntimeError: If zero hashes remain after symmetric difference.\n    \"\"\"\n    symmetric_diff_sig = self.symmetric_difference_sigs(other)\n    self._update_from_union(symmetric_diff_sig)\n    return self\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__len__","title":"<code>__len__()</code>","text":"<p>Return the number of hashes in the signature.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __len__(self) -&gt; int:\n    r\"\"\"Return the number of hashes in the signature.\"\"\"\n    return len(self._hashes)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__or__","title":"<code>__or__(other)</code>","text":"<p>Implements the | operator. Includes all unique hashes from both signatures and sums their abundances where hashes overlap, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Union of self and other.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __or__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the | operator.\n    Includes all unique hashes from both signatures and sums their abundances where hashes overlap,\n    returning a new signature.\n\n    Returns:\n        SnipeSig: Union of self and other.\n    \"\"\"\n    return self.union_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__radd__","title":"<code>__radd__(other)</code>","text":"<p>Implements the right-hand + operator to support sum().</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Union of self and other.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __radd__(self, other: Union[int, 'SnipeSig']) -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the right-hand + operator to support sum().\n\n    Returns:\n        SnipeSig: Union of self and other.\n    \"\"\"\n    return self.__radd_sum__(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__radd_sum__","title":"<code>__radd_sum__(other)</code>","text":"<p>Internal helper method to support the sum() function.</p> <p>Parameters:</p> Name Type Description Default <code>other</code> <code>int or SnipeSig</code> <p>The other object to add. If other is 0, return self.</p> required <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>The result of the addition.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __radd_sum__(self, other: Union[int, 'SnipeSig']) -&gt; 'SnipeSig':\n    r\"\"\"\n    Internal helper method to support the sum() function.\n\n    Parameters:\n        other (int or SnipeSig): The other object to add. If other is 0, return self.\n\n    Returns:\n        SnipeSig: The result of the addition.\n    \"\"\"\n    if other == 0:\n        return self\n    if not isinstance(other, SnipeSig):\n        raise TypeError(f\"Unsupported operand type(s) for +: 'SnipeSig' and '{type(other).__name__}'\")\n    return self.union_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__sub__","title":"<code>__sub__(other)</code>","text":"<p>Implements the - operator. Removes hashes present in other from self, keeping abundances from self, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Difference of self and other.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __sub__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the - operator.\n    Removes hashes present in other from self, keeping abundances from self,\n    returning a new signature.\n\n    Returns:\n        SnipeSig: Difference of self and other.\n    \"\"\"\n    return self.difference_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__verify_matching_ksize_scale","title":"<code>__verify_matching_ksize_scale(other)</code>","text":"<p>Verify that the ksize and scale match between two signatures.</p> <p>Parameters:</p> Name Type Description Default <code>other</code> <code>SnipeSig</code> <p>The other signature to compare.</p> required <p>Raises:</p> Type Description <code>ValueError</code> <p>If ksize or scale do not match.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __verify_matching_ksize_scale(self, other: 'SnipeSig'):\n    r\"\"\"\n    Verify that the ksize and scale match between two signatures.\n\n    Parameters:\n        other (SnipeSig): The other signature to compare.\n\n    Raises:\n        ValueError: If ksize or scale do not match.\n    \"\"\"\n    if self._ksize != other.ksize:\n        _e_msg = f\"K-mer size does not match between the two signatures: {self._ksize} vs {other.ksize}.\"\n        self.logger.error(_e_msg)\n        raise ValueError(_e_msg)\n    if self._scale != other.scale:\n        _e_msg = f\"Scale value does not match between the two signatures: {self._scale} vs {other.scale}.\"\n        self.logger.error(_e_msg)\n        raise ValueError(_e_msg)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__verify_snipe_signature","title":"<code>__verify_snipe_signature(other)</code>","text":"<p>Verify that the other object is a SnipeSig instance.</p> <p>Parameters:</p> Name Type Description Default <code>other</code> <code>SnipeSig</code> <p>The other signature to verify.</p> required <p>Raises:</p> Type Description <code>ValueError</code> <p>If the other object is not a SnipeSig instance.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __verify_snipe_signature(self, other: 'SnipeSig'):\n    r\"\"\"\n    Verify that the other object is a SnipeSig instance.\n\n    Parameters:\n        other (SnipeSig): The other signature to verify.\n\n    Raises:\n        ValueError: If the other object is not a SnipeSig instance.\n    \"\"\"\n    if not isinstance(other, SnipeSig):\n        msg = f\"Provided sig ({type(other).__name__}) is not a SnipeSig instance.\"\n        self.logger.error(msg)\n        raise ValueError(msg)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.__xor__","title":"<code>__xor__(other)</code>","text":"<p>Implements the ^ operator. Keeps unique hashes from each signature with their respective abundances, returning a new signature.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>Symmetric difference of self and other.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def __xor__(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Implements the ^ operator.\n    Keeps unique hashes from each signature with their respective abundances, returning a new signature.\n\n    Returns:\n        SnipeSig: Symmetric difference of self and other.\n    \"\"\"\n    return self.symmetric_difference_sigs(other)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.common_hashes","title":"<code>common_hashes(signatures, name='common_hashes_signature', filename=None, enable_logging=False)</code>  <code>classmethod</code>","text":"<p>Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.</p> <p>This method uses a heap-based multi-way merge algorithm for efficient computation, especially when handling a large number of signatures with sorted hashes.</p> <p>Mathematical Explanation:</p> <p>Given signatures \\( A_1, A_2, \\dots, A_n \\) with hash sets \\( H_1, H_2, \\dots, H_n \\), the intersection signature \\( C \\) has:</p> <ul> <li> <p>Hash set: $$ H_C = \\bigcap_{i=1}^{n} H_i $$</p> </li> <li> <p>Abundance function: $$ a_C(h) = \\min_{i=1}^{n} a_i(h), \\quad \\text{for } h \\in H_C $$</p> </li> </ul> <p>Parameters:     - <code>signatures (List[SnipeSig])</code>: List of <code>SnipeSig</code> instances to compute the intersection.     - <code>name (str)</code>: Optional name for the resulting signature.     - <code>filename (str)</code>: Optional filename for the resulting signature.     - <code>enable_logging (bool)</code>: Flag to enable detailed logging.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the intersection of the signatures.</p> <p>Raises:     - <code>ValueError</code>: If the signatures list is empty or if <code>ksize</code>/<code>scale</code> do not match across signatures.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>@classmethod\ndef common_hashes(cls, signatures: List['SnipeSig'], name: str = \"common_hashes_signature\",\n                  filename: str = None, enable_logging: bool = False) -&gt; 'SnipeSig':\n    r\"\"\"\n    Compute the intersection of multiple SnipeSig instances, returning a new SnipeSig containing\n    only the hashes present in all signatures, with abundances set to the minimum abundance across signatures.\n\n    This method uses a heap-based multi-way merge algorithm for efficient computation,\n    especially when handling a large number of signatures with sorted hashes.\n\n    **Mathematical Explanation**:\n\n    Given signatures \\( A_1, A_2, \\dots, A_n \\) with hash sets \\( H_1, H_2, \\dots, H_n \\),\n    the intersection signature \\( C \\) has:\n\n    - Hash set:\n    $$\n    H_C = \\bigcap_{i=1}^{n} H_i\n    $$\n\n    - Abundance function:\n    $$\n    a_C(h) = \\min_{i=1}^{n} a_i(h), \\quad \\text{for } h \\in H_C\n    $$\n\n    **Parameters**:\n        - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to compute the intersection.\n        - `name (str)`: Optional name for the resulting signature.\n        - `filename (str)`: Optional filename for the resulting signature.\n        - `enable_logging (bool)`: Flag to enable detailed logging.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the signatures.\n\n    **Raises**:\n        - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.\n    \"\"\"\n    if not signatures:\n        raise ValueError(\"No signatures provided for intersection.\")\n\n    # Verify that all signatures have the same ksize and scale\n    first_sig = signatures[0]\n    ksize = first_sig.ksize\n    scale = first_sig.scale\n    for sig in signatures[1:]:\n        if sig.ksize != ksize or sig.scale != scale:\n            raise ValueError(\"All signatures must have the same ksize and scale.\")\n\n    num_signatures = len(signatures)\n    iterators = []\n    for sig in signatures:\n        it = iter(zip(sig.hashes, sig.abundances))\n        try:\n            first_hash, first_abundance = next(it)\n            iterators.append((first_hash, first_abundance, it))\n        except StopIteration:\n            # One of the signatures is empty; intersection is empty\n            return cls.create_from_hashes_abundances(\n                hashes=np.array([], dtype=np.uint64),\n                abundances=np.array([], dtype=np.uint32),\n                ksize=ksize,\n                scale=scale,\n                name=name,\n                filename=filename,\n                enable_logging=enable_logging\n            )\n\n    # Initialize the heap with the first element from each iterator\n    heap = []\n    for idx, (hash_val, abundance, it) in enumerate(iterators):\n        heap.append((hash_val, abundance, idx))\n    heapq.heapify(heap)\n\n    common_hashes = []\n    common_abundances = []\n\n    while heap:\n        # Pop all entries with the smallest hash\n        current_hash, current_abundance, idx = heapq.heappop(heap)\n        same_hash_entries = [(current_hash, current_abundance, idx)]\n\n        # Collect all entries in the heap that have the same current_hash\n        while heap and heap[0][0] == current_hash:\n            h, a, i = heapq.heappop(heap)\n            same_hash_entries.append((h, a, i))\n\n        if len(same_hash_entries) == num_signatures:\n            # The current_hash is present in all signatures\n            # Take the minimum abundance across signatures\n            min_abundance = min(entry[1] for entry in same_hash_entries)\n            common_hashes.append(current_hash)\n            common_abundances.append(min_abundance)\n\n        # Push the next element from each iterator that had the current_hash\n        for entry in same_hash_entries:\n            h, a, i = entry\n            try:\n                next_hash, next_abundance = next(iterators[i][2])\n                heapq.heappush(heap, (next_hash, next_abundance, i))\n            except StopIteration:\n                pass  # Iterator exhausted\n\n    # Convert the results to NumPy arrays\n    if not common_hashes:\n        # No common hashes found\n        unique_hashes = np.array([], dtype=np.uint64)\n        unique_abundances = np.array([], dtype=np.uint32)\n    else:\n        unique_hashes = np.array(common_hashes, dtype=np.uint64)\n        unique_abundances = np.array(common_abundances, dtype=np.uint32)\n\n    # Create a new SnipeSig instance from the common hashes and abundances\n    common_signature = cls.create_from_hashes_abundances(\n        hashes=unique_hashes,\n        abundances=unique_abundances,\n        ksize=ksize,\n        scale=scale,\n        name=name,\n        filename=filename,\n        enable_logging=enable_logging\n    )\n\n    return common_signature\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.copy","title":"<code>copy()</code>","text":"<p>Create a copy of the current SnipeSig instance.</p> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>A new instance that is a copy of self.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def copy(self) -&gt; 'SnipeSig':\n    r\"\"\"\n    Create a copy of the current SnipeSig instance.\n\n    Returns:\n        SnipeSig: A new instance that is a copy of self.\n    \"\"\"\n    return SnipeSig(sourmash_sig=self.export_to_string(), sig_type=self.sigtype, enable_logging=self.logger.level &lt;= logging.DEBUG)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.count_singletons","title":"<code>count_singletons()</code>","text":"<p>Return the number of hashes with abundance equal to 1.</p> <p>Returns:</p> Name Type Description <code>int</code> <code>int</code> <p>Number of singletons.</p> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the signature does not track abundance.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def count_singletons(self) -&gt; int:\n    r\"\"\"\n    Return the number of hashes with abundance equal to 1.\n\n    Returns:\n        int: Number of singletons.\n\n    Raises:\n        ValueError: If the signature does not track abundance.\n    \"\"\"\n    self._validate_abundance_operation(None, \"count singletons\")\n\n    count = np.sum(self._abundances == 1)\n    self.logger.debug(\"Number of singletons (abundance == 1): %d\", count)\n    return int(count)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.create_from_hashes_abundances","title":"<code>create_from_hashes_abundances(hashes, abundances, ksize, scale, name=None, filename=None, enable_logging=False, sig_type=SigType.SAMPLE)</code>  <code>classmethod</code>","text":"<p>Internal method to create a SnipeSig instance from hashes and abundances.</p> <p>Parameters:</p> Name Type Description Default <code>hashes</code> <code>ndarray</code> <p>Array of hash values.</p> required <code>abundances</code> <code>ndarray</code> <p>Array of abundance values corresponding to the hashes.</p> required <code>ksize</code> <code>int</code> <p>K-mer size.</p> required <code>scale</code> <code>int</code> <p>Scale value.</p> required <code>name</code> <code>str</code> <p>Optional name for the signature.</p> <code>None</code> <code>filename</code> <code>str</code> <p>Optional filename for the signature.</p> <code>None</code> <code>sig_type</code> <code>SigType</code> <p>Type of the signature.</p> <code>SAMPLE</code> <code>enable_logging</code> <code>bool</code> <p>Flag to enable logging.</p> <code>False</code> <p>Returns:</p> Name Type Description <code>SnipeSig</code> <code>SnipeSig</code> <p>A new SnipeSig instance.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>@classmethod\ndef create_from_hashes_abundances(cls, hashes: np.ndarray, abundances: np.ndarray,\n                                  ksize: int, scale: int, name: str = None,\n                                  filename: str = None, enable_logging: bool = False, sig_type: SigType = SigType.SAMPLE) -&gt; 'SnipeSig':\n    \"\"\"\n    Internal method to create a SnipeSig instance from hashes and abundances.\n\n    Parameters:\n        hashes (np.ndarray): Array of hash values.\n        abundances (np.ndarray): Array of abundance values corresponding to the hashes.\n        ksize (int): K-mer size.\n        scale (int): Scale value.\n        name (str): Optional name for the signature.\n        filename (str): Optional filename for the signature.\n        sig_type (SigType): Type of the signature.\n        enable_logging (bool): Flag to enable logging.\n\n    Returns:\n        SnipeSig: A new SnipeSig instance.\n    \"\"\"\n    # Create a mock sourmash signature object\n    mh = sourmash.minhash.MinHash(n=0, ksize=ksize, scaled=scale, track_abundance=True)\n    mh.set_abundances(dict(zip(hashes, abundances)))\n    sig = sourmash.signature.SourmashSignature(mh, name=name or \"\", filename=filename or \"\")\n    return cls(sourmash_sig=sig, sig_type=sig_type, enable_logging=enable_logging)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.difference_sigs","title":"<code>difference_sigs(other)</code>","text":"<p>Compute the difference of the current signature with another signature.</p> <p>This method removes hashes that are present in the other signature from self, keeping the abundances from self.</p> <p>Mathematical Explanation:</p> <p>Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\), and abundance function \\( a_A(h) \\), the difference signature \\( C \\) has:</p> <ul> <li> <p>Hash set: $$ H_C = H_A \\setminus H_B $$</p> </li> <li> <p>Abundance function: $$ a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C $$</p> </li> </ul> <p>Parameters:     - <code>other (SnipeSig)</code>: Another <code>SnipeSig</code> instance to subtract from the current signature.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the difference of the two signatures.</p> <p>Raises:     - <code>ValueError</code>: If <code>ksize</code> or <code>scale</code> do not match between signatures.     - <code>RuntimeError</code>: If zero hashes remain after difference.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def difference_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Compute the difference of the current signature with another signature.\n\n    This method removes hashes that are present in the other signature from self,\n    keeping the abundances from self.\n\n    **Mathematical Explanation**:\n\n    Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n    and abundance function \\( a_A(h) \\), the difference signature \\( C \\) has:\n\n    - Hash set:\n    $$\n    H_C = H_A \\setminus H_B\n    $$\n\n    - Abundance function:\n    $$\n    a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C\n    $$\n\n    **Parameters**:\n        - `other (SnipeSig)`: Another `SnipeSig` instance to subtract from the current signature.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the difference of the two signatures.\n\n    **Raises**:\n        - `ValueError`: If `ksize` or `scale` do not match between signatures.\n        - `RuntimeError`: If zero hashes remain after difference.\n    \"\"\"\n    self.__verify_snipe_signature(other)\n    self.__verify_matching_ksize_scale(other)\n\n    self.logger.debug(\"Differencing signatures.\")\n\n    # Use numpy's setdiff1d function\n    diff_hashes = np.setdiff1d(self._hashes, other._hashes, assume_unique=True)\n\n    if diff_hashes.size == 0:\n        _e_msg = f\"Difference operation resulted in zero hashes, which is not allowed for {self._name} and {other._name}.\"\n        self.logger.warning(_e_msg)\n\n    # Get the indices of the hashes in self\n    mask = np.isin(self._hashes, diff_hashes, assume_unique=True)\n    diff_abundances = self._abundances[mask]\n\n    self.logger.debug(\"Difference operation completed. Remaining hashes: %d\", len(diff_hashes))\n\n    # Create a new SnipeSig instance\n    return self.create_from_hashes_abundances(\n        hashes=diff_hashes,\n        abundances=diff_abundances,\n        ksize=self._ksize,\n        scale=self._scale,\n        name=f\"{self._name}_difference_{other._name}\",\n        filename=None,\n        enable_logging=self.logger.level &lt;= logging.DEBUG\n    )\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.export","title":"<code>export(path)</code>","text":"<p>Export the signature to a file.</p> <p>Parameters:</p> Name Type Description Default <code>path</code> <code>str</code> <p>The path to save the signature to.</p> required Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def export(self, path) -&gt; None:\n    r\"\"\"\n    Export the signature to a file.\n\n    Parameters:\n        path (str): The path to save the signature to.\n    \"\"\"\n    self._convert_to_sourmash_signature()\n    with open(str(path), \"wb\") as fp:\n        sourmash.signature.save_signatures_to_json([self.sourmash_sig], fp)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.export_to_string","title":"<code>export_to_string()</code>","text":"<p>Export the signature to a JSON string.</p> <p>Returns:</p> Name Type Description <code>str</code> <p>JSON string representation of the signature.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def export_to_string(self):\n    r\"\"\"\n    Export the signature to a JSON string.\n\n    Returns:\n        str: JSON string representation of the signature.\n    \"\"\"\n    self._convert_to_sourmash_signature()\n    return sourmash.signature.save_signatures_to_json([self.sourmash_sig]).decode('utf-8')\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.get_info","title":"<code>get_info()</code>","text":"<p>Get information about the signature.</p> <p>Returns:</p> Name Type Description <code>dict</code> <code>dict</code> <p>A dictionary containing signature information.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def get_info(self) -&gt; dict:\n    r\"\"\"\n    Get information about the signature.\n\n    Returns:\n        dict: A dictionary containing signature information.\n    \"\"\"\n    info = {\n        \"name\": self._name,\n        \"filename\": self._filename,\n        \"md5sum\": self._md5sum,\n        \"ksize\": self._ksize,\n        \"scale\": self._scale,\n        \"track_abundance\": self._track_abundance,\n        \"sigtype\": self._type,\n        \"num_hashes\": len(self._hashes)\n    }\n    return info\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.get_name","title":"<code>get_name()</code>","text":"<p>Get the name of the signature.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def get_name(self) -&gt; str:\n    r\"\"\"Get the name of the signature.\"\"\"\n    return self._name\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.get_unique_signatures","title":"<code>get_unique_signatures(signatures)</code>  <code>staticmethod</code>","text":"<p>Extract unique signatures from a dictionary of SnipeSig instances.</p> <p>For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.</p> <p>Parameters:</p> Name Type Description Default <code>signatures</code> <code>Dict[str, SnipeSig]</code> <p>A dictionary mapping signature names to SnipeSig instances.</p> required <p>Returns:</p> Type Description <code>Dict[str, SnipeSig]</code> <p>Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.</p> <p>Raises:</p> Type Description <code>ValueError</code> <p>If the input dictionary is empty or if signatures have mismatched ksize/scale.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>@staticmethod\ndef get_unique_signatures(signatures: Dict[str, 'SnipeSig']) -&gt; Dict[str, 'SnipeSig']:\n    \"\"\"\n    Extract unique signatures from a dictionary of SnipeSig instances.\n\n    For each signature, the unique_sig contains only the hashes that do not overlap with any other signature.\n\n    Parameters:\n        signatures (Dict[str, SnipeSig]): A dictionary mapping signature names to SnipeSig instances.\n\n    Returns:\n        Dict[str, SnipeSig]: A dictionary mapping signature names to their unique SnipeSig instances.\n\n    Raises:\n        ValueError: If the input dictionary is empty or if signatures have mismatched ksize/scale.\n    \"\"\"\n    if not signatures:\n        raise ValueError(\"The input signatures dictionary is empty.\")\n\n    # Extract ksize and scale from the first signature\n    first_name, first_sig = next(iter(signatures.items()))\n    ksize = first_sig.ksize\n    scale = first_sig.scale\n\n    # Verify that all signatures have the same ksize and scale\n    for name, sig in signatures.items():\n        if sig.ksize != ksize or sig.scale != scale:\n            raise ValueError(f\"Signature '{name}' has mismatched ksize or scale.\")\n\n    # Aggregate all hashes from all signatures\n    all_hashes = np.concatenate([sig.hashes for sig in signatures.values()])\n\n    # Count the occurrences of each hash\n    unique_hashes, counts = np.unique(all_hashes, return_counts=True)\n\n    # Identify hashes that are unique across all signatures (count == 1)\n    unique_across_all = unique_hashes[counts == 1]\n\n    # Convert to a set for faster membership testing\n    unique_set = set(unique_across_all)\n\n    unique_signatures = {}\n\n    for name, sig in signatures.items():\n        # Find hashes in the current signature that are unique across all signatures\n        mask_unique = np.isin(sig.hashes, list(unique_set))\n\n        # Extract unique hashes and their abundances\n        unique_hashes_sig = sig.hashes[mask_unique]\n        unique_abundances_sig = sig.abundances[mask_unique]\n\n        # Create a new SnipeSig instance with the unique hashes and abundances\n        unique_sig = SnipeSig.create_from_hashes_abundances(\n            hashes=unique_hashes_sig,\n            abundances=unique_abundances_sig,\n            ksize=ksize,\n            scale=scale,\n            name=f\"{name}_unique\",\n            filename=None,\n            enable_logging=False,  # Set to True if you want logging for the new signatures\n            sig_type=SigType.SAMPLE  # Adjust sig_type as needed\n        )\n\n        unique_signatures[name] = unique_sig\n\n    return unique_signatures\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.intersection_sigs","title":"<code>intersection_sigs(other)</code>","text":"<p>Compute the intersection of the current signature with another signature.</p> <p>This method keeps only the hashes that are common to both signatures, and retains the abundances from self.</p> <p>Mathematical Explanation:</p> <p>Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\), and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the intersection signature \\( C \\) has:</p> <ul> <li> <p>Hash set: $$ H_C = H_A \\cap H_B $$</p> </li> <li> <p>Abundance function: $$ a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C $$</p> </li> </ul> <p>Parameters:     - <code>other (SnipeSig)</code>: Another <code>SnipeSig</code> instance to intersect with.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the intersection of the two signatures.</p> <p>Raises:     - <code>ValueError</code>: If <code>ksize</code> or <code>scale</code> do not match between signatures.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def intersection_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Compute the intersection of the current signature with another signature.\n\n    This method keeps only the hashes that are common to both signatures, and retains the abundances from self.\n\n    **Mathematical Explanation**:\n\n    Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n    and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the intersection signature \\( C \\) has:\n\n    - Hash set:\n    $$\n    H_C = H_A \\cap H_B\n    $$\n\n    - Abundance function:\n    $$\n    a_C(h) = a_A(h), \\quad \\text{for } h \\in H_C\n    $$\n\n    **Parameters**:\n        - `other (SnipeSig)`: Another `SnipeSig` instance to intersect with.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the intersection of the two signatures.\n\n    **Raises**:\n        - `ValueError`: If `ksize` or `scale` do not match between signatures.\n    \"\"\"\n    self.__verify_snipe_signature(other)\n    self.__verify_matching_ksize_scale(other)\n\n    self.logger.debug(\"Intersecting signatures.\")\n\n    # Use numpy's intersect1d function\n    common_hashes, self_indices, _ = np.intersect1d(\n        self._hashes, other._hashes, assume_unique=True, return_indices=True\n    )\n\n    if common_hashes.size == 0:\n        self.logger.debug(\"No common hashes found. Returning an empty signature.\")\n        return self.create_from_hashes_abundances(\n            hashes=np.array([], dtype=np.uint64),\n            abundances=np.array([], dtype=np.uint32),\n            ksize=self._ksize,\n            scale=self._scale,\n            name=f\"{self._name}_intersection_{other._name}\",\n            filename=None,\n            enable_logging=self.logger.level &lt;= logging.DEBUG\n        )\n\n    # Get the abundances from self\n    common_abundances = self._abundances[self_indices]\n\n    self.logger.debug(\"Intersection operation completed. Total common hashes: %d\", len(common_hashes))\n\n    # Create a new SnipeSig instance\n    return self.create_from_hashes_abundances(\n        hashes=common_hashes,\n        abundances=common_abundances,\n        ksize=self._ksize,\n        scale=self._scale,\n        name=f\"{self._name}_intersection_{other._name}\",\n        filename=None,\n        enable_logging=self.logger.level &lt;= logging.DEBUG\n    )\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.keep_max_abundance","title":"<code>keep_max_abundance(max_abundance)</code>","text":"<p>Keep only hashes with abundances less than or equal to a maximum threshold.</p> <p>This method removes hashes whose abundances are greater than the specified <code>max_abundance</code>.</p> <p>Mathematical Explanation:</p> <p>The updated hash set \\( H' \\) is: $$ H' = { h \\in H \\mid a(h) \\leq \\text{max_abundance} } $$</p> <p>Parameters:     - <code>max_abundance (int)</code>: The maximum abundance threshold.</p> <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance or if <code>max_abundance</code> is invalid.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def keep_max_abundance(self, max_abundance: int):\n    r\"\"\"\n    Keep only hashes with abundances less than or equal to a maximum threshold.\n\n    This method removes hashes whose abundances are greater than the specified `max_abundance`.\n\n    **Mathematical Explanation**:\n\n    The updated hash set \\( H' \\) is:\n    $$\n    H' = \\{ h \\in H \\mid a(h) \\leq \\text{max\\_abundance} \\}\n    $$\n\n    **Parameters**:\n        - `max_abundance (int)`: The maximum abundance threshold.\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance or if `max_abundance` is invalid.\n    \"\"\"\n    self._validate_abundance_operation(max_abundance, \"keep maximum abundance\")\n\n    mask = self._abundances &lt;= max_abundance\n    self._apply_mask(mask)\n    self.logger.debug(\"Kept hashes with abundance &lt;= %d.\", max_abundance)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.keep_min_abundance","title":"<code>keep_min_abundance(min_abundance)</code>","text":"<p>Keep only hashes with abundances greater than or equal to a minimum threshold.</p> <p>This method removes hashes whose abundances are less than the specified <code>min_abundance</code>.</p> <p>Mathematical Explanation:</p> <p>The updated hash set \\( H' \\) is: $$ H' = { h \\in H \\mid a(h) \\geq \\text{min_abundance} } $$</p> <p>Parameters:     - <code>min_abundance (int)</code>: The minimum abundance threshold.</p> <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance or if <code>min_abundance</code> is invalid.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def keep_min_abundance(self, min_abundance: int):\n    r\"\"\"\n    Keep only hashes with abundances greater than or equal to a minimum threshold.\n\n    This method removes hashes whose abundances are less than the specified `min_abundance`.\n\n    **Mathematical Explanation**:\n\n    The updated hash set \\( H' \\) is:\n    $$\n    H' = \\{ h \\in H \\mid a(h) \\geq \\text{min\\_abundance} \\}\n    $$\n\n    **Parameters**:\n        - `min_abundance (int)`: The minimum abundance threshold.\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance or if `min_abundance` is invalid.\n    \"\"\"\n    self._validate_abundance_operation(min_abundance, \"keep minimum abundance\")\n\n    mask = self._abundances &gt;= min_abundance\n    self._apply_mask(mask)\n    self.logger.debug(\"Kept hashes with abundance &gt;= %d.\", min_abundance)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.reset_abundance","title":"<code>reset_abundance(new_abundance=1)</code>","text":"<p>Reset all abundances to a specified value.</p> <p>This method sets the abundance of every hash in the signature to the specified <code>new_abundance</code> value.</p> <p>Mathematical Explanation:</p> <p>For each hash \\( h \\) in the signature, the abundance function is updated to: $$ a(h) = \\text{new_abundance} $$</p> <p>Parameters:     - <code>new_abundance (int)</code>: The new abundance value to set for all hashes. Default is 1.</p> <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance or if <code>new_abundance</code> is invalid.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def reset_abundance(self, new_abundance: int = 1):\n    r\"\"\"\n    Reset all abundances to a specified value.\n\n    This method sets the abundance of every hash in the signature to the specified `new_abundance` value.\n\n    **Mathematical Explanation**:\n\n    For each hash \\( h \\) in the signature, the abundance function is updated to:\n    $$\n    a(h) = \\text{new\\_abundance}\n    $$\n\n    **Parameters**:\n        - `new_abundance (int)`: The new abundance value to set for all hashes. Default is 1.\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance or if `new_abundance` is invalid.\n    \"\"\"\n\n    self._validate_abundance_operation(new_abundance, \"reset abundance\")\n\n    self._abundances[:] = new_abundance\n    self.logger.debug(\"Reset all abundances to %d.\", new_abundance)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.sum_signatures","title":"<code>sum_signatures(signatures, name='summed_signature', filename=None, enable_logging=False)</code>  <code>classmethod</code>","text":"<p>Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap. This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.</p> \\[ \\text{Sum}(A_1, A_2, \\dots, A_n) = \\bigcup_{i=1}^{n} A_i \\] <p>For each hash \\( h \\), its total abundance is: $$ \\text{abundance}(h) = \\sum_{i=1}^{n} \\text{abundance}_i(h) $$</p> <p>Mathematical Explanation:</p> <ul> <li> <p>Union of Signatures:     The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.</p> </li> <li> <p>Total Abundance Calculation:     For each unique hash \\( h \\), the total abundance is the sum of its abundances across all signatures where it appears.</p> </li> <li> <p>Algorithm Efficiency:     By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.</p> </li> </ul> <p>Parameters:     - <code>signatures (List[SnipeSig])</code>: List of <code>SnipeSig</code> instances to sum.     - <code>name (str)</code>: Optional name for the resulting signature.     - <code>filename (str)</code>: Optional filename for the resulting signature.     - <code>enable_logging (bool)</code>: Flag to enable detailed logging.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the sum of the signatures.</p> <p>Raises:     - <code>ValueError</code>: If the signatures list is empty or if <code>ksize</code>/<code>scale</code> do not match across signatures.     - <code>RuntimeError</code>: If an error occurs during the summation process.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>@classmethod\ndef sum_signatures(cls, signatures: List['SnipeSig'], name: str = \"summed_signature\",\n                   filename: str = None, enable_logging: bool = False) -&gt; 'SnipeSig':\n\n    r\"\"\"\n    Sum multiple SnipeSig instances by including all unique hashes and summing their abundances where hashes overlap.\n    This method utilizes a heap-based multi-way merge algorithm for enhanced efficiency when handling thousands of signatures.\n\n    $$\n    \\text{Sum}(A_1, A_2, \\dots, A_n) = \\bigcup_{i=1}^{n} A_i\n    $$\n\n    For each hash \\( h \\), its total abundance is:\n    $$\n    \\text{abundance}(h) = \\sum_{i=1}^{n} \\text{abundance}_i(h)\n    $$\n\n    **Mathematical Explanation**:\n\n    - **Union of Signatures**:\n        The summation of signatures involves creating a union of all unique k-mers (hashes) present across the input signatures.\n\n    - **Total Abundance Calculation**:\n        For each unique hash \\( h \\), the total abundance is the sum of its abundances across all signatures where it appears.\n\n    - **Algorithm Efficiency**:\n        By using a min-heap to perform a multi-way merge of sorted hash arrays, the method ensures that each hash is processed in ascending order without the need to store all hashes in memory simultaneously.\n\n    **Parameters**:\n        - `signatures (List[SnipeSig])`: List of `SnipeSig` instances to sum.\n        - `name (str)`: Optional name for the resulting signature.\n        - `filename (str)`: Optional filename for the resulting signature.\n        - `enable_logging (bool)`: Flag to enable detailed logging.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the sum of the signatures.\n\n    **Raises**:\n        - `ValueError`: If the signatures list is empty or if `ksize`/`scale` do not match across signatures.\n        - `RuntimeError`: If an error occurs during the summation process.\n    \"\"\"\n    if not signatures:\n        raise ValueError(\"No signatures provided for summation.\")\n\n    # Verify that all signatures have the same ksize, scale, and track_abundance\n    first_sig = signatures[0]\n    ksize = first_sig.ksize\n    scale = first_sig.scale\n    track_abundance = first_sig.track_abundance\n\n    for sig in signatures[1:]:\n        if sig.ksize != ksize or sig.scale != scale:\n            raise ValueError(\"All signatures must have the same ksize and scale.\")\n        if sig.track_abundance != track_abundance:\n            raise ValueError(\"All signatures must have the same track_abundance setting.\")\n\n    # Initialize iterators for each signature's hashes and abundances\n    iterators = []\n    for sig in signatures:\n        it = iter(zip(sig.hashes, sig.abundances))\n        try:\n            first_hash, first_abundance = next(it)\n            iterators.append((first_hash, first_abundance, it))\n        except StopIteration:\n            continue  # Skip empty signatures\n\n    if not iterators:\n        raise ValueError(\"All provided signatures are empty.\")\n\n    # Initialize the heap with the first element from each iterator\n    heap = []\n    for idx, (hash_val, abundance, it) in enumerate(iterators):\n        heap.append((hash_val, abundance, idx))\n    heapq.heapify(heap)\n\n    # Prepare lists to collect the summed hashes and abundances\n    summed_hashes = []\n    summed_abundances = []\n\n    while heap:\n        current_hash, current_abundance, idx = heapq.heappop(heap)\n        # Initialize total abundance for the current_hash\n        total_abundance = current_abundance\n\n        # Check if the next element in the heap has the same hash\n        while heap and heap[0][0] == current_hash:\n            _, abundance, same_idx = heapq.heappop(heap)\n            total_abundance += abundance\n            # Push the next element from the same iterator\n            try:\n                next_hash, next_abundance = next(iterators[same_idx][2])\n                heapq.heappush(heap, (next_hash, next_abundance, same_idx))\n            except StopIteration:\n                pass  # No more elements in this iterator\n\n        # Append the summed hash and abundance\n        summed_hashes.append(current_hash)\n        summed_abundances.append(total_abundance)\n\n        # Push the next element from the current iterator\n        try:\n            next_hash, next_abundance = next(iterators[idx][2])\n            heapq.heappush(heap, (next_hash, next_abundance, idx))\n        except StopIteration:\n            pass  # No more elements in this iterator\n\n    # Convert the results to NumPy arrays for efficient storage and processing\n    summed_hashes = np.array(summed_hashes, dtype=np.uint64)\n    summed_abundances = np.array(summed_abundances, dtype=np.uint32)\n\n    # Handle potential overflow by capping at the maximum value of uint32\n    summed_abundances = np.minimum(summed_abundances, np.iinfo(np.uint32).max)\n\n    # Create a new SnipeSig instance from the summed hashes and abundances\n    summed_signature = cls.create_from_hashes_abundances(\n        hashes=summed_hashes,\n        abundances=summed_abundances,\n        ksize=ksize,\n        scale=scale,\n        name=name,\n        filename=filename,\n        enable_logging=enable_logging\n    )\n\n    return summed_signature\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.symmetric_difference_sigs","title":"<code>symmetric_difference_sigs(other)</code>","text":"<p>Compute the symmetric difference of the current signature with another signature.</p> <p>This method retains hashes that are unique to each signature, with their respective abundances.</p> <p>Mathematical Explanation:</p> <p>Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\), and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the symmetric difference signature \\( C \\) has:</p> <ul> <li> <p>Hash set: $$ H_C = (H_A \\setminus H_B) \\cup (H_B \\setminus H_A) $$</p> </li> <li> <p>Abundance function: $$ a_C(h) = \\begin{cases} a_A(h), &amp; \\text{for } h \\in H_A \\setminus H_B \\ a_B(h), &amp; \\text{for } h \\in H_B \\setminus H_A \\ \\end{cases} $$</p> </li> </ul> <p>Parameters:     - <code>other (SnipeSig)</code>: Another <code>SnipeSig</code> instance to compute the symmetric difference with.</p> <p>Returns:     - <code>SnipeSig</code>: A new <code>SnipeSig</code> instance representing the symmetric difference of the two signatures.</p> <p>Raises:     - <code>ValueError</code>: If <code>ksize</code> or <code>scale</code> do not match between signatures.     - <code>RuntimeError</code>: If zero hashes remain after symmetric difference.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def symmetric_difference_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Compute the symmetric difference of the current signature with another signature.\n\n    This method retains hashes that are unique to each signature, with their respective abundances.\n\n    **Mathematical Explanation**:\n\n    Let \\( A \\) and \\( B \\) be two signatures with sets of hashes \\( H_A \\) and \\( H_B \\),\n    and abundance functions \\( a_A(h) \\) and \\( a_B(h) \\), the symmetric difference signature \\( C \\) has:\n\n    - Hash set:\n    $$\n    H_C = (H_A \\setminus H_B) \\cup (H_B \\setminus H_A)\n    $$\n\n    - Abundance function:\n    $$\n    a_C(h) =\n    \\begin{cases}\n    a_A(h), &amp; \\text{for } h \\in H_A \\setminus H_B \\\\\n    a_B(h), &amp; \\text{for } h \\in H_B \\setminus H_A \\\\\n    \\end{cases}\n    $$\n\n    **Parameters**:\n        - `other (SnipeSig)`: Another `SnipeSig` instance to compute the symmetric difference with.\n\n    **Returns**:\n        - `SnipeSig`: A new `SnipeSig` instance representing the symmetric difference of the two signatures.\n\n    **Raises**:\n        - `ValueError`: If `ksize` or `scale` do not match between signatures.\n        - `RuntimeError`: If zero hashes remain after symmetric difference.\n    \"\"\"\n    self.__verify_snipe_signature(other)\n    self.__verify_matching_ksize_scale(other)\n\n    self.logger.debug(\"Computing symmetric difference of signatures.\")\n\n    # Hashes unique to self and other\n    unique_self_hashes = np.setdiff1d(self._hashes, other._hashes, assume_unique=True)\n    unique_other_hashes = np.setdiff1d(other._hashes, self._hashes, assume_unique=True)\n\n    # Abundances for unique hashes\n    mask_self = np.isin(self._hashes, unique_self_hashes, assume_unique=True)\n    unique_self_abundances = self._abundances[mask_self]\n\n    mask_other = np.isin(other._hashes, unique_other_hashes, assume_unique=True)\n    unique_other_abundances = other._abundances[mask_other]\n\n    # Handle the case where 'other' does not track abundance\n    if not other.track_abundance:\n        self.logger.debug(\"Other signature does not track abundance. Setting abundances to 1.\")\n        unique_other_abundances = np.ones_like(unique_other_abundances, dtype=np.uint32)\n\n    # Combine hashes and abundances\n    combined_hashes = np.concatenate((unique_self_hashes, unique_other_hashes))\n    combined_abundances = np.concatenate((unique_self_abundances, unique_other_abundances))\n\n    if combined_hashes.size == 0:\n        _e_msg = \"Symmetric difference operation resulted in zero hashes, which is not allowed.\"\n        self.logger.error(_e_msg)\n        raise RuntimeError(_e_msg)\n\n    # Sort combined hashes and abundances\n    sorted_indices = np.argsort(combined_hashes)\n    combined_hashes = combined_hashes[sorted_indices]\n    combined_abundances = combined_abundances[sorted_indices]\n\n    self.logger.debug(\"Symmetric difference operation completed. Total unique hashes: %d\", len(combined_hashes))\n\n    # Create a new SnipeSig instance\n    return self.create_from_hashes_abundances(\n        hashes=combined_hashes,\n        abundances=combined_abundances,\n        ksize=self._ksize,\n        scale=self._scale,\n        name=f\"{self._name}_symmetric_difference_{other._name}\",\n        filename=None,\n        enable_logging=self.logger.level &lt;= logging.DEBUG\n    )\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.trim_below_median","title":"<code>trim_below_median()</code>","text":"<p>Trim hashes with abundances below the median abundance.</p> <p>This method removes all hashes whose abundances are less than the median abundance of the signature.</p> <p>Mathematical Explanation:</p> <p>Let \\( m \\) be the median of \\( \\{ a(h) \\mid h \\in H \\} \\). The updated hash set \\( H' \\) is:</p> \\[ H' = \\\\{ h \\in H \\mid a(h) \\geq m \\\\} \\] <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def trim_below_median(self):\n    r\"\"\"\n    Trim hashes with abundances below the median abundance.\n\n    This method removes all hashes whose abundances are less than the median abundance of the signature.\n\n    **Mathematical Explanation**:\n\n    Let \\\\( m \\\\) be the median of \\\\( \\\\{ a(h) \\mid h \\in H \\\\} \\\\).\n    The updated hash set \\\\( H' \\\\) is:\n\n    $$\n    H' = \\\\{ h \\in H \\mid a(h) \\geq m \\\\}\n    $$\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance.\n    \"\"\"\n\n    self._validate_abundance_operation(None, \"trim below median\")\n\n    if len(self._abundances) == 0:\n        self.logger.debug(\"No hashes to trim based on median abundance.\")\n        return\n\n    median = np.median(self._abundances)\n    mask = self._abundances &gt;= median\n    self._apply_mask(mask)\n    self.logger.debug(\"Trimmed hashes with abundance below median (%f).\", median)\n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.trim_singletons","title":"<code>trim_singletons()</code>","text":"<p>Remove hashes with abundance equal to 1.</p> <p>This method removes all hashes that are singletons (abundance equals 1).</p> <p>Mathematical Explanation:</p> <p>The updated hash set \\( H' \\) is: $$ H' = { h \\in H \\mid a(h) \\neq 1 } $$</p> <p>Raises:     - <code>ValueError</code>: If the signature does not track abundance.</p> Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def trim_singletons(self):\n    r\"\"\"\n    Remove hashes with abundance equal to 1.\n\n    This method removes all hashes that are singletons (abundance equals 1).\n\n    **Mathematical Explanation**:\n\n    The updated hash set \\( H' \\) is:\n    $$\n    H' = \\{ h \\in H \\mid a(h) \\neq 1 \\}\n    $$\n\n    **Raises**:\n        - `ValueError`: If the signature does not track abundance.\n    \"\"\"\n    self._validate_abundance_operation(None, \"trim singletons\")\n\n    mask = self._abundances != 1\n    self.logger.debug(\"Trimming %d hashes with abundance equal to 1.\", np.sum(~mask))\n    self._apply_mask(mask)\n    self.logger.debug(\"Size after trimming singletons: %d\", len(self._hashes)) \n</code></pre>"},{"location":"SnipeSig/#snipe.api.snipe_sig.SnipeSig.union_sigs","title":"<code>union_sigs(other)</code>","text":"<p>Combine this signature with another by summing abundances where hashes overlap.</p> <p>Given two signatures \\( A \\) and \\( B \\) with hash sets \\( H_A \\) and \\( H_B \\), and their corresponding abundance functions \\( a_A \\) and \\( a_B \\), the union signature \\( C \\) is defined as follows:</p> <ul> <li>Hash Set: </li> </ul> \\[ H_C = H_A \\cup H_B \\] <ul> <li>Abundance Function:</li> </ul> \\[ a_C(h) = \\begin{cases}      a_A(h) + a_B(h), &amp; \\text{if } h \\in H_A \\cap H_B \\\\     a_A(h), &amp; \\text{if } h \\in H_A \\setminus H_B \\\\     a_B(h), &amp; \\text{if } h \\in H_B \\setminus H_A \\end{cases} \\] Source code in <code>src/snipe/api/snipe_sig.py</code> <pre><code>def union_sigs(self, other: 'SnipeSig') -&gt; 'SnipeSig':\n    r\"\"\"\n    Combine this signature with another by summing abundances where hashes overlap.\n\n    Given two signatures \\( A \\) and \\( B \\) with hash sets \\( H_A \\) and \\( H_B \\),\n    and their corresponding abundance functions \\( a_A \\) and \\( a_B \\), the union\n    signature \\( C \\) is defined as follows:\n\n    - **Hash Set**: \n\n    $$\n    H_C = H_A \\cup H_B\n    $$\n\n    - **Abundance Function**:\n\n    $$\n    a_C(h) =\n    \\begin{cases} \n        a_A(h) + a_B(h), &amp; \\text{if } h \\in H_A \\cap H_B \\\\\n        a_A(h), &amp; \\text{if } h \\in H_A \\setminus H_B \\\\\n        a_B(h), &amp; \\text{if } h \\in H_B \\setminus H_A\n    \\end{cases}\n    $$\n    \"\"\"\n    self.__verify_snipe_signature(other)\n    self.__verify_matching_ksize_scale(other)\n\n    self.logger.debug(\"Unioning signatures (including all unique hashes).\")\n\n    # Access internal arrays directly\n    self_hashes = self._hashes\n    self_abundances = self._abundances\n    other_hashes = other._hashes\n    other_abundances = other._abundances\n\n    # Handle the case where 'other' does not track abundance\n    if not other.track_abundance:\n        self.logger.debug(\"Other signature does not track abundance. Setting abundances to 1.\")\n        other_abundances = np.ones_like(other_abundances, dtype=np.uint32)\n\n    # Combine hashes and abundances\n    combined_hashes = np.concatenate((self_hashes, other_hashes))\n    combined_abundances = np.concatenate((self_abundances, other_abundances))\n\n    # Use numpy's unique function with return_inverse to sum abundances efficiently\n    unique_hashes, inverse_indices = np.unique(combined_hashes, return_inverse=True)\n    summed_abundances = np.zeros_like(unique_hashes, dtype=np.uint32)\n\n    # Sum abundances for duplicate hashes\n    np.add.at(summed_abundances, inverse_indices, combined_abundances)\n\n    # Handle potential overflow\n    summed_abundances = np.minimum(summed_abundances, np.iinfo(np.uint32).max)\n\n    self.logger.debug(\"Union operation completed. Total hashes: %d\", len(unique_hashes))\n\n    # Create a new SnipeSig instance\n    return self.create_from_hashes_abundances(\n        hashes=unique_hashes,\n        abundances=summed_abundances,\n        ksize=self._ksize,\n        scale=self._scale,\n        name=f\"{self._name}_union_{other._name}\",\n        filename=None,\n        enable_logging=self.logger.level &lt;= logging.DEBUG\n    )\n</code></pre>"},{"location":"cli/","title":"Command Line Interface (CLI) Documentation","text":"<p>Below is the auto-generated CLI documentation from <code>click</code>.</p> <pre><code>snipe --help\n</code></pre>"}]}
\ No newline at end of file
diff --git a/sitemap.xml b/sitemap.xml
index 704d94b..e9ca2ed 100644
--- a/sitemap.xml
+++ b/sitemap.xml
@@ -2,18 +2,22 @@
 <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
     <url>
          <loc>https://snipe-bio.github.io/snipe/</loc>
-         <lastmod>2024-10-13</lastmod>
+         <lastmod>2024-10-15</lastmod>
     </url>
     <url>
          <loc>https://snipe-bio.github.io/snipe/ReferenceQC/</loc>
-         <lastmod>2024-10-13</lastmod>
+         <lastmod>2024-10-15</lastmod>
+    </url>
+    <url>
+         <loc>https://snipe-bio.github.io/snipe/Sketch/</loc>
+         <lastmod>2024-10-15</lastmod>
     </url>
     <url>
          <loc>https://snipe-bio.github.io/snipe/SnipeSig/</loc>
-         <lastmod>2024-10-13</lastmod>
+         <lastmod>2024-10-15</lastmod>
     </url>
     <url>
          <loc>https://snipe-bio.github.io/snipe/cli/</loc>
-         <lastmod>2024-10-13</lastmod>
+         <lastmod>2024-10-15</lastmod>
     </url>
 </urlset>
\ No newline at end of file
diff --git a/sitemap.xml.gz b/sitemap.xml.gz
index 0bca328..bb95b8f 100644
Binary files a/sitemap.xml.gz and b/sitemap.xml.gz differ